Genome-Transcriptome-Phenome Structured Association 02-715 - - PowerPoint PPT Presentation

genome transcriptome phenome structured association
SMART_READER_LITE
LIVE PREVIEW

Genome-Transcriptome-Phenome Structured Association 02-715 - - PowerPoint PPT Presentation

Genome-Transcriptome-Phenome Structured Association 02-715 Advanced Topics in Computa8onal Genomics Regression with Regularization Group lasso (Yuan and Lin, 2006) L1/L2 2 ||


slide-1
SLIDE 1

Genome-Transcriptome-Phenome Structured Association

02-­‑715 ¡Advanced ¡Topics ¡in ¡Computa8onal ¡ Genomics ¡

slide-2
SLIDE 2

Regression with Regularization

  • Group ¡lasso ¡(Yuan ¡and ¡Lin, ¡2006) ¡

L1/L2

|| βj ||L1/ L2= β jk

2 k

slide-3
SLIDE 3

Regression with Regularization (Group Lasso Penalty)

Lasso ¡ penalty ¡ Group ¡ lasso ¡ penalty ¡ L2 ¡penalty ¡

slide-4
SLIDE 4

Lasso (Tibshirani, 1996)

Inputs ¡ Outputs ¡

Regression ¡Coefficients ¡

slide-5
SLIDE 5

L1/L2-regularized Multi-task Regression

(Obozinski et al., 2008) Regression ¡Coefficients ¡

Inputs ¡ Outputs ¡

slide-6
SLIDE 6

Tree-Guided Group Lasso

h2 h1

Inputs ¡ Outputs ¡

Regression ¡Coefficients ¡

Tree-­‑guided ¡group ¡lasso ¡penalty ¡ Key ¡idea: ¡use ¡overlapping ¡ ¡ ¡groups ¡in ¡ group ¡lasso ¡

slide-7
SLIDE 7

Tree-Guided Group Lasso

  • ¡Low ¡height ¡
  • ¡Tight ¡correla8on ¡
  • ¡Joint ¡selec8on ¡
  • ¡Large ¡height ¡
  • ¡Weak ¡correla8on ¡
  • ¡Separate ¡selec8on ¡

h h

  • ¡In ¡a ¡simple ¡case ¡of ¡two ¡outputs ¡

Inputs ¡ Inputs ¡

slide-8
SLIDE 8

L1 ¡penalty ¡

  • ¡Lasso ¡penalty ¡
  • ¡Separate ¡selec8on ¡

L2 ¡penalty ¡ ¡

  • ¡Group ¡lasso ¡
  • ¡Joint ¡selec8on ¡

h Elas2c ¡net ¡

Select ¡the ¡child ¡ nodes ¡jointly ¡or ¡ separately? ¡

Tree-Guided Group Lasso

  • ¡In ¡a ¡simple ¡case ¡of ¡two ¡outputs ¡

Tree-­‑guided ¡group ¡lasso ¡

Inputs ¡

slide-9
SLIDE 9

h2 h1

Select ¡the ¡child ¡ nodes ¡jointly ¡or ¡ separately? ¡

  • ¡For ¡a ¡general ¡tree ¡

Tree-Guided Group Lasso

Tree-­‑guided ¡group ¡lasso ¡ ¡ ¡ ¡ ¡Joint ¡

selec2on ¡ Separate ¡ selec2on ¡

Note ¡that ¡the ¡ groups ¡overlap! ¡

slide-10
SLIDE 10

Overlapping Groups in Tree-guided Group Lasso

Balanced ¡ penaliza8on ¡

  • ­‑
slide-11
SLIDE 11

Overlapping ¡Groups ¡

  • ¡Previously ¡ ¡
  • ¡Arbitrarily ¡overlapping ¡groups ¡(JenaYon, ¡Audibert, ¡Bach, ¡2009) ¡
  • ¡Overlapping ¡groups ¡over ¡tree-­‑structured ¡inputs ¡(Zhao, ¡Roach, ¡Yu, ¡2008) ¡

Unbalanced ¡ penaliza8on ¡

slide-12
SLIDE 12

Unit Contour Surface for Various Penalty Functions

Lasso ¡ L1/L2 ¡ Tree ¡ g1=0.5, ¡g2=0.5 ¡ Tree ¡ g1=0.2, ¡g2=0.7 ¡ Tree ¡ g1=0.7, ¡g2=0.2 ¡

slide-13
SLIDE 13

Illustration with Simulated Data

True ¡regression ¡ coefficients ¡ Lasso ¡ ¡ Tree-­‑guided ¡ group ¡lasso ¡ ¡

No ¡ associa8on ¡ High ¡ associa8on ¡

L1/L2-­‑regularized ¡ mul8-­‑task ¡regression ¡ ¡

Inputs ¡(SNPs) ¡ Outputs ¡(Genes) ¡

slide-14
SLIDE 14

Analysis of Yeast Data

Lasso ¡ ¡ Tree-­‑guided ¡ group ¡lasso ¡ ¡

Inputs ¡(SNPs) ¡ Outputs ¡(Genes) ¡

No ¡ associa8on ¡ High ¡ associa8on ¡

Hierarchical ¡ clustering ¡tree ¡for ¡ genes ¡(outputs) ¡ L1/L2-­‑regularized ¡ mul8-­‑task ¡regression ¡ ¡

slide-15
SLIDE 15

Dynamic Trait (d-trait) Association

A ¡T ¡C ¡G ¡A ¡T ¡T ¡C ¡C ¡A ¡T ¡A ¡

t ¡= ¡1 ¡t ¡= ¡2 ¡ t ¡= ¡3 ¡ t ¡= ¡T ¡ Genotypes ¡ Dynamic ¡Trait ¡ ¡ (e.g., ¡drug ¡response) ¡ Associa8on ¡Strengths ¡

A ¡T ¡C ¡G ¡A ¡T ¡T ¡C ¡C ¡A ¡T ¡A ¡

Genotypes ¡ Sta8onary ¡Trait ¡ ¡ ¡ ¡ Associa8on ¡ Strengths ¡

Sta8onary ¡Trait ¡ Associa8on ¡

One-­‑8me ¡gene8c ¡effect ¡ Gene8c ¡effects ¡ac8ve ¡over ¡8me ¡ with ¡possibly ¡varying ¡effect ¡size ¡

  • ver ¡8me ¡

Dynamic ¡Trait ¡ Associa8on ¡

15

slide-16
SLIDE 16

Temporally-Smoothed Lasso

  • Step ¡1: ¡Autoregressive ¡Model ¡

– Captures ¡the ¡shape ¡of ¡the ¡temporal ¡trend ¡in ¡the ¡d-­‑trait ¡data ¡ – Es8mates ¡the ¡model ¡parameters ¡based ¡on ¡the ¡d-­‑trait ¡data ¡only ¡

  • Step ¡2: ¡Temporally-­‑Smoothed ¡Lasso ¡

– Penalized ¡regression ¡framework ¡ – Incorporates ¡the ¡es8mated ¡d-­‑trait ¡shape ¡parameters ¡from ¡Step ¡1 ¡ – Detects ¡8me-­‑varying ¡gene8c ¡effects ¡on ¡the ¡d-­‑trait ¡

slide-17
SLIDE 17

Step 1: Autoregressive Model

17 ¡

Autoregressive ¡Model ¡: ¡ Es2ma2ng ¡Model ¡Parameters: ¡ Es2mates ¡of ¡the ¡Model ¡Parameters: ¡

slide-18
SLIDE 18

Step 2: Temporally-Smoothed Lasso

1 8 Lasso ¡Penalty ¡ Temporally-­‑smoothed ¡ Lasso ¡Penalty ¡

Autoregressive ¡ parameters ¡from ¡ Step ¡1 ¡

slide-19
SLIDE 19

Simulation Study – Linear Dynamic

19 ¡

Trait ¡data ¡for ¡ all ¡individuals ¡ Trait ¡data ¡for ¡ ¡ individuals ¡with ¡ ¡ no ¡associa8on ¡SNPs ¡ Trait ¡data ¡for ¡ ¡ individuals ¡with ¡ ¡ 1-­‑2 ¡associa8on ¡SNPs ¡ Trait ¡data ¡for ¡ ¡ individuals ¡with ¡ ¡ >3 ¡associa8on ¡SNPs ¡ True ¡associa8on ¡ strength ¡ Es8mated ¡ ¡ associa8on ¡strength ¡ (single ¡SNP ¡analysis) ¡ Es8mated ¡ ¡ associa8on ¡strength ¡ (lasso) ¡ Es8mated ¡ ¡ associa8on ¡strength ¡ (temporally-­‑smoothed ¡ lasso) ¡

slide-20
SLIDE 20

Simulation Study – Cyclic Dynamic

20 ¡

Trait ¡data ¡for ¡ all ¡individuals ¡ Trait ¡data ¡for ¡ ¡ individuals ¡with ¡ ¡ no ¡associa8on ¡SNPs ¡ Trait ¡data ¡for ¡ ¡ individuals ¡with ¡ ¡ 1-­‑2 ¡associa8on ¡SNPs ¡ Trait ¡data ¡for ¡ ¡ individuals ¡with ¡ ¡ >3 ¡associa8on ¡SNPs ¡ True ¡associa8on ¡ strength ¡ Es8mated ¡ ¡ associa8on ¡strength ¡ (single ¡SNP ¡analysis) ¡ Es8mated ¡ ¡ associa8on ¡strength ¡ (lasso) ¡ Es8mated ¡ ¡ associa8on ¡strength ¡ (temporally-­‑smoothed ¡ lasso) ¡

slide-21
SLIDE 21

Genome-Transcriptome-Phenome Structured Association

  • Various ¡regulariza8on ¡func8ons ¡can ¡be ¡used ¡within ¡the ¡sparse ¡

regression ¡framework ¡to ¡enforce ¡a ¡sparsity ¡paYern ¡that ¡ reflects ¡prior ¡knowledge ¡

– Tree-­‑guided ¡group ¡lasso ¡

  • Hierarchical ¡clustering ¡tree ¡– ¡prior ¡knowledge ¡on ¡gene ¡clusters ¡

– Temporally ¡smoothed ¡lasso ¡

  • Dynamic ¡traits ¡– ¡prior ¡knowledge ¡on ¡temporal ¡correla8on ¡