Genome-Transcriptome-Phenome Structured Association 02-715 - - PowerPoint PPT Presentation
Genome-Transcriptome-Phenome Structured Association 02-715 - - PowerPoint PPT Presentation
Genome-Transcriptome-Phenome Structured Association 02-715 Advanced Topics in Computa8onal Genomics Regression with Regularization Group lasso (Yuan and Lin, 2006) L1/L2 2 ||
Regression with Regularization
- Group ¡lasso ¡(Yuan ¡and ¡Lin, ¡2006) ¡
L1/L2
|| βj ||L1/ L2= β jk
2 k
∑
Regression with Regularization (Group Lasso Penalty)
Lasso ¡ penalty ¡ Group ¡ lasso ¡ penalty ¡ L2 ¡penalty ¡
Lasso (Tibshirani, 1996)
Inputs ¡ Outputs ¡
Regression ¡Coefficients ¡
L1/L2-regularized Multi-task Regression
(Obozinski et al., 2008) Regression ¡Coefficients ¡
Inputs ¡ Outputs ¡
Tree-Guided Group Lasso
h2 h1
Inputs ¡ Outputs ¡
Regression ¡Coefficients ¡
Tree-‑guided ¡group ¡lasso ¡penalty ¡ Key ¡idea: ¡use ¡overlapping ¡ ¡ ¡groups ¡in ¡ group ¡lasso ¡
Tree-Guided Group Lasso
- ¡Low ¡height ¡
- ¡Tight ¡correla8on ¡
- ¡Joint ¡selec8on ¡
- ¡Large ¡height ¡
- ¡Weak ¡correla8on ¡
- ¡Separate ¡selec8on ¡
h h
- ¡In ¡a ¡simple ¡case ¡of ¡two ¡outputs ¡
Inputs ¡ Inputs ¡
L1 ¡penalty ¡
- ¡Lasso ¡penalty ¡
- ¡Separate ¡selec8on ¡
L2 ¡penalty ¡ ¡
- ¡Group ¡lasso ¡
- ¡Joint ¡selec8on ¡
h Elas2c ¡net ¡
Select ¡the ¡child ¡ nodes ¡jointly ¡or ¡ separately? ¡
Tree-Guided Group Lasso
- ¡In ¡a ¡simple ¡case ¡of ¡two ¡outputs ¡
Tree-‑guided ¡group ¡lasso ¡
Inputs ¡
h2 h1
Select ¡the ¡child ¡ nodes ¡jointly ¡or ¡ separately? ¡
- ¡For ¡a ¡general ¡tree ¡
Tree-Guided Group Lasso
Tree-‑guided ¡group ¡lasso ¡ ¡ ¡ ¡ ¡Joint ¡
selec2on ¡ Separate ¡ selec2on ¡
Note ¡that ¡the ¡ groups ¡overlap! ¡
Overlapping Groups in Tree-guided Group Lasso
Balanced ¡ penaliza8on ¡
- ‑
Overlapping ¡Groups ¡
- ¡Previously ¡ ¡
- ¡Arbitrarily ¡overlapping ¡groups ¡(JenaYon, ¡Audibert, ¡Bach, ¡2009) ¡
- ¡Overlapping ¡groups ¡over ¡tree-‑structured ¡inputs ¡(Zhao, ¡Roach, ¡Yu, ¡2008) ¡
Unbalanced ¡ penaliza8on ¡
Unit Contour Surface for Various Penalty Functions
Lasso ¡ L1/L2 ¡ Tree ¡ g1=0.5, ¡g2=0.5 ¡ Tree ¡ g1=0.2, ¡g2=0.7 ¡ Tree ¡ g1=0.7, ¡g2=0.2 ¡
Illustration with Simulated Data
True ¡regression ¡ coefficients ¡ Lasso ¡ ¡ Tree-‑guided ¡ group ¡lasso ¡ ¡
No ¡ associa8on ¡ High ¡ associa8on ¡
L1/L2-‑regularized ¡ mul8-‑task ¡regression ¡ ¡
Inputs ¡(SNPs) ¡ Outputs ¡(Genes) ¡
Analysis of Yeast Data
Lasso ¡ ¡ Tree-‑guided ¡ group ¡lasso ¡ ¡
Inputs ¡(SNPs) ¡ Outputs ¡(Genes) ¡
No ¡ associa8on ¡ High ¡ associa8on ¡
Hierarchical ¡ clustering ¡tree ¡for ¡ genes ¡(outputs) ¡ L1/L2-‑regularized ¡ mul8-‑task ¡regression ¡ ¡
Dynamic Trait (d-trait) Association
A ¡T ¡C ¡G ¡A ¡T ¡T ¡C ¡C ¡A ¡T ¡A ¡
t ¡= ¡1 ¡t ¡= ¡2 ¡ t ¡= ¡3 ¡ t ¡= ¡T ¡ Genotypes ¡ Dynamic ¡Trait ¡ ¡ (e.g., ¡drug ¡response) ¡ Associa8on ¡Strengths ¡
A ¡T ¡C ¡G ¡A ¡T ¡T ¡C ¡C ¡A ¡T ¡A ¡
Genotypes ¡ Sta8onary ¡Trait ¡ ¡ ¡ ¡ Associa8on ¡ Strengths ¡
Sta8onary ¡Trait ¡ Associa8on ¡
One-‑8me ¡gene8c ¡effect ¡ Gene8c ¡effects ¡ac8ve ¡over ¡8me ¡ with ¡possibly ¡varying ¡effect ¡size ¡
- ver ¡8me ¡
Dynamic ¡Trait ¡ Associa8on ¡
15
Temporally-Smoothed Lasso
- Step ¡1: ¡Autoregressive ¡Model ¡
– Captures ¡the ¡shape ¡of ¡the ¡temporal ¡trend ¡in ¡the ¡d-‑trait ¡data ¡ – Es8mates ¡the ¡model ¡parameters ¡based ¡on ¡the ¡d-‑trait ¡data ¡only ¡
- Step ¡2: ¡Temporally-‑Smoothed ¡Lasso ¡
– Penalized ¡regression ¡framework ¡ – Incorporates ¡the ¡es8mated ¡d-‑trait ¡shape ¡parameters ¡from ¡Step ¡1 ¡ – Detects ¡8me-‑varying ¡gene8c ¡effects ¡on ¡the ¡d-‑trait ¡
Step 1: Autoregressive Model
17 ¡
Autoregressive ¡Model ¡: ¡ Es2ma2ng ¡Model ¡Parameters: ¡ Es2mates ¡of ¡the ¡Model ¡Parameters: ¡
Step 2: Temporally-Smoothed Lasso
1 8 Lasso ¡Penalty ¡ Temporally-‑smoothed ¡ Lasso ¡Penalty ¡
Autoregressive ¡ parameters ¡from ¡ Step ¡1 ¡
Simulation Study – Linear Dynamic
19 ¡
Trait ¡data ¡for ¡ all ¡individuals ¡ Trait ¡data ¡for ¡ ¡ individuals ¡with ¡ ¡ no ¡associa8on ¡SNPs ¡ Trait ¡data ¡for ¡ ¡ individuals ¡with ¡ ¡ 1-‑2 ¡associa8on ¡SNPs ¡ Trait ¡data ¡for ¡ ¡ individuals ¡with ¡ ¡ >3 ¡associa8on ¡SNPs ¡ True ¡associa8on ¡ strength ¡ Es8mated ¡ ¡ associa8on ¡strength ¡ (single ¡SNP ¡analysis) ¡ Es8mated ¡ ¡ associa8on ¡strength ¡ (lasso) ¡ Es8mated ¡ ¡ associa8on ¡strength ¡ (temporally-‑smoothed ¡ lasso) ¡
Simulation Study – Cyclic Dynamic
20 ¡
Trait ¡data ¡for ¡ all ¡individuals ¡ Trait ¡data ¡for ¡ ¡ individuals ¡with ¡ ¡ no ¡associa8on ¡SNPs ¡ Trait ¡data ¡for ¡ ¡ individuals ¡with ¡ ¡ 1-‑2 ¡associa8on ¡SNPs ¡ Trait ¡data ¡for ¡ ¡ individuals ¡with ¡ ¡ >3 ¡associa8on ¡SNPs ¡ True ¡associa8on ¡ strength ¡ Es8mated ¡ ¡ associa8on ¡strength ¡ (single ¡SNP ¡analysis) ¡ Es8mated ¡ ¡ associa8on ¡strength ¡ (lasso) ¡ Es8mated ¡ ¡ associa8on ¡strength ¡ (temporally-‑smoothed ¡ lasso) ¡
Genome-Transcriptome-Phenome Structured Association
- Various ¡regulariza8on ¡func8ons ¡can ¡be ¡used ¡within ¡the ¡sparse ¡
regression ¡framework ¡to ¡enforce ¡a ¡sparsity ¡paYern ¡that ¡ reflects ¡prior ¡knowledge ¡
– Tree-‑guided ¡group ¡lasso ¡
- Hierarchical ¡clustering ¡tree ¡– ¡prior ¡knowledge ¡on ¡gene ¡clusters ¡
– Temporally ¡smoothed ¡lasso ¡
- Dynamic ¡traits ¡– ¡prior ¡knowledge ¡on ¡temporal ¡correla8on ¡