Missing Heritablility 02-223 Personalized Medicine: - - PowerPoint PPT Presentation

missing heritablility
SMART_READER_LITE
LIVE PREVIEW

Missing Heritablility 02-223 Personalized Medicine: - - PowerPoint PPT Presentation

Missing Heritablility 02-223 Personalized Medicine: Understanding Your Own Genome Fall 2014 Heritability Nature vs Nurture Whether observed variaEon in


slide-1
SLIDE 1

Missing ¡Heritablility ¡

02-­‑223 ¡Personalized ¡Medicine: ¡ Understanding ¡Your ¡Own ¡Genome ¡ Fall ¡2014 ¡

slide-2
SLIDE 2

Heritability ¡

  • Nature ¡vs ¡Nurture ¡

– Whether ¡observed ¡variaEon ¡in ¡a ¡parEcular ¡trait ¡is ¡due ¡to ¡ environmental ¡or ¡to ¡biological ¡factors ¡ – The ¡resemblance ¡between ¡parents ¡and ¡their ¡offspring ¡

slide-3
SLIDE 3

Heritability ¡

  • Heritability ¡can ¡be ¡esEmated ¡from ¡the ¡regression ¡of ¡offspring ¡

phenotypic ¡values ¡on ¡the ¡average ¡of ¡parental ¡phenotypic ¡ values ¡without ¡using ¡genome ¡informaEon ¡

slide-4
SLIDE 4
slide-5
SLIDE 5

Missing ¡Heritability ¡

  • Height ¡is ¡80-­‑90% ¡heritable ¡
  • Using ¡univariate ¡regression ¡analysis ¡

– In ¡GWAS ¡over ¡30,000 ¡people, ¡more ¡than ¡40 ¡loci ¡were ¡found ¡to ¡be ¡ associated ¡with ¡the ¡height ¡ – Only ¡5% ¡of ¡the ¡height’s ¡heritability ¡is ¡explained ¡by ¡the ¡geneEc ¡variaEon ¡at ¡ those ¡40 ¡loci ¡

  • Analyzing ¡all ¡SNPs ¡jointly ¡for ¡their ¡influence ¡on ¡height ¡(mulEvariate ¡

regression ¡analysis) ¡

– 45% ¡of ¡the ¡height’s ¡heritability ¡is ¡explained ¡by ¡SNPs ¡

  • How ¡can ¡we ¡explain ¡the ¡missing ¡heritability? ¡
slide-6
SLIDE 6

Missing ¡Heritability ¡

  • Studies ¡looking ¡at ¡similariEes ¡between ¡idenEcal ¡and ¡fraternal ¡

twins ¡esEmate ¡heritability ¡at ¡more ¡than ¡90% ¡for ¡auEsm ¡and ¡ more ¡than ¡80% ¡for ¡schizophrenia ¡

  • O\en, ¡the ¡geneEc ¡loci ¡found ¡by ¡GWAS ¡explain ¡a ¡small ¡fracEon ¡ ¡
  • f ¡the ¡heritability ¡
slide-7
SLIDE 7

Explaining ¡Missing ¡Heritability ¡

  • Undetected ¡epistasis ¡– ¡InteracEons ¡between ¡mulEple ¡geneEc ¡

loci ¡

  • Pleiotropy ¡– ¡mulEple ¡phenotypes ¡affected ¡by ¡the ¡same ¡

geneEc ¡loci ¡

  • From ¡common ¡variants ¡to ¡rare ¡variants ¡
slide-8
SLIDE 8

Epistasis ¡

  • Epistasis: ¡The ¡effect ¡of ¡one ¡locus ¡depends ¡on ¡the ¡genotype ¡of ¡

another ¡locus ¡

– EpistaEc ¡effects ¡of ¡geneEc ¡loci ¡can ¡be ¡detected ¡only ¡if ¡we ¡consider ¡the ¡ mulEple ¡loci ¡jointly ¡

  • In ¡contrast, ¡marginal ¡effects ¡of ¡a ¡locus ¡refers ¡to ¡the ¡geneEc ¡

effect ¡of ¡the ¡locus ¡that ¡is ¡independent ¡of ¡other ¡loci ¡

– Most ¡studies ¡assume ¡the ¡phenotype ¡can ¡be ¡predicted ¡as ¡a ¡sum ¡of ¡ single-­‑locus ¡effects ¡

slide-9
SLIDE 9

Epistasis ¡for ¡Mendelian ¡Traits ¡

Carlborg ¡& ¡Haley, ¡Nature ¡Reviews ¡GeneEcs ¡2004 ¡

slide-10
SLIDE 10

When ¡There ¡is ¡No ¡Epistasis ¡

  • Two ¡addiEve ¡

(non-­‑epistaEc) ¡ loci ¡

  • The ¡three ¡lines ¡

run ¡in ¡parallel ¡

slide-11
SLIDE 11

Epistasis ¡Example ¡

  • Dominant ¡epistasis ¡
  • One ¡locus ¡in ¡a ¡

dominant ¡way ¡ suppresses ¡the ¡allelic ¡ effects ¡of ¡a ¡second ¡ locus ¡

slide-12
SLIDE 12

Challenges ¡for ¡Detec=ng ¡Epista=c ¡Effects ¡

  • Many ¡studies ¡ignore ¡epistasis ¡among ¡mulEple ¡geneEc ¡loci ¡

mainly ¡due ¡to ¡the ¡high ¡computaEonal ¡cost ¡for ¡detecEng ¡it, ¡but ¡ epistasis ¡is ¡believed ¡to ¡be ¡prevalent ¡and ¡thus ¡important. ¡

  • A ¡typical ¡study ¡for ¡idenEfying ¡geneEc ¡effects ¡on ¡phenotypes ¡

involves ¡about ¡a ¡million ¡SNPs ¡

– The ¡number ¡of ¡candidate ¡epistaEc ¡interacEons ¡between ¡two ¡SNPs? ¡ – MulEple ¡tesEng ¡problems ¡

  • ApproximaEon: ¡Screen ¡for ¡SNPs ¡with ¡marginal ¡effects ¡and ¡

consider ¡interacEons ¡only ¡among ¡those ¡SNPs ¡ ¡ ¡

slide-13
SLIDE 13

Detec=ng ¡Epista=c ¡Effects ¡

  • MulEvariate ¡regression ¡for ¡detecEng ¡marginal ¡effects ¡
  • MulEvariate ¡regression ¡for ¡detecEng ¡epistaEc ¡effects ¡

y = x j

j =1 J

β j + β0 +ε y = x j

j =1 J

β j + x kx m

(k,m)∈Sm

βkm + β0 +ε

slide-14
SLIDE 14

Explaining ¡Missing ¡Heritability ¡

  • Undetected ¡epistasis ¡– ¡InteracEons ¡between ¡mulEple ¡geneEc ¡

loci ¡

  • Pleiotropy ¡– ¡mulEple ¡phenotypes ¡affected ¡by ¡the ¡same ¡

geneEc ¡loci ¡

  • From ¡common ¡variants ¡to ¡rare ¡variants ¡
slide-15
SLIDE 15

Pleiotropy ¡

  • Pleiotropic ¡effects ¡

– DefiniEon: ¡A ¡geneEc ¡variaEon ¡influences ¡mulEple ¡phenotypes ¡at ¡the ¡ same ¡Eme ¡ – Instead ¡of ¡assessing ¡the ¡effect ¡of ¡genotype ¡on ¡a ¡single ¡phenotype, ¡we ¡ can ¡consider ¡mulEple ¡related ¡phenotypes ¡(e.g., ¡genes ¡in ¡the ¡same ¡ pathway) ¡to ¡detect ¡pleiotropic ¡effects ¡

  • Examples ¡of ¡pleiotropy ¡

– A ¡mutaEon ¡that ¡influences ¡your ¡cholesterol ¡level ¡can ¡also ¡influence ¡ your ¡body-­‑mass ¡index ¡and ¡blood ¡pressure ¡ – A ¡mutaEon ¡that ¡influences ¡your ¡blood ¡IgE ¡level ¡can ¡also ¡influence ¡your ¡ allergy ¡

slide-16
SLIDE 16

¡SNPs ¡influencing ¡mulEple ¡phenotypes ¡

ACGTTTTACTGTACAATT ¡ ACGTTTTACTGTACAATT ¡

¡ ¡ ¡SNPs ¡influencing ¡single ¡phenotype ¡ ¡

Detecting SNPs with Pleiotropic Effects on Phenotypes

slide-17
SLIDE 17

Asthma Study

  • 543 ¡severe ¡asthma ¡paEents ¡from ¡the ¡Severe ¡Asthma ¡Research ¡

Program ¡(SARP) ¡

  • Genotypes ¡: ¡34 ¡SNPs ¡in ¡IL4R ¡gene ¡ ¡

– 40kb ¡region ¡of ¡chromosome ¡16 ¡ – Impute ¡missing ¡genotypes ¡with ¡PHASE ¡(Li ¡and ¡Stephens, ¡2003) ¡

  • Traits ¡: ¡53 ¡asthma-­‑related ¡clinical ¡traits ¡

– Quality ¡of ¡Life: ¡emoEon, ¡environment, ¡acEvity, ¡symptom ¡ – Family ¡history: ¡number ¡of ¡siblings ¡with ¡allergy, ¡does ¡the ¡father ¡has ¡asthma? ¡ – Asthma ¡symptoms: ¡chest ¡Eghtness, ¡wheeziness ¡

slide-18
SLIDE 18

Asthma and IL4R Gene

T ¡cell ¡ In ¡asthma ¡paEents ¡

Allergen ¡ ¡ (ragweed, ¡grass, ¡etc.) ¡

Th2 ¡cell ¡ B ¡cell ¡

ImmunoglobulinE ¡(IgE) ¡anEbody ¡

InflammaEon! ¡

  • ¡Airway ¡in ¡lung ¡narrows ¡
  • ¡Difficult ¡to ¡breathe ¡
  • ¡Asthma ¡symptoms ¡

Interleukin-­‑4 ¡Receptor ¡ ¡ regulates ¡IgE ¡anEbody ¡producEon ¡

slide-19
SLIDE 19

IL4R Gene

Chr16: ¡27,325,251-­‑27,376,098 ¡

IL4R ¡

SNPs ¡in ¡intron ¡ SNPs ¡in ¡exon ¡ SNPs ¡in ¡promotor ¡region ¡ exons ¡ introns ¡

slide-20
SLIDE 20

Subnetworks ¡for ¡lung ¡ physiology ¡ Subnetwork ¡for ¡ quality ¡of ¡life ¡

GeneEc ¡AssociaEon ¡for ¡Asthma ¡ Clinical ¡Traits ¡ TCGACGTTTTACTGTACAATT ¡

slide-21
SLIDE 21

Asthma ¡Trait ¡Network ¡

Subnetwork ¡for ¡ quality ¡of ¡life ¡ Subnetwork ¡ for ¡lung ¡ physiology ¡

Phenotype ¡CorrelaEon ¡ Network ¡

Subnetwork ¡for ¡ Asthma ¡symptoms ¡

slide-22
SLIDE 22

Trait ¡Network ¡

SNPs with Pleiotropic Effects

SNPs Phenotypes Phenotypes

No ¡ associaEon ¡ High ¡ associaEon ¡

Lung ¡physiology-­‑related ¡traits ¡I ¡

  • ¡Baseline ¡FEV1 ¡predicted ¡value: ¡MPVLung ¡ ¡
  • ¡Pre ¡FEF ¡25-­‑75 ¡predicted ¡value ¡ ¡
  • ¡Average ¡nitric ¡oxide ¡value: ¡online ¡ ¡
  • ¡Body ¡Mass ¡Index ¡ ¡
  • ¡PostbronchodilaEon ¡FEV1, ¡liters: ¡Spirometry ¡ ¡
  • ¡Baseline ¡FEV1 ¡% ¡predicted: ¡Spirometry ¡ ¡
  • ¡Baseline ¡predrug ¡FEV1, ¡% ¡predicted ¡ ¡
  • ¡Baseline ¡predrug ¡FEV1, ¡% ¡predicted ¡

Q551R ¡SNP ¡

  • ¡Codes ¡for ¡amino-­‑acid ¡changes ¡in ¡the ¡

intracellular ¡signaling ¡porEon ¡of ¡the ¡receptor ¡

  • ¡Exon ¡11 ¡ ¡

Are ¡they ¡SNPs ¡that ¡ are ¡simply ¡in ¡LD? ¡

  • ­‑log(p-­‑values) ¡from ¡

univariate ¡regression ¡ analysis ¡

slide-23
SLIDE 23

Linkage Disequilibrium Structure in IL-4R gene

SNP ¡Q551R ¡ SNP ¡rs3024660 ¡ SNP ¡rs3024622 ¡

r2 ¡=0.64 ¡ ¡ r2 ¡=0.07 ¡ ¡

slide-24
SLIDE 24

IL4R Gene

Chr16: ¡27,325,251-­‑27,376,098 ¡

IL4R ¡

SNPs ¡in ¡intron ¡ SNPs ¡in ¡exon ¡ SNPs ¡in ¡promotor ¡region ¡ exons ¡ introns ¡

Q551R ¡ rs3024660 ¡ rs3024622 ¡

slide-25
SLIDE 25

Explaining ¡Missing ¡Heritability ¡

  • Undetected ¡epistasis ¡– ¡InteracEons ¡between ¡mulEple ¡geneEc ¡

loci ¡

  • Pleiotropy ¡– ¡mulEple ¡phenotypes ¡affected ¡by ¡the ¡same ¡

geneEc ¡loci ¡

  • From ¡common ¡variants ¡to ¡rare ¡variants ¡
slide-26
SLIDE 26

Common ¡Variants ¡vs. ¡Rare ¡Variants ¡

  • First-­‑generaEon ¡genome-­‑wide ¡associaEon ¡study ¡(GWAS): ¡common ¡variant ¡

common ¡disease ¡hypothesis ¡

  • Common ¡low-­‑penetrance ¡variants ¡

¡ ¡ ¡ ¡(Penetrance: ¡the ¡likelihood ¡that ¡the ¡causal ¡loci ¡will ¡in ¡fact ¡have ¡an ¡effect ¡

  • n ¡the ¡phenotype) ¡
  • Common ¡variants ¡with ¡minor ¡allele ¡frequency ¡(MAF)>5% ¡

– dbGap: ¡~11 ¡million ¡SNPs ¡ – HapMap: ¡3.5 ¡million ¡SNPs ¡ – A ¡successful ¡GWAS ¡requires ¡a ¡more ¡complete ¡catalogue ¡of ¡geneEc ¡variaEons ¡

  • Rare ¡variants ¡(MAF<0.5%), ¡low-­‑frequency ¡variants ¡(MAF:0.5%~5%) ¡

– Captured ¡by ¡sequencing ¡with ¡next-­‑generaEon ¡sequencing ¡technology ¡ – Rare, ¡moderately ¡penetrant ¡alleles ¡ – Possibly ¡significant ¡contributors ¡to ¡the ¡geneEc ¡architecture ¡of ¡disease ¡

  • Causal ¡variants ¡are ¡subject ¡to ¡negaEve ¡selecEon ¡
slide-27
SLIDE 27

1000 ¡Genome ¡Project ¡

(The ¡1000 ¡Genome ¡Project ¡Consor=um, ¡Nature ¡2010) ¡

¡ ¡ The ¡ goal ¡ is ¡ to ¡ characterize ¡ over ¡ 95% ¡ of ¡ variants ¡ that ¡ are ¡ in ¡ genomic ¡ regions ¡

accessible ¡ to ¡ current ¡ high-­‑throughput ¡ sequencing ¡ technologies ¡ and ¡ that ¡ have ¡ allele ¡frequency ¡of ¡1% ¡or ¡higher ¡(the ¡classical ¡definiEon ¡of ¡polymorphism) ¡in ¡each ¡

  • f ¡five ¡major ¡popula=on ¡groups ¡(populaEons ¡in ¡or ¡with ¡ancestry ¡from ¡Europe, ¡East ¡

Asia, ¡South ¡Asia, ¡West ¡Africa ¡and ¡the ¡Americas) ¡ ¡ ¡ ¡

  • ­‑ ¡ ¡179 ¡individuals ¡(low ¡coverage) ¡

¡ ¡ ¡

  • ­‑ ¡ ¡6 ¡individuals ¡in ¡two ¡trios ¡(deep ¡sequencing) ¡

¡ ¡ ¡

  • ­‑ ¡ ¡697 ¡individuals ¡(exon ¡sequencing ¡of ¡8,140 ¡exons) ¡
slide-28
SLIDE 28

1000 ¡Genome ¡Projects: ¡ ¡ Known ¡vs. ¡Novel ¡Variants ¡

slide-29
SLIDE 29

Associa=ons ¡to ¡Rare ¡Variants ¡

  • O\en ¡GWA ¡studies ¡are ¡underpowered ¡for ¡funcEonal ¡rare ¡

variants ¡

  • Common ¡variant ¡GWA ¡approaches ¡are ¡appropriate ¡only ¡for ¡

common ¡variants ¡

Case ¡ Control ¡ Allele ¡a ¡ 60 ¡ 20 ¡ Allele ¡A ¡ 40 ¡ 80 ¡ Case ¡ Control ¡ Allele ¡a ¡ 7 ¡ 2 ¡ Allele ¡A ¡ 93 ¡ 98 ¡ Common ¡Variant ¡AssociaEon ¡ Rare ¡Variant ¡AssociaEon ¡

slide-30
SLIDE 30

Recent ¡Methods ¡for ¡Detec=ng ¡Rare ¡Variant ¡ Associa=ons ¡

  • Test ¡combined ¡effect ¡of ¡mulEple ¡rare ¡variants ¡
  • Fixed-­‑Threshold ¡Approach ¡(Li ¡& ¡Leal, ¡AJHG ¡2008) ¡

– Include ¡only ¡the ¡SNPs ¡with ¡allele ¡frequency ¡below ¡a ¡fixed ¡threshold ¡ – For ¡SNP ¡i=1,…,m ¡in ¡a ¡genomic ¡region ¡or ¡a ¡gene, ¡

» ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡: ¡The ¡allele ¡frequency ¡of ¡SNP ¡i ¡in ¡cases ¡ » ¡ ¡ ¡ ¡ ¡ ¡ ¡

– Evaluate ¡the ¡significance ¡of ¡Score ¡

Score =

i

ε

i=1 m

i

C

i

C

i

ε = 1

⎧ ⎨ ⎩

If ¡the ¡allele ¡frequency ¡of ¡SNP ¡i ¡is ¡below ¡a ¡specified ¡threshold ¡ Otherwise ¡

slide-31
SLIDE 31

Feasibility ¡of ¡Iden=fying ¡Disease ¡Loci ¡

slide-32
SLIDE 32

Explaining ¡Missing ¡Heritability ¡

  • Going ¡beyond ¡SNPs ¡

– Structural ¡variants: ¡inserEons, ¡deleEons, ¡duplicaEon, ¡copy ¡number ¡ variants ¡

  • Heritability ¡esEmate ¡could ¡be ¡wrong. ¡Environment ¡(e.g., ¡diet) ¡

can ¡be ¡heritable ¡within ¡families ¡

  • EpigeneEcs ¡changes ¡in ¡gene ¡expression ¡that ¡are ¡inherited ¡but ¡

not ¡caused ¡by ¡changes ¡in ¡geneEc ¡sequence ¡

– Feeding ¡a ¡mouse ¡a ¡certain ¡diet, ¡for ¡example, ¡can ¡alter ¡the ¡coat ¡color ¡ not ¡only ¡in ¡its ¡children, ¡but ¡also ¡in ¡its ¡children’s ¡children. ¡Here, ¡the ¡ expression ¡of ¡a ¡coat-­‑color ¡gene ¡is ¡controlled ¡by ¡a ¡type ¡of ¡DNA ¡ modificaEon ¡(epigeneEc ¡modificaEon) ¡called ¡methylaEon. ¡

slide-33
SLIDE 33

Tag ¡SNPs ¡and ¡GWAS: ¡Using ¡Reference ¡Datasets ¡ for ¡Genotype ¡Imputa=on ¡

  • Reference ¡data: ¡dense ¡SNP ¡

data ¡from ¡HapMap ¡III, ¡or ¡ 1000 ¡genome ¡project ¡

  • New ¡data: ¡SNP ¡data ¡for ¡

individuals ¡in ¡a ¡given ¡study ¡

  • Data ¡a\er ¡imputaEon ¡
slide-34
SLIDE 34

Genotype ¡Imputa=on ¡

PHASE ¡can ¡be ¡used ¡for ¡imputaEon! ¡

slide-35
SLIDE 35

Tag ¡SNPs ¡and ¡GWAS ¡

(Servin ¡& ¡Stephens, ¡2007) ¡ Tag ¡SNP ¡ Non-­‑tag ¡SNP ¡

slide-36
SLIDE 36

Summary ¡

  • Missing ¡heritability ¡and ¡how ¡to ¡explain ¡it ¡

– Epistasis, ¡pleiotropy, ¡rare ¡variant ¡effects, ¡etc. ¡

  • 1000 ¡Genome ¡Project ¡for ¡obtaining ¡a ¡more ¡complete ¡

catalogue ¡of ¡geneEc ¡variaEons ¡in ¡human ¡genomes ¡