Epistasis 02-715 Advanced Topics in Computa8onal Genomics - - PowerPoint PPT Presentation

epistasis
SMART_READER_LITE
LIVE PREVIEW

Epistasis 02-715 Advanced Topics in Computa8onal Genomics - - PowerPoint PPT Presentation

Epistasis 02-715 Advanced Topics in Computa8onal Genomics Epistasis Defini8on: The effect of one locus depends on the genotype of another locus Epista8c


slide-1
SLIDE 1

Epistasis

02-­‑715 ¡Advanced ¡Topics ¡in ¡Computa8onal ¡ Genomics ¡

slide-2
SLIDE 2

Epistasis

  • Defini8on: ¡The ¡effect ¡of ¡one ¡locus ¡depends ¡on ¡the ¡genotype ¡
  • f ¡another ¡locus ¡

– Epista8c ¡effects ¡vs. ¡marginal ¡effects ¡

slide-3
SLIDE 3

Epistasis for Mendelian Traits

Carlborg ¡& ¡Haley, ¡Nature ¡Reviews ¡Gene8cs ¡2004 ¡

slide-4
SLIDE 4

When There is No Epistasis

  • Two ¡addi8ve ¡

(non-­‑epista8c) ¡ loci ¡

  • The ¡three ¡lines ¡

run ¡in ¡parallel ¡

slide-5
SLIDE 5

Epistasis Example

  • Dominant ¡epistasis ¡
  • One ¡locus ¡in ¡a ¡

dominant ¡way ¡ suppresses ¡the ¡ allelic ¡effects ¡of ¡a ¡ second ¡locus ¡

slide-6
SLIDE 6

Epistasis Example

  • Co-­‑adap8ve ¡epistasis ¡
  • Genotypes ¡that ¡are ¡

homozygous ¡for ¡alleles ¡

  • f ¡the ¡two ¡loci ¡that ¡
  • riginate ¡from ¡the ¡same ¡

line ¡(JJ ¡with ¡JJ, ¡or ¡LL ¡ with ¡LL) ¡show ¡enhanced ¡

  • performance. ¡
  • Almost ¡no ¡marginal ¡

effects: ¡average ¡effect ¡

  • f ¡JJ, ¡JL, ¡LL ¡do ¡not ¡differ ¡
slide-7
SLIDE 7

Epistasis Example

  • Dominance-­‑by-­‑

dominance ¡epistasis ¡

  • Double ¡heterozygote ¡

(LS, ¡LS) ¡deviates ¡from ¡ the ¡phenotype ¡that ¡is ¡ expected ¡from ¡the ¡ phenotypes ¡of ¡the ¡

  • ther ¡heterozygotes. ¡
  • Double ¡heterozygotes ¡

have ¡a ¡lower ¡phenotype ¡ than ¡expected. ¡

slide-8
SLIDE 8

Epistasis

  • Epista8c ¡effects ¡of ¡SNPs ¡can ¡oWen ¡be ¡detected ¡only ¡if ¡the ¡

interac8ng ¡ ¡SNPs ¡are ¡considered ¡jointly ¡

– The ¡number ¡of ¡candidate ¡SNP ¡interac8ons ¡is ¡very ¡large ¡

  • For ¡J ¡SNPs, ¡JxJ ¡SNP ¡pairs ¡need ¡to ¡be ¡considered ¡for ¡epistasis ¡
  • In ¡general ¡for ¡J ¡SNPs ¡and ¡K-­‑way ¡interac8ons, ¡there ¡are ¡O(JK) ¡

candidate ¡interac8ons ¡

  • Computa8onally ¡expensive ¡to ¡consider ¡all ¡possible ¡groups ¡of ¡

interac8ng ¡SNPs ¡

  • For ¡a ¡reliable ¡detec8on ¡of ¡K-­‑way ¡interac8ons, ¡a ¡large ¡sample ¡size ¡is ¡

required ¡ – Mul8ple ¡tes8ng ¡problem ¡

slide-9
SLIDE 9

BEAM Overview (Zhang and Liu, 2007)

  • Bayesian ¡epistasis ¡associa8on ¡mapping ¡for ¡case/control ¡

studies ¡

  • Bayesian ¡par88oning ¡of ¡the ¡gene8c ¡markers ¡to ¡groups ¡of ¡

markers ¡with/without ¡associa8ons ¡

  • Use ¡MCMC ¡to ¡learn ¡the ¡par88oning ¡and ¡obtain ¡the ¡posterior ¡

probability ¡of ¡par88ons ¡of ¡markers ¡

  • It ¡can ¡handle ¡up ¡to ¡~100,000 ¡markers ¡
slide-10
SLIDE 10

BEAM

  • Assume ¡the ¡markers ¡in ¡the ¡case ¡group ¡belong ¡to ¡Group ¡0, ¡1, ¡
  • r ¡2. ¡

– Group ¡0: ¡Markers ¡with ¡no ¡effects ¡D1 ¡ – Group ¡1: ¡Markers ¡with ¡marginal ¡effects ¡D2 ¡ – Group ¡2: ¡Markers ¡with ¡epista8c ¡effects ¡D3 ¡

  • Markers ¡in ¡the ¡control ¡group ¡U ¡belong ¡to ¡Group ¡0. ¡
  • Goal: ¡Learn ¡the ¡par88on ¡of ¡markers ¡I ¡into ¡Groups ¡0, ¡1, ¡2, ¡

given ¡the ¡genotype ¡data. ¡

slide-11
SLIDE 11

Bayesian Marker Partition Model

  • Model ¡for ¡markers ¡in ¡case ¡group ¡with ¡marginal ¡effects ¡

– Assume ¡a ¡Dirichlet(α) ¡for ¡Θ1 ¡

  • Marginal ¡likelihood ¡aWer ¡integra8ng ¡out ¡parameters ¡Θ1 ¡ ¡
slide-12
SLIDE 12

Bayesian Marker Partition Model

  • Model ¡for ¡markers ¡in ¡case ¡group ¡with ¡epista8c ¡effects ¡
  • Markers ¡with ¡no ¡effects ¡in ¡case ¡group, ¡and ¡markers ¡in ¡the ¡

control ¡group ¡

slide-13
SLIDE 13

Bayesian Marker Partition Model

  • The ¡posterior ¡distribu8on ¡of ¡marker ¡assignment ¡to ¡Groups ¡0, ¡

1, ¡2 ¡is ¡given ¡as ¡

– The ¡prior ¡is ¡given ¡as ¡ ¡

slide-14
SLIDE 14

BEAM: MCMC Sampling

  • Ini8alize ¡I ¡according ¡to ¡P(I) ¡
  • Metropolis-­‑Has8ngs ¡(MH) ¡algorithm ¡ ¡
  • Propose ¡to ¡change ¡the ¡marker’s ¡group ¡membership ¡
  • Propose ¡to ¡randomly ¡exchange ¡two ¡markers ¡between ¡Groups ¡0, ¡1, ¡
  • 2. ¡
slide-15
SLIDE 15

Evaluating Markers for Associations

  • Use ¡the ¡posterior ¡probability ¡P(I|D,U) ¡
  • Use ¡B-­‑sta8s8c ¡

– ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡Bayes ¡factor ¡under ¡null ¡model ¡ ¡ – ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡Bayes ¡factor ¡under ¡the ¡alterna8ve ¡model ¡ ¡

slide-16
SLIDE 16

Simulation Study

– Model ¡1: ¡two ¡disease ¡ loci ¡with ¡independent ¡ effects ¡ – Model ¡2: ¡disease ¡risk ¡

  • nly ¡when ¡both ¡loci ¡have ¡

at ¡least ¡one ¡disease ¡ allele ¡ – Model ¡3: ¡addi8onal ¡ disease ¡alleles ¡at ¡each ¡ locus ¡do ¡not ¡further ¡ increase ¡the ¡disease ¡risk ¡

slide-17
SLIDE 17

Simulation Study

  • Other ¡scenarios ¡to ¡be ¡considered ¡

– Model ¡4: ¡three ¡disease ¡loci. ¡ – Model ¡5: ¡mul8ple ¡causal ¡epistasis ¡by ¡a ¡mixture ¡of ¡two ¡two-­‑way ¡

  • interac8ons. ¡Disease ¡risk ¡if ¡at ¡least ¡one ¡epista8c ¡interac8on ¡is ¡present. ¡

– Model ¡6: ¡six-­‑way ¡interac8on ¡

slide-18
SLIDE 18

Results for Models 1-3

power ¡ 2000 ¡cases, ¡2000 ¡controls ¡ 1000 ¡cases, ¡1000 ¡controls ¡

slide-19
SLIDE 19

Results on AMD Dataset

  • AMD ¡dataset, ¡116,204 ¡SNPs ¡genotyped ¡for ¡96 ¡cases ¡and ¡50 ¡
  • controls. ¡Posterior ¡probabili8es ¡for ¡having ¡an ¡associa8on ¡
slide-20
SLIDE 20

Sensitivity to Prior Distributions

p1=p2 ¡ =0.0033 ¡ p1=p2 ¡ =0.001 ¡ p1=p2 ¡ =0.0001 ¡ p1=p2 ¡ =0.00001 ¡ P1: ¡prior ¡probabili8es ¡for ¡marginal ¡effects ¡ P2: ¡prior ¡probabili8es ¡for ¡epista8c ¡effects ¡ ¡

slide-21
SLIDE 21

MCMC Trace and Autocorrelation Plot

Simulated ¡ data ¡ AMD ¡data ¡

slide-22
SLIDE 22

Screen and Clean (Wu et al., 2010)

  • Mul8variate ¡analysis ¡of ¡all ¡SNPs ¡and ¡SNP ¡interac8ons ¡using ¡

lasso ¡

  • Assume ¡that ¡the ¡SNPs ¡with ¡epista8c ¡effects ¡are ¡likely ¡to ¡have ¡

at ¡least ¡small ¡marginal ¡effect ¡

– Select ¡the ¡SNPs ¡with ¡marginal ¡effects. ¡ – Consider ¡only ¡those ¡SNPs ¡with ¡marginal ¡effects ¡for ¡epista8c ¡

  • interac8on. ¡

– SNPs ¡will ¡be ¡found ¡to ¡have ¡epista8c ¡effects ¡but ¡no ¡marginal ¡effects ¡

slide-23
SLIDE 23

Screen: Two-stage Lasso for Detecting Epistasis

  • Two-­‑stage ¡lasso ¡

– Step ¡1: ¡Apply ¡lasso ¡with ¡no ¡considera8on ¡of ¡epistasis ¡to ¡detect ¡SNPs ¡ with ¡significant ¡individual ¡effects ¡ – Step ¡2: ¡Apply ¡lasso ¡with ¡pairs ¡of ¡only ¡those ¡SNPs ¡selected ¡in ¡Step ¡1 ¡

slide-24
SLIDE 24

Clean: Assessing Significance of Results

  • Split ¡the ¡data ¡into ¡Stage ¡1 ¡and ¡2 ¡datasets ¡

– Using ¡Stage ¡1 ¡data, ¡apply ¡lasso ¡to ¡select ¡SNPs ¡with ¡marginal ¡and ¡ epista8c ¡effects ¡ – Using ¡Stage ¡2 ¡data, ¡assess ¡the ¡significance ¡of ¡SNPs ¡

  • Apply ¡the ¡least ¡squared ¡error ¡method ¡and ¡obtain ¡the ¡tradi8onal ¡t-­‑

sta8s8c ¡

  • Mul8-­‑split ¡method ¡

– Randomly ¡split ¡the ¡data ¡into ¡Stage ¡1 ¡and ¡Stage ¡2 ¡datasets ¡mul8ple ¡ 8mes ¡ – Perform ¡the ¡two-­‑way ¡split ¡method ¡for ¡each ¡split ¡ – Combine ¡the ¡p-­‑values ¡from ¡each ¡split. ¡

slide-25
SLIDE 25

Advantages and Disadvantages

  • Reduces ¡the ¡computa8onal ¡burden. ¡
  • SNPs ¡with ¡epista8c ¡effects ¡oWen ¡do ¡not ¡have ¡detectable ¡

individual ¡(marginal) ¡effects, ¡and ¡many ¡of ¡these ¡associa8on ¡ signals ¡will ¡be ¡missed. ¡

  • Need ¡to ¡split ¡the ¡data ¡into ¡two ¡parts ¡for ¡Stage ¡1 ¡and ¡Stage ¡2 ¡

analysis ¡

slide-26
SLIDE 26

Screen and Clean

slide-27
SLIDE 27

Simulation Results

  • Solid ¡line: ¡mul8-­‑split, ¡

dojed ¡line: ¡single-­‑ split ¡

slide-28
SLIDE 28

Results

  • WTCCC ¡data ¡
  • 1,963 ¡cases ¡with ¡T1D ¡and ¡2,938 ¡controls ¡
  • Mul8-­‑split ¡screen ¡and ¡clean ¡with ¡56 ¡random ¡splits ¡