SLIDE 1
Natural Selection 02-715 Advanced Topics in Computa8onal - - PowerPoint PPT Presentation
Natural Selection 02-715 Advanced Topics in Computa8onal - - PowerPoint PPT Presentation
Natural Selection 02-715 Advanced Topics in Computa8onal Genomics Time Scales for the Signatures of Selection Selective Sweep Long Haplotypes LCT allele for lactase persistence (high
SLIDE 2
SLIDE 3
Selective Sweep
SLIDE 4
Long Haplotypes
- LCT ¡allele ¡for ¡lactase ¡persistence ¡(high ¡frequency ¡~77% ¡in ¡
European ¡popula8ons ¡but ¡long ¡haplotypes) ¡
SLIDE 5
Difficulties in Detecting Natural Selection
- Confounding ¡effects ¡of ¡demography ¡
– Popula8on ¡boIleneck ¡and ¡expansion ¡can ¡leave ¡signatures ¡that ¡look ¡ like ¡a ¡posi8ve ¡selec8on ¡
- Ascertainment ¡bias ¡for ¡SNPs ¡
– Regions ¡where ¡many ¡sequences ¡were ¡used ¡for ¡ascertainment ¡may ¡ appear ¡to ¡have ¡more ¡segrega8ng ¡alleles ¡at ¡low ¡frequencies ¡with ¡more ¡
- haplotypes. ¡
- Recombina8on ¡rate ¡
– Strong ¡signature ¡for ¡selec8on ¡for ¡regions ¡with ¡low ¡recombina8on ¡rates ¡
SLIDE 6
Analysis of HapMap Data for Natural Selection (Sabeti et al., 2007)
- Look ¡for ¡evidence ¡of ¡recent ¡selec8ve ¡sweep ¡
– Long ¡haplotypes ¡ – Control ¡for ¡recombina8on ¡rates ¡by ¡comparing ¡the ¡long ¡haplotypes ¡to ¡
- ther ¡alleles ¡at ¡the ¡same ¡locus ¡
– EHH, ¡iHS ¡tests ¡
SLIDE 7
EHH Test
- Extended ¡haplotype ¡homozygosity ¡(EHH): ¡EHH ¡at ¡distance ¡x ¡
from ¡the ¡core ¡region ¡is ¡the ¡probability ¡that ¡two ¡randomly ¡ chosen ¡chromosomes ¡carry ¡a ¡tested ¡core ¡haplotype ¡are ¡ homozygous ¡at ¡all ¡SNPs ¡for ¡the ¡en8re ¡interval ¡from ¡the ¡core ¡ region ¡to ¡the ¡distance ¡x. ¡
SLIDE 8
Haplotype Bifurcation Diagram for Computing EHH
SLIDE 9
iHS Test
- iHS ¡(integrated ¡haplotype ¡score): ¡
– iHH: ¡integrated ¡EHH ¡ – iHHA: ¡iHH ¡for ¡ancestral ¡allele ¡ – iHHD: ¡iHH ¡for ¡derived ¡allele ¡
SLIDE 10
iHS Test
SLIDE 11
iHS: More Examples
SLIDE 12
Analysis of HapMap Data for Natural Selection
- Determining ¡targets ¡of ¡selec8on ¡among ¡the ¡candidate ¡regions ¡
– Target ¡alleles ¡are ¡likely ¡to ¡be ¡derived ¡alleles ¡ – Target ¡alleles ¡are ¡likely ¡to ¡be ¡highly ¡differen8ated ¡between ¡popula8ons ¡ – Target ¡alleles ¡are ¡likely ¡to ¡have ¡biological ¡effects, ¡e.g., ¡non-‑synonymous ¡
SLIDE 13
HapMap: Candidates for Natural Selection
SLIDE 14
Global Distribution of Positively Selected Allele SLC24A5 A111T
SLIDE 15
EHH, iHS, and Ascertainment Bias
- EHH, ¡iHS ¡are ¡haplotype ¡based ¡method ¡
– Less ¡sensi8ve ¡to ¡ascertainment ¡bias. ¡ – Good ¡power ¡for ¡recent ¡selec8ve ¡sweeps, ¡but ¡low ¡power ¡for ¡older ¡
- sweeps. ¡
SLIDE 16
Composite Likelihood Test
(Nielsen et al., 2005)
- Likelihood ¡models ¡for ¡null ¡and ¡alterna8ve ¡hypotheses ¡
- Incorporates ¡a ¡scheme ¡for ¡correc8ng ¡the ¡ascertainment ¡bias ¡
SLIDE 17
Composite Likelihood Test 1
- p ¡= ¡{p1, ¡… ¡pn-‑1}: ¡probabili8es ¡of ¡derived ¡allele ¡frequencies ¡for ¡n ¡
samples ¡
- Likelihood ¡model ¡under ¡neutral ¡evolu8on ¡
- Likelihood ¡model ¡under ¡selec8ve ¡sweep ¡
- Test ¡sta8s8c ¡
SLIDE 18
Composite Likelihood Test 2
- Incorporate ¡spa8al ¡distribu8on ¡in ¡allele ¡frequencies ¡due ¡to ¡
recombina8ons ¡
- Assump8on: ¡each ¡ancestral ¡lineage ¡in ¡the ¡genealogy ¡has ¡an ¡
i.i.d. ¡probability ¡of ¡escaping ¡a ¡selec8ve ¡sweep ¡through ¡ recombina8on ¡onto ¡the ¡selected ¡background. ¡
SLIDE 19
Ancestral Recombination Graph with Selective Sweep
SLIDE 20
Composite Likelihood Test 2
- The ¡probability ¡of ¡escaping ¡through ¡recombina8on ¡
– d: ¡distance ¡d ¡between ¡a ¡given ¡locus ¡and ¡the ¡selected ¡variant ¡ – α: ¡a ¡parameter ¡that ¡is ¡a ¡func8on ¡of ¡recombina8on ¡rate, ¡effec8ve ¡ popula8on ¡size, ¡selec8on ¡coefficient ¡of ¡the ¡selected ¡muta8on ¡(e.g., ¡α ¡= ¡ r ¡ln(2N)/s ¡
SLIDE 21
Composite Likelihood Test 2
- The ¡probability ¡that ¡k ¡(0<k<n) ¡out ¡of ¡n ¡gene ¡copies ¡escaped ¡
the ¡sweep: ¡
- The ¡probability ¡of ¡observing ¡B ¡mutant ¡alleles ¡a`er ¡a ¡sweep ¡
SLIDE 22
Simulation Study
- Distribu8on ¡of ¡test ¡sta8s8cs ¡under ¡null ¡hypothesis ¡
Test ¡1 ¡ Test ¡2 ¡
SLIDE 23
Correcting for Ascertainment Bias
- Likelihood ¡for ¡allele ¡frequencies ¡a`er ¡condi8oning ¡on ¡
ascertainment ¡(i.e., ¡unobserved ¡true ¡allele ¡frequencies) ¡
SLIDE 24
Correcting for Ascertainment Bias
(Nielson et al., 2004)
- Illustra8on ¡through ¡simula8on ¡study ¡(20 ¡genes, ¡10,000 ¡SNPs, ¡
5 ¡genes ¡for ¡ascertainment) ¡
SLIDE 25
HapMap Data Analysis
- HapMap ¡chromosome ¡2 ¡
- Test ¡1: ¡requires ¡a ¡choice ¡of ¡window ¡size ¡
- Test ¡2: ¡no ¡need ¡to ¡fix ¡the ¡window ¡size ¡
SLIDE 26
Ascertainment Bias from HapMap Analysis
SLIDE 27
Neandertals and Modern Humans
SLIDE 28