Natural Selection 02-715 Advanced Topics in Computa8onal - - PowerPoint PPT Presentation

natural selection
SMART_READER_LITE
LIVE PREVIEW

Natural Selection 02-715 Advanced Topics in Computa8onal - - PowerPoint PPT Presentation

Natural Selection 02-715 Advanced Topics in Computa8onal Genomics Time Scales for the Signatures of Selection Selective Sweep Long Haplotypes LCT allele for lactase persistence (high


slide-1
SLIDE 1

Natural Selection

02-­‑715 ¡Advanced ¡Topics ¡in ¡Computa8onal ¡ Genomics ¡

slide-2
SLIDE 2

Time Scales for the Signatures of Selection

slide-3
SLIDE 3

Selective Sweep

slide-4
SLIDE 4

Long Haplotypes

  • LCT ¡allele ¡for ¡lactase ¡persistence ¡(high ¡frequency ¡~77% ¡in ¡

European ¡popula8ons ¡but ¡long ¡haplotypes) ¡

slide-5
SLIDE 5

Difficulties in Detecting Natural Selection

  • Confounding ¡effects ¡of ¡demography ¡

– Popula8on ¡boIleneck ¡and ¡expansion ¡can ¡leave ¡signatures ¡that ¡look ¡ like ¡a ¡posi8ve ¡selec8on ¡

  • Ascertainment ¡bias ¡for ¡SNPs ¡

– Regions ¡where ¡many ¡sequences ¡were ¡used ¡for ¡ascertainment ¡may ¡ appear ¡to ¡have ¡more ¡segrega8ng ¡alleles ¡at ¡low ¡frequencies ¡with ¡more ¡

  • haplotypes. ¡
  • Recombina8on ¡rate ¡

– Strong ¡signature ¡for ¡selec8on ¡for ¡regions ¡with ¡low ¡recombina8on ¡rates ¡

slide-6
SLIDE 6

Analysis of HapMap Data for Natural Selection (Sabeti et al., 2007)

  • Look ¡for ¡evidence ¡of ¡recent ¡selec8ve ¡sweep ¡

– Long ¡haplotypes ¡ – Control ¡for ¡recombina8on ¡rates ¡by ¡comparing ¡the ¡long ¡haplotypes ¡to ¡

  • ther ¡alleles ¡at ¡the ¡same ¡locus ¡

– EHH, ¡iHS ¡tests ¡

slide-7
SLIDE 7

EHH Test

  • Extended ¡haplotype ¡homozygosity ¡(EHH): ¡EHH ¡at ¡distance ¡x ¡

from ¡the ¡core ¡region ¡is ¡the ¡probability ¡that ¡two ¡randomly ¡ chosen ¡chromosomes ¡carry ¡a ¡tested ¡core ¡haplotype ¡are ¡ homozygous ¡at ¡all ¡SNPs ¡for ¡the ¡en8re ¡interval ¡from ¡the ¡core ¡ region ¡to ¡the ¡distance ¡x. ¡

slide-8
SLIDE 8

Haplotype Bifurcation Diagram for Computing EHH

slide-9
SLIDE 9

iHS Test

  • iHS ¡(integrated ¡haplotype ¡score): ¡

– iHH: ¡integrated ¡EHH ¡ – iHHA: ¡iHH ¡for ¡ancestral ¡allele ¡ – iHHD: ¡iHH ¡for ¡derived ¡allele ¡

slide-10
SLIDE 10

iHS Test

slide-11
SLIDE 11

iHS: More Examples

slide-12
SLIDE 12

Analysis of HapMap Data for Natural Selection

  • Determining ¡targets ¡of ¡selec8on ¡among ¡the ¡candidate ¡regions ¡

– Target ¡alleles ¡are ¡likely ¡to ¡be ¡derived ¡alleles ¡ – Target ¡alleles ¡are ¡likely ¡to ¡be ¡highly ¡differen8ated ¡between ¡popula8ons ¡ – Target ¡alleles ¡are ¡likely ¡to ¡have ¡biological ¡effects, ¡e.g., ¡non-­‑synonymous ¡

slide-13
SLIDE 13

HapMap: Candidates for Natural Selection

slide-14
SLIDE 14

Global Distribution of Positively Selected Allele SLC24A5 A111T

slide-15
SLIDE 15

EHH, iHS, and Ascertainment Bias

  • EHH, ¡iHS ¡are ¡haplotype ¡based ¡method ¡

– Less ¡sensi8ve ¡to ¡ascertainment ¡bias. ¡ – Good ¡power ¡for ¡recent ¡selec8ve ¡sweeps, ¡but ¡low ¡power ¡for ¡older ¡

  • sweeps. ¡
slide-16
SLIDE 16

Composite Likelihood Test

(Nielsen et al., 2005)

  • Likelihood ¡models ¡for ¡null ¡and ¡alterna8ve ¡hypotheses ¡
  • Incorporates ¡a ¡scheme ¡for ¡correc8ng ¡the ¡ascertainment ¡bias ¡
slide-17
SLIDE 17

Composite Likelihood Test 1

  • p ¡= ¡{p1, ¡… ¡pn-­‑1}: ¡probabili8es ¡of ¡derived ¡allele ¡frequencies ¡for ¡n ¡

samples ¡

  • Likelihood ¡model ¡under ¡neutral ¡evolu8on ¡
  • Likelihood ¡model ¡under ¡selec8ve ¡sweep ¡
  • Test ¡sta8s8c ¡
slide-18
SLIDE 18

Composite Likelihood Test 2

  • Incorporate ¡spa8al ¡distribu8on ¡in ¡allele ¡frequencies ¡due ¡to ¡

recombina8ons ¡

  • Assump8on: ¡each ¡ancestral ¡lineage ¡in ¡the ¡genealogy ¡has ¡an ¡

i.i.d. ¡probability ¡of ¡escaping ¡a ¡selec8ve ¡sweep ¡through ¡ recombina8on ¡onto ¡the ¡selected ¡background. ¡

slide-19
SLIDE 19

Ancestral Recombination Graph with Selective Sweep

slide-20
SLIDE 20

Composite Likelihood Test 2

  • The ¡probability ¡of ¡escaping ¡through ¡recombina8on ¡

– d: ¡distance ¡d ¡between ¡a ¡given ¡locus ¡and ¡the ¡selected ¡variant ¡ – α: ¡a ¡parameter ¡that ¡is ¡a ¡func8on ¡of ¡recombina8on ¡rate, ¡effec8ve ¡ popula8on ¡size, ¡selec8on ¡coefficient ¡of ¡the ¡selected ¡muta8on ¡(e.g., ¡α ¡= ¡ r ¡ln(2N)/s ¡

slide-21
SLIDE 21

Composite Likelihood Test 2

  • The ¡probability ¡that ¡k ¡(0<k<n) ¡out ¡of ¡n ¡gene ¡copies ¡escaped ¡

the ¡sweep: ¡

  • The ¡probability ¡of ¡observing ¡B ¡mutant ¡alleles ¡a`er ¡a ¡sweep ¡
slide-22
SLIDE 22

Simulation Study

  • Distribu8on ¡of ¡test ¡sta8s8cs ¡under ¡null ¡hypothesis ¡

Test ¡1 ¡ Test ¡2 ¡

slide-23
SLIDE 23

Correcting for Ascertainment Bias

  • Likelihood ¡for ¡allele ¡frequencies ¡a`er ¡condi8oning ¡on ¡

ascertainment ¡(i.e., ¡unobserved ¡true ¡allele ¡frequencies) ¡

slide-24
SLIDE 24

Correcting for Ascertainment Bias

(Nielson et al., 2004)

  • Illustra8on ¡through ¡simula8on ¡study ¡(20 ¡genes, ¡10,000 ¡SNPs, ¡

5 ¡genes ¡for ¡ascertainment) ¡

slide-25
SLIDE 25

HapMap Data Analysis

  • HapMap ¡chromosome ¡2 ¡
  • Test ¡1: ¡requires ¡a ¡choice ¡of ¡window ¡size ¡
  • Test ¡2: ¡no ¡need ¡to ¡fix ¡the ¡window ¡size ¡
slide-26
SLIDE 26

Ascertainment Bias from HapMap Analysis

slide-27
SLIDE 27

Neandertals and Modern Humans

slide-28
SLIDE 28

Selective Sweeps in Modern Human Genomes Compared to Neandertals