Natural Selection 02-715 Advanced Topics in Computa8onal - - PowerPoint PPT Presentation

natural selection
SMART_READER_LITE
LIVE PREVIEW

Natural Selection 02-715 Advanced Topics in Computa8onal - - PowerPoint PPT Presentation

Natural Selection 02-715 Advanced Topics in Computa8onal Genomics Composite Likelihood Test (Nielsen et al., 2005) Likelihood models for null and alterna8ve hypotheses Examines


slide-1
SLIDE 1

Natural Selection

02-­‑715 ¡Advanced ¡Topics ¡in ¡Computa8onal ¡ Genomics ¡

slide-2
SLIDE 2

Composite Likelihood Test

(Nielsen et al., 2005)

  • Likelihood ¡models ¡for ¡null ¡and ¡alterna8ve ¡hypotheses ¡

– Examines ¡the ¡allele ¡frequency ¡spectrum ¡

  • Incorporates ¡a ¡scheme ¡for ¡correc8ng ¡for ¡the ¡ascertainment ¡

bias ¡

slide-3
SLIDE 3

Composite Likelihood Test 1

  • p ¡= ¡{p1, ¡… ¡pn-­‑1}, ¡where ¡pj ¡is ¡probabili8es ¡of ¡observing ¡a ¡derived ¡allele ¡

frequency ¡j ¡for ¡n ¡samples ¡

  • Likelihood ¡model ¡under ¡neutral ¡evolu8on, ¡for ¡k ¡SNPs ¡in ¡the ¡whole ¡

chromosome ¡

  • Likelihood ¡model ¡under ¡selec8ve ¡sweep, ¡in ¡a ¡region ¡(v,b) ¡
  • Test ¡sta8s8c ¡
slide-4
SLIDE 4

Composite Likelihood Test 2

  • Incorporate ¡spa8al ¡distribu8on ¡in ¡allele ¡frequencies ¡along ¡the ¡

chromosome ¡due ¡to ¡recombina8ons ¡

  • Assump8on: ¡each ¡ancestral ¡lineage ¡in ¡the ¡genealogy ¡has ¡an ¡

i.i.d. ¡probability ¡of ¡escaping ¡a ¡selec8ve ¡sweep ¡through ¡ recombina8on ¡onto ¡the ¡selected ¡background. ¡

slide-5
SLIDE 5

Composite Likelihood Test 2

  • The ¡probability ¡of ¡escaping ¡through ¡recombina8on ¡

– d: ¡distance ¡d ¡between ¡a ¡given ¡locus ¡and ¡the ¡selected ¡variant ¡ – α: ¡a ¡parameter ¡that ¡is ¡a ¡func8on ¡of ¡recombina8on ¡rate, ¡effec8ve ¡ popula8on ¡size, ¡selec8on ¡coefficient ¡of ¡the ¡selected ¡muta8on ¡(e.g., ¡α ¡= ¡ r ¡ln(2N)/s ¡

slide-6
SLIDE 6

Composite Likelihood Test 2

  • The ¡probability ¡that ¡k ¡(0<k<n) ¡out ¡of ¡n ¡gene ¡copies ¡escaped ¡

the ¡sweep: ¡

  • The ¡probability ¡of ¡observing ¡B ¡mutant ¡alleles ¡a[er ¡a ¡sweep ¡
slide-7
SLIDE 7

Simulation Study

  • Distribu8on ¡of ¡test ¡sta8s8cs ¡under ¡null ¡hypothesis: ¡test ¡2 ¡is ¡

more ¡robust ¡with ¡respect ¡to ¡recombina8on ¡rates ¡

Test ¡1 ¡ Test ¡2 ¡ Recombina8on ¡rate ¡

slide-8
SLIDE 8

Correcting for Ascertainment Bias

  • Likelihood ¡for ¡allele ¡frequencies ¡a[er ¡condi8oning ¡on ¡

ascertainment ¡(i.e., ¡unobserved ¡true ¡allele ¡frequencies) ¡

slide-9
SLIDE 9

Correcting for Ascertainment Bias

(Nielson et al., 2004)

  • Illustra8on ¡through ¡simula8on ¡study ¡
slide-10
SLIDE 10

HapMap Data Analysis

  • HapMap ¡chromosome ¡2 ¡
  • Test ¡1: ¡requires ¡a ¡choice ¡of ¡window ¡size ¡
  • Test ¡2: ¡no ¡need ¡to ¡fix ¡the ¡window ¡size ¡
slide-11
SLIDE 11

Ascertainment Bias from HapMap Analysis

slide-12
SLIDE 12

Evolution

02-­‑715 ¡Advanced ¡Topics ¡in ¡Computa8onal ¡ Genomics ¡

slide-13
SLIDE 13

Cross-species Sequence Analysis

  • Func8onal ¡regions ¡of ¡genomes ¡are ¡conserved ¡across ¡species ¡
  • Cross-­‑species ¡sequence ¡conserva8on ¡is ¡believed ¡to ¡occur ¡

because ¡of ¡nega8ve ¡(purifying) ¡selec8on ¡

  • About ¡5% ¡or ¡more ¡of ¡bases ¡in ¡mammalian ¡genomes ¡are ¡under ¡

purifying ¡selec8on ¡

  • Protein ¡coding ¡genes ¡account ¡for ¡1.5% ¡of ¡the ¡regions ¡under ¡

purifying ¡selec8on ¡

slide-14
SLIDE 14

Phylo-HMM

  • Parse ¡aligned ¡sequences ¡into ¡two ¡classes ¡

– Conserved ¡vs. ¡nonconserved ¡

  • Maximum ¡likelihood ¡es8ma8on ¡of ¡parameters ¡of ¡Phylo-­‑HMM ¡
slide-15
SLIDE 15

Phylo-HMM

  • μ, ¡ν: ¡transi8on ¡

probabili8es ¡

  • States ¡

– c: ¡conserved ¡region ¡ – n: ¡non-­‑conserved ¡region ¡

  • ψn, ¡ψc: ¡emission ¡

probabili8es ¡as ¡a ¡tree ¡ ¡ ¡

slide-16
SLIDE 16

Phylo-HMM

  • ψn, ¡ψc: ¡emission ¡

probabili8es ¡as ¡a ¡ phylogene8c ¡model ¡

– Iden8cal ¡phylogene8c ¡ model ¡structure ¡for ¡two ¡ states ¡ – ¡ρ: ¡scaling ¡factor ¡for ¡ branch ¡length ¡0≤ρ≤1 ¡

  • Average ¡subs8tu8on ¡rate ¡
slide-17
SLIDE 17

Datasets

  • Vertebrate ¡species ¡

– Human, ¡mouse, ¡rat, ¡chicken, ¡fugu ¡rubripes ¡ – Alignment ¡with ¡human ¡as ¡reference ¡sequence ¡

  • Insect ¡species ¡

– Three ¡species ¡of ¡Drosophila ¡and ¡Anopheles ¡gambiae ¡ – Alignment ¡with ¡D. ¡melanogaster ¡as ¡reference ¡sequence ¡

  • Two ¡species ¡of ¡Caenorhabdi8s ¡ ¡

– Alignment ¡with ¡C. ¡elegans ¡as ¡reference ¡sequence ¡

  • Seven ¡species ¡of ¡saccharomyces ¡

– Alignment ¡with ¡S. ¡cerevisiae ¡as ¡reference ¡sequence ¡

slide-18
SLIDE 18

Phylogenetic Models: Assumed Topologies and Estimated Branch Lengths

slide-19
SLIDE 19

Estimated Conserved Elements

  • More ¡complex ¡organisms ¡have ¡more ¡conserved ¡regions ¡
  • utside ¡of ¡coding ¡regions ¡

Vertebrate ¡ Insect ¡ Worm ¡ Yeast ¡

slide-20
SLIDE 20

Conservation Around GRIA2 in Human

slide-21
SLIDE 21

Extreme Conservation

  • Extreme ¡conserva8on ¡at ¡the ¡3’ ¡end ¡of ¡the ¡ELAVL4 ¡gene ¡
slide-22
SLIDE 22

Key Observations

  • Conserved ¡regions ¡

– 3%-­‑8% ¡of ¡the ¡human ¡genome ¡conserved ¡in ¡vertebrates ¡and ¡other ¡ mammals ¡ – 37-­‑53% ¡in ¡D. ¡melanogaster ¡ – 18-­‑37% ¡in ¡C. ¡elegans ¡ – 47-­‑68% ¡in ¡S. ¡cerevisiae ¡

  • Highly ¡conserved ¡regions ¡(HCE) ¡

– 42% ¡of ¡HCEs ¡overlap ¡with ¡exons ¡in ¡vertebrate ¡genomes ¡ – >93% ¡for ¡insects, ¡worms, ¡yeasts ¡

  • Extreme ¡conserva8ons ¡in ¡3’ ¡UTRs ¡

– Post-­‑transrip8onal ¡regula8on? ¡

  • HCEs ¡in ¡intron ¡regions ¡

– Enriched ¡for ¡RNA ¡secondary ¡structure: ¡encoding ¡func8onal ¡RNAs? ¡