Evolution and Population Genetics 02-715 Advanced Topics in - - PowerPoint PPT Presentation

evolution and population genetics
SMART_READER_LITE
LIVE PREVIEW

Evolution and Population Genetics 02-715 Advanced Topics in - - PowerPoint PPT Presentation

Evolution and Population Genetics 02-715 Advanced Topics in Computa8onal Genomics A Human Coalescence at the most recent common ancestor Genealogy Coalescence in Population Genetics


slide-1
SLIDE 1

Evolution and Population Genetics

02-­‑715 ¡Advanced ¡Topics ¡in ¡Computa8onal ¡ Genomics ¡

slide-2
SLIDE 2

Coalescence ¡at ¡the ¡most ¡recent ¡common ¡ancestor ¡

A Human Genealogy ¡

slide-3
SLIDE 3

Coalescence in Population Genetics

  • Stochas8c ¡model ¡for ¡gene ¡

frequencies ¡in ¡finite ¡popula8ons ¡

  • Assump8ons ¡

– The ¡popula8on ¡size ¡N ¡is ¡constant ¡ from ¡genera8on ¡to ¡genera8on ¡ – Organisms ¡are ¡diploid ¡(2N ¡copies ¡of ¡ each ¡gene) ¡ – All ¡members ¡of ¡each ¡genera8on ¡ reproduce ¡simultaneously: ¡ genera8ons ¡do ¡not ¡overlap ¡ – Random ¡ma8ng ¡ – Allele ¡frequencies ¡are ¡not ¡perturbed ¡ by ¡migra8on ¡or ¡selec8on ¡

slide-4
SLIDE 4

Coalescence in Population Genetics

  • The ¡model ¡traces ¡the ¡ancestry ¡
  • f ¡each ¡individual ¡at ¡the ¡current ¡

genera8on ¡backward ¡

  • An ¡individual ¡at ¡genera8on ¡t ¡

randomly ¡samples ¡two ¡ individuals ¡at ¡genera8on ¡t-­‑1 ¡as ¡ parents ¡

  • In ¡finite ¡number ¡of ¡genera8ons, ¡

all ¡individuals ¡will ¡coalesce ¡into ¡ a ¡single ¡individual ¡ ¡

slide-5
SLIDE 5

Coalescence

  • Assume ¡effec8ve ¡popula8on ¡size ¡of ¡N: ¡2N ¡copies ¡in ¡diploid ¡
  • rganisms ¡
  • The ¡probability ¡that ¡two ¡genes ¡share ¡a ¡common ¡parent ¡in ¡the ¡

previous ¡genera8on: ¡1/(2N) ¡

  • The ¡probability ¡that ¡the ¡two ¡genes ¡do ¡not ¡share ¡a ¡common ¡parent ¡

in ¡the ¡previous ¡genera8on: ¡1-­‑1/(2N) ¡

  • The ¡probability ¡of ¡coalescence ¡at ¡8me ¡T: ¡ ¡

¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ – For ¡large ¡N, ¡we ¡have ¡

P(T) = (1− 1 2N )T −1 1 2N P(T) = 1 2N e

−T −1 2N

slide-6
SLIDE 6
  • Looking ¡back ¡in ¡8me, ¡the ¡

stochas8c ¡model ¡defines ¡the ¡ probability ¡Ft ¡that ¡two ¡genes ¡are ¡ iden8cal ¡by ¡descent ¡in ¡ genera8on ¡t ¡through ¡Ft-1

– µ : mutation rate – N : population size

Write-Fisher Model

Ft = 1 2N (1− µ)2 + (1− 1 2N )(1− µ)2Ft −1

Both ¡genes ¡are ¡copies ¡of ¡a ¡ single ¡gene ¡from ¡ genera8on ¡t-­‑1 ¡and ¡neither ¡ copy ¡is ¡mutant ¡ Two ¡genes ¡are ¡nonmutant ¡copies ¡

  • f ¡different ¡genes ¡in ¡the ¡previous ¡

genera8on ¡and ¡those ¡two ¡genes ¡ are ¡iden8cal ¡by ¡descent ¡

slide-7
SLIDE 7

Phylogenetics vs. Population Genetics

  • Phylogene8cs ¡

– Assumes ¡a ¡single ¡correct ¡species ¡phylogeny ¡that ¡holds ¡across ¡genomes ¡ – Ignores ¡varia8ons ¡among ¡individuals ¡of ¡the ¡same ¡species ¡or ¡assumes ¡a ¡ negligible ¡variability ¡within ¡species ¡ – Reduces ¡the ¡en8re ¡popula8on ¡of ¡a ¡species ¡into ¡a ¡single ¡individual ¡

  • Popula8on ¡gene8cs ¡

– Usually ¡concerned ¡with ¡within-­‑species ¡varia8on ¡in ¡genomes ¡ – Individuals ¡within ¡a ¡species ¡are ¡related ¡by ¡genealogies ¡

Siepel, ¡A. ¡Genome ¡Res. ¡19(11):1929-­‑41. ¡2009. ¡ Phylogenomics ¡of ¡primates ¡and ¡their ¡ancestral ¡popula8ons. ¡

slide-8
SLIDE 8

Population-aware Phylogenetics

  • Primate ¡species ¡

– Divergence ¡8me ¡is ¡short ¡rela8ve ¡to ¡ancestral ¡popula8on ¡sizes ¡ – Phylogene8cs ¡assump8ons ¡do ¡not ¡hold ¡ – Non-­‑negligible ¡popula8on ¡gene8c ¡effects ¡

  • Interspecies ¡comparison, ¡taking ¡into ¡account ¡selec8ve ¡forces ¡

within ¡species, ¡ancestral ¡popula8ons, ¡modes ¡of ¡specia8on ¡

slide-9
SLIDE 9

Phylogeny of Primates

Siepel, ¡A. ¡Genome ¡Res. ¡19(11):1929-­‑41. ¡2009. ¡ Phylogenomics ¡of ¡primates ¡and ¡their ¡ancestral ¡popula8ons. ¡

slide-10
SLIDE 10

Darwin’s Phylogeny

slide-11
SLIDE 11

Genealogies in Wright-Fisher Model

slide-12
SLIDE 12

Population Genetic Interpretation of Speciation

  • T: ¡coalescent ¡8me ¡
  • τ: ¡specia8on ¡8me ¡ ¡
slide-13
SLIDE 13

Population Genetic Interpretation of Speciation

  • τ>>2Ne: ¡ ¡

– τ+T ¡is ¡approximately ¡τ ¡ – Divergence ¡between ¡ individual ¡chromosomes ¡ as ¡an ¡es8mate ¡of ¡ specia8on ¡8me ¡ – the ¡phylogene8cs ¡ assump8on ¡holds ¡

slide-14
SLIDE 14

Population Genetic Interpretation of Speciation

  • τ<<Ne: ¡ ¡

– τ+T ¡is ¡approximately ¡T ¡ – Coalescent ¡8me ¡ dominates ¡ – Equivalent ¡to ¡the ¡ coalescent ¡in ¡popula8on ¡ gene8cs ¡

slide-15
SLIDE 15

Population Genetic Interpretation of Speciation

  • τ~Ne: ¡ ¡

– Both ¡ancestral ¡ popula8on ¡dynamics ¡and ¡ interspecies ¡divergence ¡ must ¡be ¡considered ¡ – Popula8on-­‑aware ¡ phylogene8cs ¡

slide-16
SLIDE 16

Three-Species Phylogeny

  • Three ¡species ¡X, ¡Y, ¡and ¡Z ¡with ¡

specia8on ¡8me ¡and ¡coalescent ¡8me ¡

– X: ¡human ¡ – Y: ¡chimpanzee ¡ – Z: ¡gorilla ¡

  • Ancestral ¡popula8ons: ¡XY ¡and ¡XYZ ¡
  • Black ¡phylogeny: ¡discordance ¡with ¡

the ¡phylogeny ¡among ¡the ¡three ¡ species ¡

  • Gray ¡phylogeny: ¡concordant ¡with ¡the ¡

phylogeny ¡among ¡the ¡three ¡species ¡

  • ILS: ¡incomplete ¡lineage ¡sor8ng ¡with ¡

deep ¡coalescent ¡

– Gene ¡tree ¡and ¡species ¡tree ¡can ¡differ ¡

slide-17
SLIDE 17

Three-Species Phylogeny

  • Incomplete ¡lineage ¡sor8ng ¡

– The ¡probability ¡that ¡X ¡and ¡Y ¡ will ¡coalesce ¡before ¡the ¡ divergence ¡from ¡Z ¡ ¡ ¡ ¡ ¡where ¡ ¡ ¡Nxy: ¡popula8on ¡size ¡of ¡XY ¡

slide-18
SLIDE 18

Three-Species Phylogeny

  • When ¡Nxy, ¡Nxyz ¡are ¡

small, ¡τxy ¡and ¡τxyz ¡ approximate ¡the ¡ divergence ¡8me ¡well ¡

  • Otherwise, ¡the ¡

coalescent ¡8me ¡Txy, ¡Txyz ¡ need ¡to ¡be ¡taken ¡into ¡ account ¡

slide-19
SLIDE 19

Ancestral Recombination Graph for Three Individuals

  • Different ¡genealogies ¡for ¡

different ¡regions ¡of ¡a ¡ chromosome ¡due ¡to ¡ recombina8on ¡

  • Ancestral ¡recombina8on ¡graph ¡

represents ¡a ¡marginal ¡ genealogy ¡that ¡summarizes ¡ the ¡genealogies ¡across ¡the ¡ whole ¡chromosome ¡

  • Most ¡recent ¡common ¡ancestor ¡

(MRCA): ¡all ¡chromosomes ¡ eventually ¡coalesce ¡to ¡the ¡ common ¡ancestor ¡

Ancestral ¡Recombina8on ¡ Graph ¡

slide-20
SLIDE 20

Ancestral Recombination Graph for Three Individuals

  • Phylogene8c ¡ancestral ¡

recombina8on ¡graph ¡

– Recombina8ons ¡and ¡ coalescence ¡are ¡ constrained ¡by ¡the ¡ phylogene8c ¡tree ¡

Phylogene8c ¡ Ancestral ¡Recombina8on ¡ Graph ¡

slide-21
SLIDE 21

What if We Ignore Incomplete Lineage Sorting

  • Aligned ¡human ¡(Hom), ¡chimpanzee ¡(Pan), ¡gorilla ¡(Gor), ¡
  • rangutan ¡(Pon) ¡sequences ¡
  • Two ¡different ¡es8mated ¡lineages ¡
  • Without ¡considera8on ¡of ¡ILS, ¡subs8tu8on ¡rates ¡are ¡
  • veres8mated ¡
slide-22
SLIDE 22

Coal-HMM (Hobolth et al., 2009)

  • Four ¡states ¡

corresponding ¡to ¡ different ¡ phylogenies ¡with ¡ ILS ¡

  • Transi8ons ¡to ¡
  • ther ¡states ¡

correspond ¡to ¡ recombina8ons ¡

slide-23
SLIDE 23

Coal-HMM

  • HC1 ¡state ¡(with ¡no ¡ILS) ¡explains ¡only ¡~50% ¡of ¡sites ¡
  • Remaining ¡states ¡explain ¡the ¡other ¡50% ¡propor8oned ¡roughly ¡

equally ¡

slide-24
SLIDE 24

Summary

  • Popula8on ¡gene8cs ¡considers ¡the ¡difference ¡in ¡genome ¡

sequences ¡within ¡a ¡species, ¡whereas ¡phylogenomics ¡considers ¡ the ¡genome ¡sequence ¡difference ¡across ¡species ¡

  • For ¡recently ¡diverged ¡species ¡with ¡rela8vely ¡small ¡popula8on ¡

sizes, ¡one ¡needs ¡to ¡consider ¡phylogene8cs ¡and ¡popula8on ¡ gene8cs ¡ideas ¡simultaneously ¡