Making sense of DNA methyla4on data Peter Hickey - - PowerPoint PPT Presentation

making sense of dna methyla4on data
SMART_READER_LITE
LIVE PREVIEW

Making sense of DNA methyla4on data Peter Hickey - - PowerPoint PPT Presentation

Making sense of DNA methyla4on data Peter Hickey @PeteHaitch 15 September 2014 How I spend my 4me Oh, youre a sta/s/cian How I've


slide-1
SLIDE 1

Making ¡sense ¡of ¡ ¡ DNA ¡methyla4on ¡data ¡

Peter ¡Hickey ¡ ¡ @PeteHaitch ¡ 15 ¡September ¡2014 ¡

slide-2
SLIDE 2

“Oh, ¡you’re ¡a ¡sta/s/cian…” ¡

How ¡I ¡spend ¡my ¡4me ¡

slide-3
SLIDE 3

Coding RA work Writing Analyses Talk preparation Seminars Exercise Japanese study Reading papers Email and admin Tutoring Meetings 200 400 600

Hours

How I've spent my time since 13 January, 2014

slide-4
SLIDE 4

How ¡I ¡spend ¡my ¡4me ¡

hEp://gifurl.com/gifs/1145 ¡

slide-5
SLIDE 5

How ¡I ¡spend ¡my ¡4me ¡

hEp://wifflegif.com/gifs/511132-­‑richard-­‑ayoade-­‑the-­‑it-­‑crowd-­‑gif ¡

slide-6
SLIDE 6

Project ¡aim ¡

How ¡to ¡analyse ¡whole-­‑genome ¡bisulfite-­‑sequencing ¡ experiments ¡to ¡learn ¡about ¡DNA ¡methyla<on? ¡ ¡

slide-7
SLIDE 7

hEps://www.flickr.com/photos/theloushe/4640871734 ¡

Exploratory ¡data ¡analyses ¡

slide-8
SLIDE 8

hEp://tstoaddicts.files.wordpress.com/2013/08/simpsons-­‑ques4ons.gif ¡

Developing ¡methods ¡

slide-9
SLIDE 9

hEp://www.mhjaso.com/blog/wp-­‑content/uploads/2014/06/Homer-­‑Tries-­‑to-­‑Build-­‑a-­‑Barbeque-­‑Set.jpg ¡

Implemen4ng ¡methods ¡

slide-10
SLIDE 10

hEp://cdn.amazinganimalstories.com/wp-­‑content/uploads/2013/11/ATT00038.jpg ¡

Collabora4on ¡

slide-11
SLIDE 11

5mCs ¡and ¡one ¡assay ¡

slide-12
SLIDE 12

ACGCGAAACGTTCTATCGG TGCGCTTTGCAAGATAGCC

slide-13
SLIDE 13

ACGCGAAACGTTCTATCGG TGCGCTTTGCAAGATAGCC

slide-14
SLIDE 14

m m m m . ACGCGAAACGTTCTATCGG TGCGCTTTGCAAGATAGCC m m m.

slide-15
SLIDE 15

"Cytosine ¡becomes ¡thymine" ¡by ¡CFCF ¡-­‑ ¡Own ¡work. ¡Licensed ¡under ¡Crea4ve ¡Commons ¡AEribu4on-­‑Share ¡Alike ¡3.0 ¡via ¡Wikimedia ¡Commons ¡-­‑ ¡ hEp://commons.wikimedia.org/wiki/File:Cytosine_becomes_thymine.png#mediaviewer/File:Cytosine_becomes_thymine.png ¡

slide-16
SLIDE 16

"Cytosine ¡becomes ¡thymine" ¡by ¡CFCF ¡-­‑ ¡Own ¡work. ¡Licensed ¡under ¡Crea4ve ¡Commons ¡AEribu4on-­‑Share ¡Alike ¡3.0 ¡via ¡Wikimedia ¡Commons ¡-­‑ ¡ hEp://commons.wikimedia.org/wiki/File:Cytosine_becomes_thymine.png#mediaviewer/File:Cytosine_becomes_thymine.png ¡

slide-17
SLIDE 17

ACGCGAAACGTTCTATCGG TGCGCTTTGCAAGATAGCC

slide-18
SLIDE 18

m m m m . ACGCGAAACGTTCTATCGG TGCGCTTTGCAAGATAGCC m m m.

slide-19
SLIDE 19

hEp://episona.com/wp-­‑content/uploads/2014/01/Agou4-­‑Mouse-­‑1024x802.jpg ¡

slide-20
SLIDE 20

hEp://www.ous-­‑research.no/kristensen/images/projects/Promoter_methyla4on.jpg ¡

Expressed ¡ Not ¡expressed ¡

slide-21
SLIDE 21

hEp://www.ous-­‑research.no/kristensen/images/projects/Promoter_methyla4on.jpg ¡

Expressed ¡ Not ¡expressed ¡

slide-22
SLIDE 22

Cancer ¡Genome ¡Atlas ¡Research ¡Network. ¡"Integrated ¡genomic ¡analyses ¡of ¡

  • varian ¡carcinoma." ¡Nature ¡474.7353 ¡(2011): ¡609-­‑615. ¡

AMT ¡ Gene ¡expression ¡ Promoter ¡methyla4on ¡

0 ¡ 1 ¡

  • ­‑4 ¡

0 ¡ 2 ¡

  • ­‑2 ¡
slide-23
SLIDE 23

Cancer ¡Genome ¡Atlas ¡Research ¡Network. ¡"Integrated ¡genomic ¡analyses ¡of ¡

  • varian ¡carcinoma." ¡Nature ¡474.7353 ¡(2011): ¡609-­‑615. ¡

AMT ¡ Gene ¡expression ¡ Promoter ¡methyla4on ¡

0 ¡ 1 ¡

  • ­‑4 ¡

0 ¡ 2 ¡

  • ­‑2 ¡

hEp://commons.wikimedia.org/wiki/File:Calico_cat_-­‑ _Phoebe.jpg#mediaviewer/File:Calico_cat_-­‑_Phoebe.jpg ¡

slide-24
SLIDE 24

Cancer ¡Genome ¡Atlas ¡Research ¡Network. ¡"Integrated ¡genomic ¡analyses ¡of ¡

  • varian ¡carcinoma." ¡Nature ¡474.7353 ¡(2011): ¡609-­‑615. ¡

AMT ¡ Gene ¡expression ¡ Promoter ¡methyla4on ¡

0 ¡ 1 ¡

  • ­‑4 ¡

0 ¡ 2 ¡

  • ­‑2 ¡

hEp://commons.wikimedia.org/wiki/File:Calico_cat_-­‑ _Phoebe.jpg#mediaviewer/File:Calico_cat_-­‑_Phoebe.jpg ¡ hEp://commons.wikimedia.org/wiki/File%3ABlastocyst_embryo.png ¡

slide-25
SLIDE 25

m m m m . ACGCGAAACGTTCTATCGG TGCGCTTTGCAAGATAGCC m m m

  • ACGTGAAACGAACTATCGG

m m m.

slide-26
SLIDE 26

m m m m . ACGCGAAACGTTCTATCGG TGCGCTTTGCAAGATAGCC m m m

  • ACGTGAAACGAACTATCGG

m m m.

slide-27
SLIDE 27

m m m m . ACGCGAAACGTTCTATCGG + Sodium ¡bisulfite ¡ = ¡ ACGTGAAACGAACTATCGG m m m.

slide-28
SLIDE 28

m m m m . ACGCGAAACGTTCTATCGG + PCR ¡amplifica4on ¡ = ¡ ACGTGAAACGAACTATCGG m m m.

slide-29
SLIDE 29

m m m m . ACGCGAAACGTTCTATCGG + PCR ¡amplifica4on ¡ = ¡ ACGCGAAACGTTCTATCGG m m m.

slide-30
SLIDE 30

m m m m . ACGCGAAACGTTCTATCGG + Sodium ¡bisulfite ¡ = ¡ ACGTGAAACGAACTATCGG m m m.

slide-31
SLIDE 31

m m m m . ACGCGAAACGTTCTATCGG + Sodium ¡bisulfite ¡ = ¡ ACGTGAAACGAACTATCGG m m m.

slide-32
SLIDE 32

m m m m . ACGCGAAACGTTCTATCGG + Sodium ¡bisulfite ¡ = ¡ ACGUGAAACGTTCTATCGG m m m.

slide-33
SLIDE 33

m m m m . ACGUGAAACGTTCTATCGG + PCR ¡ = ¡ ACGTGAAACGAACTATCGG m m m.

slide-34
SLIDE 34

m m m m . ACGUGAAACGTTCTATCGG + PCR ¡amplifica4on ¡ = ¡ ACGTGAAACGAACTATCGG m m m.

slide-35
SLIDE 35

m m m m . ACGUGAAACGTTCTATCGG + PCR ¡amplifica4on ¡ = ¡ ACGTGAAACGTTCTATCGG m m m.

slide-36
SLIDE 36

m m m m . ACGUGAAACGTTCTATCGG + PCR ¡amplifica4on ¡ = ¡ ACGTGAAACGTTCTATCGG m m m.

slide-37
SLIDE 37

Bisulfite ¡treatment ¡of ¡DNA ¡ + ¡ ¡ ¡ ¡ ¡ = ¡ Whole-­‑genome ¡bisulfite-­‑sequencing ¡

slide-38
SLIDE 38

ACGCGAAACGTTCTATCG

slide-39
SLIDE 39

ACGCGAAACGTTCTATCG

slide-40
SLIDE 40
slide-41
SLIDE 41
slide-42
SLIDE 42
slide-43
SLIDE 43
slide-44
SLIDE 44

β1 = 3/3

slide-45
SLIDE 45

β2 = 4/4

slide-46
SLIDE 46

β3 = 2/4

slide-47
SLIDE 47

β4 = 0/4

slide-48
SLIDE 48

0.0 0.5 1.0 1000 2000 3000 4000

Position (bp) β−value

Cov 25 50 75 sample sample1 sample2 sample3 sample4 sample5

slide-49
SLIDE 49

CpG island

0.0 0.5 1.0 1000 2000 3000 4000

Position (bp) β−value

Cov 25 50 75 sample sample1 sample2 sample3 sample4 sample5

slide-50
SLIDE 50

CpG island

gene

0.0 0.5 1.0 1000 2000 3000 4000

Position (bp) β−value

Cov 25 50 75 sample sample1 sample2 sample3 sample4 sample5

slide-51
SLIDE 51

CpG island

gene

0.0 0.5 1.0 1000 2000 3000 4000

Position (bp) β−value Coverage

20 40 60

sample sample1

Data: ¡Emma ¡Whitelaw ¡

slide-52
SLIDE 52

Lister ¡data ¡

ADS ¡ ADS-­‑adipose ¡ ADS-­‑iPSC ¡ Organism ¡ Human ¡(female) ¡ Human ¡(female) ¡ Human ¡(female) ¡ Cell ¡type ¡ Soma4c ¡ Soma4c ¡ Induced ¡pluripotent ¡stem ¡ cell ¡(iPSC) ¡ Descrip/on ¡ Adipose ¡ Adipocytes ¡derived ¡from ¡ ADS ¡ iPSC ¡line ¡derived ¡from ¡ADS ¡ Sequencing ¡ 75 ¡bp ¡paired-­‑end ¡ 75 ¡bp ¡paired-­‑end ¡ 75 ¡bp ¡paired-­‑end ¡ Average ¡ coverage ¡ 23× ¡ 24× ¡ 26× ¡ ¡

Lister, ¡Ryan, ¡et ¡al. ¡"Hotspots ¡of ¡aberrant ¡epigenomic ¡reprogramming ¡in ¡human ¡induced ¡pluripotent ¡stem ¡ cells." ¡Nature ¡471.7336 ¡(2011): ¡68-­‑73. ¡

slide-53
SLIDE 53

ADS ADS−adipose ADS−iPSC 2,000,000 4,000,000 0.00 0.25 0.50 0.75 1.00 0.00 0.25 0.50 0.75 1.00 0.00 0.25 0.50 0.75 1.00

β count

slide-54
SLIDE 54

ADS ADS−adipose ADS−iPSC 2,000,000 4,000,000 0.00 0.25 0.50 0.75 1.00 0.00 0.25 0.50 0.75 1.00 0.00 0.25 0.50 0.75 1.00

β count

CpG island Non CpG island

slide-55
SLIDE 55

CpG island

gene

0.0 0.5 1.0 1000 2000 3000 4000

Position (bp) β−value Coverage

20 40 60

sample sample1

Data: ¡Emma ¡Whitelaw ¡

slide-56
SLIDE 56

CpG island

gene

0.0 0.5 1.0 1000 2000 3000 4000

Position (bp) β−value Coverage

20 40 60

sample sample1

Data: ¡Emma ¡Whitelaw ¡

slide-57
SLIDE 57

CpG island

gene

0.0 0.5 1.0 1000 2000 3000 4000

Position (bp) β−value Coverage

20 40 60

sample sample1

Data: ¡Emma ¡Whitelaw ¡

slide-58
SLIDE 58

CpG island

gene

0.0 0.5 1.0 1000 2000 3000 4000

Position (bp) β−value

Cov 20 40 60

sample

mouse1 Data: ¡Emma ¡Whitelaw ¡

slide-59
SLIDE 59

CpG island

gene

0.0 0.5 1.0 1000 2000 3000 4000

Position (bp) β−value

Cov 25 50 75

sample

mouse1 mouse2 mouse3 mouse4 mouse5 Data: ¡Emma ¡Whitelaw ¡

slide-60
SLIDE 60

CpG island

gene

0.0 0.5 1.0 1000 2000 3000 4000

Position (bp) β−value

Cov 25 50 75

sample

mouse1 mouse2 mouse3 mouse4 mouse5 Data: ¡Emma ¡Whitelaw ¡

slide-61
SLIDE 61

Co-­‑methyla/on ¡

slide-62
SLIDE 62

Co-­‑methyla4on ¡= ¡co-­‑occurence ¡

“The ¡presence ¡of ¡methyla<on ¡over ¡a ¡stretch ¡of ¡ neighboring ¡CpG ¡posi<ons” ¡

Schatz, ¡Philipp, ¡Dimo ¡Dietrich, ¡and ¡MaEhias ¡Schuster. ¡"Rapid ¡analysis ¡of ¡CpG ¡methyla4on ¡paEerns ¡using ¡RNase ¡T1 ¡cleavage ¡and ¡MALDI-­‑TOF." ¡ Nucleic ¡acids ¡research ¡32.21 ¡(2004): ¡e167-­‑e167. ¡

slide-63
SLIDE 63

Co-­‑methyla4on ¡= ¡co-­‑occurence ¡

“The ¡presence ¡of ¡methyla<on ¡over ¡a ¡stretch ¡of ¡ neighboring ¡CpG ¡posi<ons” ¡

Schatz, ¡Philipp, ¡Dimo ¡Dietrich, ¡and ¡MaEhias ¡Schuster. ¡"Rapid ¡analysis ¡of ¡CpG ¡methyla4on ¡paEerns ¡using ¡RNase ¡T1 ¡cleavage ¡and ¡MALDI-­‑TOF." ¡ Nucleic ¡acids ¡research ¡32.21 ¡(2004): ¡e167-­‑e167. ¡

slide-64
SLIDE 64

Co-­‑methyla4on ¡= ¡co-­‑occurence ¡

“The ¡presence ¡of ¡methyla<on ¡over ¡a ¡stretch ¡of ¡ neighboring ¡CpG ¡posi<ons” ¡

Schatz, ¡Philipp, ¡Dimo ¡Dietrich, ¡and ¡MaEhias ¡Schuster. ¡"Rapid ¡analysis ¡of ¡CpG ¡methyla4on ¡paEerns ¡using ¡RNase ¡T1 ¡cleavage ¡and ¡MALDI-­‑TOF." ¡ Nucleic ¡acids ¡research ¡32.21 ¡(2004): ¡e167-­‑e167. ¡

slide-65
SLIDE 65

Co-­‑methyla4on ¡= ¡correla4on ¡

“The ¡rela<onship ¡between ¡the ¡degree ¡of ¡ methyla<on ¡over ¡distance” ¡

  • 1. Within-­‑fragment ¡co-­‑methyla4on ¡
  • 2. Correla4on ¡of ¡β-­‑values ¡

Eckhardt, ¡Florian, ¡et ¡al. ¡"DNA ¡methyla4on ¡profiling ¡of ¡human ¡chromosomes ¡6, ¡20 ¡and ¡22." ¡Nature ¡gene4cs ¡38.12 ¡(2006): ¡1378-­‑1385. ¡

slide-66
SLIDE 66

Co-­‑methyla4on ¡= ¡correla4on ¡

“The ¡rela<onship ¡between ¡the ¡degree ¡of ¡ methyla<on ¡over ¡distance” ¡

  • 1. Within-­‑fragment ¡co-­‑methyla4on ¡
  • 2. Correla4on ¡of ¡β-­‑values ¡

Eckhardt, ¡Florian, ¡et ¡al. ¡"DNA ¡methyla4on ¡profiling ¡of ¡human ¡chromosomes ¡6, ¡20 ¡and ¡22." ¡Nature ¡gene4cs ¡38.12 ¡(2006): ¡1378-­‑1385. ¡

slide-67
SLIDE 67

Co-­‑methyla4on ¡= ¡correla4on ¡

“The ¡rela<onship ¡between ¡the ¡degree ¡of ¡ methyla<on ¡over ¡distance” ¡

  • 1. Within-­‑fragment ¡co-­‑methyla4on ¡
  • 2. Correla4on ¡of ¡β-­‑values ¡

Eckhardt, ¡Florian, ¡et ¡al. ¡"DNA ¡methyla4on ¡profiling ¡of ¡human ¡chromosomes ¡6, ¡20 ¡and ¡22." ¡Nature ¡gene4cs ¡38.12 ¡(2006): ¡1378-­‑1385. ¡

slide-68
SLIDE 68

Co-­‑methyla4on ¡= ¡correla4on ¡

“The ¡rela<onship ¡between ¡the ¡degree ¡of ¡ methyla<on ¡over ¡distance” ¡

  • 1. Within-­‑fragment ¡co-­‑methyla/on ¡
  • 2. Correla4on ¡of ¡β-­‑values ¡

Eckhardt, ¡Florian, ¡et ¡al. ¡"DNA ¡methyla4on ¡profiling ¡of ¡human ¡chromosomes ¡6, ¡20 ¡and ¡22." ¡Nature ¡gene4cs ¡38.12 ¡(2006): ¡1378-­‑1385. ¡

slide-69
SLIDE 69 TYPE 38,721,970 bp 38,721,980 bp 38,721,990 bp 38,722,000 bp 38,722,010 bp 38,722,020 bp 38,722,030 bp 38,722,040 bp 38,722,050 bp 91 bp chr4 p16.2 p15.33 p15.31 p15.1 p14 p13 p11 q12 q13.1 q13.2 q21.1 q21.23 q22.2 q23 q24 q25 q26 q27 q28.2 q31.1 q31.22 q31.3 q32.2 q33 q34.2 q35.1 IMR90-iPSC coverage IMR90-iPSC [0 - 35] G A Sequence

RefSeq genes CpGs CpG islands

A G A G T A G C A A A C A C T A A T C T A C G A A T A A T G A A C A T A G G C A T T A T T T T A A G A A C C A A A A G A A A G C A C G T G G G C A T T T G G T T T A C A C A T C A C T

CpGs ¡

slide-70
SLIDE 70 NAME DATA TYPE DATA FILE 38,721,970 bp 38,721,980 bp 38,721,990 bp 38,722,000 bp 38,722,010 bp 38,722,020 bp 38,722,030 bp 38,722,040 bp 38,722,050 bp 91 bp chr4 p16.2 p15.33 p15.31 p15.1 p14 p13 p11 q12 q13.1 q13.2 q21.1 q21.23 q22.2 q23 q24 q25 q26 q27 q28.2 q31.1 q31.22 q31.3 q32.2 q33 q34.2 q35.1 IMR90-iPSC coverage IMR90-iPSC [0 - 35] G A Sequence

RefSeq genes CpGs CpG islands

A G A G T A G C A A A C A C T A A T C T A C G A A T A A T G A A C A T A G G C A T T A T T T T A A G A A C C A A A A G A A A G C A C G T G G G C A T T T G G T T T A C A C A T C A C T

CpGs ¡

slide-71
SLIDE 71 NAME DATA TYPE DATA FILE 38,721,970 bp 38,721,980 bp 38,721,990 bp 38,722,000 bp 38,722,010 bp 38,722,020 bp 38,722,030 bp 38,722,040 bp 38,722,050 bp 91 bp chr4 p16.2 p15.33 p15.31 p15.1 p14 p13 p11 q12 q13.1 q13.2 q21.1 q21.23 q22.2 q23 q24 q25 q26 q27 q28.2 q31.1 q31.22 q31.3 q32.2 q33 q34.2 q35.1 IMR90-iPSC coverage IMR90-iPSC [0 - 35] G A Sequence

RefSeq genes CpGs CpG islands

A G A G T A G C A A A C A C T A A T C T A C G A A T A A T G A A C A T A G G C A T T A T T T T A A G A A C C A A A A G A A A G C A C G T G G G C A T T T G G T T T A C A C A T C A C T

Second CpG Methylated Unmethylated Total First CpG Methylated 1 2 3 Unmethylated 4 4 Total 1 6 7

CpGs ¡

slide-72
SLIDE 72 NAME DATA TYPE DATA FILE 38,721,970 bp 38,721,980 bp 38,721,990 bp 38,722,000 bp 38,722,010 bp 38,722,020 bp 38,722,030 bp 38,722,040 bp 38,722,050 bp 91 bp chr4 p16.2 p15.33 p15.31 p15.1 p14 p13 p11 q12 q13.1 q13.2 q21.1 q21.23 q22.2 q23 q24 q25 q26 q27 q28.2 q31.1 q31.22 q31.3 q32.2 q33 q34.2 q35.1 IMR90-iPSC coverage IMR90-iPSC [0 - 35] G A Sequence

RefSeq genes CpGs CpG islands

A G A G T A G C A A A C A C T A A T C T A C G A A T A A T G A A C A T A G G C A T T A T T T T A A G A A C C A A A A G A A A G C A C G T G G G C A T T T G G T T T A C A C A T C A C T

Second CpG Methylated Unmethylated Total First CpG Methylated 1 2 3 Unmethylated 4 4 Total 1 6 7

log-odds ratio = log2 1.5 × 4.5 2.5 × 0.5

( ) =2.4

CpGs ¡

slide-73
SLIDE 73

Do ¡this ¡50 ¡million ¡4mes ¡per ¡sample ¡

chr strand pos1 pos2 MM MU UM UU chr1 + 469 471 0 5 1 0 chr1 + 471 484 1 0 4 1 chr1 + 484 489 3 2 1 0 chr1 + 489 493 4 2 1 1 chr1 + 493 497 4 1 3 0 chr1 + 497 525 6 0 1 0 chr1 + 525 542 4 0 0 0 chr1 + 525 563 1 0 0 0 ... ... ... ... ... ... ... ...

slide-74
SLIDE 74

Do ¡this ¡50 ¡million ¡4mes ¡per ¡sample ¡

slide-75
SLIDE 75

methtuple

www.github.com/PeteHaitch/methtuple ¡

slide-76
SLIDE 76

10000 20000 30000 40000 −4 −2 2 4 6 8

log2−odds ratio count

ADS: Distance between CpGs = 10 bp

slide-77
SLIDE 77

−4 −2 2 4 6 8 10000 20000 30000 40000

count log2−odds ratio

ADS: Distance = 10 bp

slide-78
SLIDE 78

−4 −2 2 4 6 8 10000 20000 30000 40000

count log2−odds ratio

ADS: Distance = 10 bp

10% 25% 50% 75% 90%

−4 −2 2 4 6 8 50 100 150 200 250

Distance between CpGs (bp) log2−odds ratio

ADS: Distribution of log2−odds ratio

slide-79
SLIDE 79

−4 −2 2 4 6 8 10000 20000 30000 40000

count log2−odds ratio

ADS: Distance = 10 bp

10% 25% 50% 75% 90%

−4 −2 2 4 6 8 50 100 150 200 250

Distance between CpGs (bp) log2−odds ratio

ADS: Distribution of log2−odds ratio

slide-80
SLIDE 80

−4 −2 2 4 6 8 10000 20000 30000 40000

count log2−odds ratio

ADS: Distance = 10 bp

10% 25% 50% 75% 90%

−4 −2 2 4 6 8 50 100 150 200 250

Distance between CpGs (bp) log2−odds ratio

ADS: Distribution of log2−odds ratio

slide-81
SLIDE 81

10% 25% 50% 75% 90%

−4 −2 2 4 6 8 50 100 150 200 250

Distance between CpGs (bp) log2−odds ratio

ADS: Distribution of log2−odds ratio

slide-82
SLIDE 82

10% 25% 50% 75% 90%

−4 −2 2 4 6 8 50 100 150 200

Distance between CpGs (bp) log2−odds ratio

quantile 10 25 50 75 90

ADS: Distribution of log2−odds ratio

slide-83
SLIDE 83

ADS ADS−adipose ADS−iPSC −2 2 4 6 50 100 150 200 0 50 100 150 200 0 50 100 150 200

Distance between CpGs (bp) log2−odds ratio

quantile 10 25 50 75 90

slide-84
SLIDE 84

CpG island Non CpG island 0.0 2.5 5.0 0.0 2.5 5.0 0.0 2.5 5.0 ADS ADS−adipose ADS−iPSC 50 100 150 200 50 100 150 200

Distance between CpGs (bp) log2−odds ratio

CGI CpG island Non CpG island quantile 10 25 50 75 90

slide-85
SLIDE 85

Co-­‑methyla4on ¡= ¡correla4on ¡

“The ¡rela<onship ¡between ¡the ¡degree ¡of ¡ methyla<on ¡over ¡distance” ¡

  • 1. Within-­‑fragment ¡co-­‑methyla4on ¡
  • 2. Correla/on ¡of ¡β-­‑values ¡

Eckhardt, ¡Florian, ¡et ¡al. ¡"DNA ¡methyla4on ¡profiling ¡of ¡human ¡chromosomes ¡6, ¡20 ¡and ¡22." ¡Nature ¡gene4cs ¡38.12 ¡(2006): ¡1378-­‑1385. ¡

slide-86
SLIDE 86
slide-87
SLIDE 87
slide-88
SLIDE 88
slide-89
SLIDE 89

−1.0 −0.5 0.0 0.5 1.0 500 1000 1500

Distance between CpGs (bp) Pearson correlation

ADS: Correlation of β−values

slide-90
SLIDE 90

ADS ADS−adipose ADS−iPSC −1.0 −0.5 0.0 0.5 1.0 500 1000 1500 0 500 1000 1500 0 500 1000 1500

Distance between CpGs (bp) Pearson correlation

slide-91
SLIDE 91

ADS ADS−adipose ADS−iPSC −1.0 −0.5 0.0 0.5 1.0 100 200 300 400 500 0 100 200 300 400 500 0 100 200 300 400 500

Distance between CpGs (bp) Pearson correlation

slide-92
SLIDE 92

ADS ADS−adipose ADS−iPSC −1.0 −0.5 0.0 0.5 1.0 100 200 300 400 500 0 100 200 300 400 500 0 100 200 300 400 500

Distance between CpGs (bp) Pearson correlation

"Pioneer ¡Factor ¡rearrange ¡the ¡nucleosome" ¡by ¡Wenqiang ¡Shi ¡-­‑ ¡Own ¡work. ¡Licensed ¡under ¡Crea4ve ¡Commons ¡AEribu4on-­‑Share ¡Alike ¡ 3.0 ¡via ¡Wikimedia ¡Commons ¡-­‑ ¡hEp://commons.wikimedia.org/wiki/ File:Pioneer_Factor_rearrange_the_nucleosome.jpg#mediaviewer/File:Pioneer_Factor_rearrange_the_nucleosome.jpg ¡

slide-93
SLIDE 93

ADS ADS−adipose ADS−iPSC −1.0 −0.5 0.0 0.5 1.0 100 200 300 0 100 200 300 0 100 200 300

Distance between CpGs (bp) Pearson correlation

CpG island Non CpG island

slide-94
SLIDE 94

CGI

  • 1

2 3 4 1 0 1

values density

data

Real (ADS) methsim

Distribution of values

1 1

CGI

  • 250

500 750 1000

Distance between CpGs (bp)

Pearson correlation

data

Real (ADS) methsim

Correlations of pairs of values

4 4

CGI

  • 50

100 150 200

Distance between CpGs (bp)

median log odds ratio

data

Real (ADS) methsim

Within haplotype co-methylation at neighbouring CpGs

methsim

www.github.com/PeteHaitch/methsim ¡

slide-95
SLIDE 95

Methylome ¡of ¡the ¡agou/ ¡viable ¡yellow ¡ mouse ¡(Avy) ¡

Some ¡of ¡these ¡mice ¡are ¡not ¡like ¡the ¡others ¡(we ¡hope…) ¡

slide-96
SLIDE 96

Morgan, ¡Hugh ¡D., ¡et ¡al. ¡"Epigene4c ¡inheritance ¡at ¡the ¡agou4 ¡locus ¡in ¡the ¡mouse." ¡Nature ¡gene4cs ¡23.3 ¡(1999): ¡314-­‑318. ¡

Methylated ¡Avy ¡ ¡ Unmethylated ¡Avy ¡ ¡

slide-97
SLIDE 97

Experimental ¡design ¡

C57BL/6 ¡ Isogenic* ¡

slide-98
SLIDE 98

Experimental ¡design ¡

C57BL/6 ¡ Isogenic* ¡

"Liver ¡(transparent)" ¡by ¡Mikael ¡Häggström ¡-­‑ ¡File:Human ¡Hepar.jpg. ¡Licensed ¡under ¡Public ¡domain ¡via ¡Wikimedia ¡Commons ¡– ¡ ¡ hEp://commons.wikimedia.org/wiki/File:Liver_(transparent).png#mediaviewer/File:Liver_(transparent).png ¡

slide-99
SLIDE 99

Experimental ¡design ¡

C57BL/6 ¡ Isogenic* ¡

slide-100
SLIDE 100

Experimental ¡design ¡

a/a ¡ a/a ¡ a/a ¡ Avy/a ¡ Avy/a ¡

C57BL/6 ¡ Isogenic* ¡

slide-101
SLIDE 101

Experimental ¡design ¡

a/a ¡ a/a ¡ a/a ¡ Avy/a ¡ Avy/a ¡

LiEermates ¡

slide-102
SLIDE 102

Experimental ¡design ¡

a/a ¡ a/a ¡ a/a ¡ Avy/a ¡ Avy/a ¡

Avy ¡+ ¡3 ¡Mb ¡of ¡C3H ¡

slide-103
SLIDE 103

Experimental ¡design ¡

a/a ¡ a/a ¡ a/a ¡ Avy/a ¡ Avy/a ¡

slide-104
SLIDE 104

Experimental ¡design ¡

a/a ¡ a/a ¡ a/a ¡ Avy/a ¡ Avy/a ¡

+ ¡ 30× ¡whole-­‑genome ¡bisulfite-­‑sequencing ¡ = ¡ ¡ epialleles ¡

slide-105
SLIDE 105

Experimental ¡design ¡

a/a ¡ a/a ¡ a/a ¡ Avy/a ¡ Avy/a ¡

+ ¡ 30× ¡whole-­‑genome ¡bisulfite-­‑sequencing ¡ = ¡ ¡ $$$$$ ¡

slide-106
SLIDE 106

Experimental ¡design ¡

a/a ¡ a/a ¡ a/a ¡ Avy/a ¡ Avy/a ¡

+ ¡ 30× ¡whole-­‑genome ¡bisulfite-­‑sequencing ¡ = ¡ ¡ epialleles ¡

slide-107
SLIDE 107

Epialleles ¡

a/a ¡ a/a ¡ a/a ¡ Avy/a ¡ Avy/a ¡

slide-108
SLIDE 108

Epialleles ¡

a/a ¡ a/a ¡ a/a ¡ Avy/a ¡ Avy/a ¡

slide-109
SLIDE 109

Epialleles ¡

a/a ¡ a/a ¡ a/a ¡ Avy/a ¡ Avy/a ¡

slide-110
SLIDE 110

Method ¡

  • 1. Some ¡of ¡these ¡mice ¡are ¡not ¡like ¡the ¡others? ¡
  • 2. Is ¡my ¡neighbour ¡also ¡different? ¡
  • 3. Is ¡my ¡neighbour ¡different ¡in ¡the ¡same ¡way ¡as ¡

me? ¡

slide-111
SLIDE 111

Some ¡of ¡these ¡mice ¡are ¡not ¡like ¡the ¡others? ¡

Mouse1 ¡ Mouse2 ¡ Mouse3 ¡ Mouse4 ¡ Mouse5 ¡ Methylated ¡ 17 ¡ 31 ¡ 15 ¡ 23 ¡ 9 ¡ Unmethylated ¡ 1 ¡ 3 ¡ 0 ¡ 1 ¡ 1 ¡

P-­‑value ¡= ¡0.76 ¡

slide-112
SLIDE 112

Some ¡of ¡these ¡mice ¡are ¡not ¡like ¡the ¡others? ¡

Mouse1 ¡ Mouse2 ¡ Mouse3 ¡ Mouse4 ¡ Mouse5 ¡ Methylated ¡ 38 ¡ 79 ¡ 59 ¡ 69 ¡ 44 ¡ Unmethylated ¡ 1 ¡ 2 ¡ 1 ¡ 2 ¡ 46 ¡

P-­‑value ¡= ¡2 ¡× ¡10-­‑25 ¡ ¡ ¡

slide-113
SLIDE 113

Some ¡of ¡these ¡mice ¡are ¡not ¡like ¡the ¡others? ¡ P-­‑value ¡< ¡threshold ¡ à ¡(candidate) ¡differen4ally ¡methylated ¡CpG ¡(DMC) ¡

Mouse1 ¡ Mouse2 ¡ Mouse3 ¡ Mouse4 ¡ Mouse5 ¡ Methylated ¡ 38 ¡ 79 ¡ 59 ¡ 69 ¡ 44 ¡ Unmethylated ¡ 1 ¡ 2 ¡ 1 ¡ 2 ¡ 46 ¡

P-­‑value ¡= ¡2 ¡× ¡10-­‑25 ¡ ¡ ¡

slide-114
SLIDE 114

Is ¡my ¡neighbour ¡also ¡different? ¡

slide-115
SLIDE 115

"Run-­‑DMC ¡Logo” ¡Licensed ¡under ¡Public ¡domain ¡via ¡Wikimedia ¡Commons ¡-­‑ ¡hEp://commons.wikimedia.org/ wiki/File:Run-­‑DMC_Logo.svg#mediaviewer/File:Run-­‑DMC_Logo.svg ¡

slide-116
SLIDE 116

Is ¡my ¡neighbour ¡also ¡different? ¡

  • 1. Find ¡runs ¡of ¡CpGs ¡ ¡

– P-­‑value ¡< ¡threshold ¡ ¡ – Within ¡distance ¡of ¡next ¡CpG ¡ – Some ¡allowance ¡for ¡missing ¡or ¡“insignificant” ¡CpGs ¡

  • 2. Filter ¡candidate ¡runs ¡

– Run ¡contains ¡enough ¡CpGs ¡

slide-117
SLIDE 117

Is ¡my ¡neighbour ¡different ¡in ¡the ¡same ¡ way ¡as ¡me? ¡

slide-118
SLIDE 118

0.00 0.25 0.50 0.75 1.00 1000 1100 1200 1300

start β sample

mouse1 mouse2 mouse3 mouse4 mouse5

An inconsistent candidate region

Data: ¡Emma ¡Whitelaw ¡

slide-119
SLIDE 119

0.00 0.25 0.50 0.75 1.00 1000 1100 1200 1300

start β sample

mouse1 mouse2 mouse3 mouse4 mouse5

An inconsistent candidate region

Data: ¡Emma ¡Whitelaw ¡

slide-120
SLIDE 120

Is ¡my ¡neighbour ¡different ¡in ¡the ¡same ¡ way ¡as ¡me? ¡

  • Flag ¡regions ¡with ¡3-­‑way ¡interac4on ¡between ¡

sample ¡× ¡methyla4on ¡level ¡× ¡posi4on ¡

– Not ¡quite ¡what ¡we ¡want ¡ – So ¡plot, ¡plot, ¡plot ¡ ¡

slide-121
SLIDE 121

CpG island

gene

0.0 0.5 1.0 1000 2000 3000 4000

Position (bp) β−value

Cov 25 50 75

sample

mouse1 mouse2 mouse3 mouse4 mouse5 Data: ¡Emma ¡Whitelaw ¡

slide-122
SLIDE 122

Summary ¡

How ¡I ¡work, ¡what ¡I ¡found, ¡and ¡what ¡I’m ¡proud ¡of ¡

slide-123
SLIDE 123

“Doesn’t ¡the ¡gardener ¡lavish ¡more ¡care ¡on ¡ the ¡thorns ¡than ¡on ¡the ¡flowers” ¡

"Agnon" ¡of ¡Unknown ¡-­‑ ¡The ¡David ¡B. ¡Keidan ¡Collec4on ¡of ¡Digital ¡Images ¡from ¡the ¡Central ¡Zionist ¡Archives ¡(via ¡Harvard ¡University ¡Library). ¡ Licensed ¡under ¡the ¡Public ¡Domain ¡via ¡Wikimedia ¡Commons ¡-­‑ ¡hEp://commons.wikimedia.org/wiki/File:Agnon.jpg#mediaviewer/File:Agnon.jpg ¡

  • ­‑ ¡Hartman ¡in ¡Metamorphisis ¡by ¡S.Y. ¡Agnon ¡

Via ¡@erichlya ¡

slide-124
SLIDE 124

“You ¡can ¡observe ¡a ¡lot ¡by ¡watching” ¡

"Yogi ¡Berra ¡1956" ¡by ¡unknown ¡-­‑ ¡Baseball ¡Digest, ¡front ¡cover, ¡September ¡1956 ¡issue. ¡[1]. ¡Licensed ¡under ¡Public ¡domain ¡via ¡Wikimedia ¡Commons ¡

  • ­‑ ¡hEp://commons.wikimedia.org/wiki/File:Yogi_Berra_1956.png#mediaviewer/File:Yogi_Berra_1956.png ¡
  • ­‑ ¡Yogi ¡Berra ¡
slide-125
SLIDE 125
  • ­‑ ¡Robert ¡Van ¡Winkle ¡

a.k.a. ¡Vanilla ¡Ice ¡

hEp://4.bp.blogspot.com/-­‑N-­‑caq8YoBaQ/UpPZs5EChnI/AAAAAAAABIw/Pb8g7jjJJGA/s1600/Stop+Collaborate.jpg ¡

slide-126
SLIDE 126
  • ­‑ ¡Robert ¡Van ¡Winkle ¡

a.k.a. ¡Vanilla ¡Ice ¡

hEp://4.bp.blogspot.com/-­‑N-­‑caq8YoBaQ/UpPZs5EChnI/AAAAAAAABIw/Pb8g7jjJJGA/s1600/Stop+Collaborate.jpg ¡

slide-127
SLIDE 127

What ¡I ¡found ¡

  • Es4mated ¡strong ¡spa4al ¡dependence ¡of ¡DNA ¡

methyla4on ¡

  • Cell-­‑type ¡differences ¡in ¡dependence ¡structure ¡
  • Evidence ¡of ¡higher ¡order ¡chroma4n ¡structure ¡

in ¡spa4al ¡dependence ¡data ¡

slide-128
SLIDE 128

What ¡I ¡found ¡

  • Es4mated ¡strong ¡spa4al ¡dependence ¡of ¡DNA ¡

methyla4on ¡

  • Cell-­‑type ¡differences ¡in ¡dependence ¡structure ¡
  • Evidence ¡of ¡higher ¡order ¡chroma4n ¡structure ¡

in ¡spa4al ¡dependence ¡data ¡

slide-129
SLIDE 129

What ¡I ¡found ¡

  • Es4mated ¡strong ¡spa4al ¡dependence ¡of ¡DNA ¡

methyla4on ¡

  • Cell-­‑type ¡differences ¡in ¡dependence ¡structure ¡
  • Evidence ¡of ¡higher ¡order ¡chroma4n ¡structure ¡

in ¡spa4al ¡dependence ¡data ¡

slide-130
SLIDE 130

What ¡I’m ¡proud ¡of ¡

www.github.com/PeteHaitch ¡

slide-131
SLIDE 131

Acknowledgements ¡

Terry ¡Speed ¡ Peter ¡Hall ¡

slide-132
SLIDE 132

Acknowledgements ¡

Data ¡

– Ryan ¡Lister ¡et ¡al. ¡(UWA, ¡Salk ¡ Ins4tute) ¡ ¡ – Sue ¡Clark, ¡Aaron ¡Statham ¡(Garvan ¡ Ins4tute) ¡ – Emma ¡Whitelaw, ¡Harry ¡Oey ¡(La ¡ Trobe) ¡ – Kasper ¡Hansen, ¡Rafael ¡Irizarry ¡ (Johns ¡Hopkins, ¡Harvard) ¡ – Everyone ¡who ¡makes ¡their ¡data ¡ publicly ¡available ¡

Methodology ¡& ¡technology ¡

– Kasper ¡Hansen, ¡Rafael ¡Irizarry ¡ (Johns ¡Hopkins, ¡Harvard) ¡ – Felix ¡Krueger ¡(Babraham ¡Ins4tute) ¡ – Toby ¡Sargeant ¡(WEHI) ¡ – Keith ¡SaEerley ¡(WEHI) ¡ – Bioconductor ¡developers ¡ – WEHI ¡Bioinforma4cs ¡ – Everyone ¡who ¡makes ¡their ¡ soSware ¡open ¡source ¡

Sanity: ¡Family ¡and ¡friends ¡

Funding: ¡APA ¡and ¡VLSCI ¡ Sanity: ¡Family ¡and ¡friends ¡

slide-133
SLIDE 133

Acknowledgements ¡

Data ¡

– Ryan ¡Lister ¡et ¡al. ¡(UWA, ¡Salk ¡ Ins4tute) ¡ ¡ – Sue ¡Clark, ¡Aaron ¡Statham ¡(Garvan ¡ Ins4tute) ¡ – Emma ¡Whitelaw, ¡Harry ¡Oey ¡(La ¡ Trobe) ¡ – Kasper ¡Hansen, ¡Rafael ¡Irizarry ¡ (Johns ¡Hopkins, ¡Harvard) ¡ – Everyone ¡who ¡makes ¡their ¡data ¡ publicly ¡available ¡

Methodology ¡& ¡technology ¡

– Kasper ¡Hansen, ¡Rafael ¡Irizarry ¡ (Johns ¡Hopkins, ¡Harvard) ¡ – Felix ¡Krueger ¡(Babraham ¡Ins4tute) ¡ – Toby ¡Sargeant ¡(WEHI) ¡ – Keith ¡SaEerley ¡(WEHI) ¡ – Bioconductor ¡developers ¡ – WEHI ¡Bioinforma4cs ¡ – Everyone ¡who ¡makes ¡their ¡ soSware ¡open ¡source ¡

Sanity: ¡Family ¡and ¡friends ¡

Funding: ¡APA ¡and ¡VLSCI ¡ Sanity: ¡Family ¡and ¡friends ¡

slide-134
SLIDE 134

Acknowledgements ¡

Data ¡

– Ryan ¡Lister ¡et ¡al. ¡(UWA, ¡Salk ¡ Ins4tute) ¡ ¡ – Sue ¡Clark, ¡Aaron ¡Statham ¡(Garvan ¡ Ins4tute) ¡ – Emma ¡Whitelaw, ¡Harry ¡Oey ¡(La ¡ Trobe) ¡ – Kasper ¡Hansen, ¡Rafael ¡Irizarry ¡ (Johns ¡Hopkins, ¡Harvard) ¡ – Everyone ¡who ¡makes ¡their ¡data ¡ publicly ¡available ¡

Methodology ¡& ¡technology ¡

– Kasper ¡Hansen, ¡Rafael ¡Irizarry ¡ (Johns ¡Hopkins, ¡Harvard) ¡ – Felix ¡Krueger ¡(Babraham ¡Ins4tute) ¡ – Toby ¡Sargeant ¡(WEHI) ¡ – Keith ¡SaEerley ¡(WEHI) ¡ – Bioconductor ¡developers ¡ – WEHI ¡Bioinforma4cs ¡ – Everyone ¡who ¡makes ¡their ¡ soSware ¡open ¡source ¡

Sanity: ¡Family ¡and ¡friends ¡

Funding: ¡APA ¡and ¡VLSCI ¡ Sanity: ¡Family ¡and ¡friends ¡

slide-135
SLIDE 135

Acknowledgements ¡

Data ¡

– Ryan ¡Lister ¡et ¡al. ¡(UWA, ¡Salk ¡ Ins4tute) ¡ ¡ – Sue ¡Clark, ¡Aaron ¡Statham ¡(Garvan ¡ Ins4tute) ¡ – Emma ¡Whitelaw, ¡Harry ¡Oey ¡(La ¡ Trobe) ¡ – Kasper ¡Hansen, ¡Rafael ¡Irizarry ¡ (Johns ¡Hopkins, ¡Harvard) ¡ – Everyone ¡who ¡makes ¡their ¡data ¡ publicly ¡available ¡

Methodology ¡& ¡technology ¡

– Kasper ¡Hansen, ¡Rafael ¡Irizarry ¡ (Johns ¡Hopkins, ¡Harvard) ¡ – Felix ¡Krueger ¡(Babraham ¡Ins4tute) ¡ – Toby ¡Sargeant ¡(WEHI) ¡ – Keith ¡SaEerley ¡(WEHI) ¡ – Bioconductor ¡developers ¡ – WEHI ¡Bioinforma4cs ¡ – Everyone ¡who ¡makes ¡their ¡ soSware ¡open ¡source ¡

Sanity: ¡Family ¡and ¡friends ¡

Funding: ¡APA ¡and ¡VLSCI ¡ Sanity: ¡Family ¡and ¡friends ¡

slide-136
SLIDE 136

hEp://s18.photobucket.com/user/endriquelimones/media/tensographics_math.jpg.html ¡

Biology ¡ Sta4s4cs ¡ Bioinforma4cs ¡

www.peterhickey.org/presenta4ons ¡