Nucleosome Positioning 02-715 Advanced Topics in Computa8onal - - PowerPoint PPT Presentation

nucleosome positioning
SMART_READER_LITE
LIVE PREVIEW

Nucleosome Positioning 02-715 Advanced Topics in Computa8onal - - PowerPoint PPT Presentation

Nucleosome Positioning 02-715 Advanced Topics in Computa8onal Genomics Nucleosome Core Nucleosome Core and Linker 147 bp DNA wrapping around nucleosome core Varying


slide-1
SLIDE 1

Nucleosome Positioning

02-­‑715 ¡Advanced ¡Topics ¡in ¡Computa8onal ¡ Genomics ¡

slide-2
SLIDE 2

Nucleosome Core

slide-3
SLIDE 3

Nucleosome Core and Linker

  • 147 ¡bp ¡DNA ¡wrapping ¡

around ¡nucleosome ¡core ¡

  • Varying ¡lengths ¡of ¡linkers ¡

between ¡adjacent ¡cores ¡

Linker ¡

slide-4
SLIDE 4

Predicting Nucleosome Positions

  • Many ¡studies ¡reported ¡evidence ¡that ¡nucleosome ¡posi8ons ¡

can ¡be ¡predicted ¡based ¡on ¡DNA ¡sequences ¡

– Enrichment ¡of ¡specific ¡short ¡DNA ¡sequences ¡in ¡the ¡nucleosome ¡

  • ccupied ¡regions ¡

– Both ¡sequen8al ¡and ¡rota8onal ¡nucleosome ¡posi8ons ¡can ¡be ¡predicted ¡

  • Mono-­‑nucleo8de ¡paNern ¡around ¡the ¡dyad ¡posi8on ¡predicts ¡

the ¡nucleosome ¡posi8ons ¡accurately. ¡(Reynolds ¡et ¡al., ¡2010) ¡

slide-5
SLIDE 5

Datasets

  • H. ¡sapiens ¡

– Experimentally ¡determined ¡438,652 ¡nucleosome ¡posi8ons ¡ ¡ – Derived ¡from ¡the ¡histone ¡methyla8on ¡ChIP-­‑seq ¡data ¡from ¡CD4+ ¡T-­‑cells ¡

  • S. ¡cerevisiae ¡

– 380,000 ¡nucleosomal ¡sequences ¡

slide-6
SLIDE 6

Constructing Sequence Patterns

  • Examine ¡a ¡window ¡of ¡size ¡W ¡surrounding ¡the ¡dyad ¡posi8ons ¡
  • Compute ¡how ¡o_en ¡each ¡k-­‑mer ¡is ¡observed ¡within ¡a ¡window ¡for ¡

each ¡nucleosome ¡

  • Average ¡the ¡k-­‑mer ¡counts ¡over ¡all ¡nucleosomes ¡in ¡the ¡data ¡
  • The ¡k-­‑mer ¡paNern ¡Pm ¡at ¡loca8on ¡j, ¡with ¡the ¡loca8on ¡rela8ve ¡to ¡the ¡

dyad ¡posi8on ¡

  • S[j1:j2] ¡: ¡subsequence ¡from ¡j1=j+k-­‑1 ¡to ¡j2=j+k+K-­‑1 ¡
  • R[j1:j2] ¡examines ¡the ¡reverse ¡complement ¡
slide-7
SLIDE 7

DNA Sequence and Nucleosome Positioning

  • Mono-­‑nucleo8de ¡paNern ¡in ¡H. ¡Sapiens ¡

Derived ¡ from ¡Barski ¡ nucleosome ¡ posi8ons ¡ Derived ¡ from ¡ Schones ¡ nucleosome ¡ posi8ons ¡

slide-8
SLIDE 8

Mono-nucleotide Patterns around Dyads

  • G/C ¡are ¡symmetric ¡with ¡respect ¡to ¡the ¡dyad ¡
  • T/A ¡are ¡symmetric ¡with ¡respect ¡to ¡the ¡dyad ¡
  • A/C ¡are ¡symmetric ¡with ¡respect ¡to ¡the ¡horizontal ¡line ¡
  • T/G ¡are ¡symmetric ¡with ¡respect ¡to ¡the ¡horizontal ¡line ¡
slide-9
SLIDE 9

Sequence Content in Nucleosome- Occupied Regions

  • In ¡the ¡nucleosome ¡core, ¡the ¡average ¡GC ¡content ¡is ¡

significantly ¡higher ¡than ¡the ¡average ¡AT ¡content. ¡

slide-10
SLIDE 10

DNA Sequence and Nucleosome Positioning

  • Dinucleo8de ¡A/T ¡and ¡G/C ¡paNerns ¡
slide-11
SLIDE 11

Predicting Nucleosome Positions

  • Train ¡dataset ¡

– Posi8ve ¡examples: ¡Extract ¡k-­‑mer ¡paNerns ¡(k=1,2,3) ¡from ¡the ¡ nucleosome-­‑occupied ¡regions ¡of ¡the ¡DNA ¡sequence ¡ – Nega8ve ¡examples: ¡extract ¡the ¡same ¡features ¡from ¡the ¡linker ¡ sequences ¡

  • Building ¡a ¡SVM ¡classifier ¡ ¡

– Features ¡to ¡be ¡used ¡for ¡the ¡classifier ¡

  • Correla8on ¡score ¡between ¡the ¡sequence ¡to ¡be ¡classified ¡and ¡the ¡

Pm ¡scores ¡

  • K-­‑mer ¡count ¡in ¡the ¡sequence ¡to ¡be ¡classified ¡
slide-12
SLIDE 12

Predicting Nucleosome Positions

  • ROC ¡curves ¡for ¡on ¡H. ¡sapiens ¡and ¡S. ¡cerevisiae ¡datasets ¡
slide-13
SLIDE 13

Predicting Nucleosome Positions

  • Classifica8on ¡performance ¡and ¡DNA ¡sequence ¡features ¡used ¡

in ¡classifica8on ¡

slide-14
SLIDE 14

Nucleosome Positioning

  • Distribu8on ¡of ¡distances ¡between ¡successive ¡nucleosome ¡

dyad ¡posi8ons ¡

slide-15
SLIDE 15

Nucleosome Positioning and Repetitive Sequences

  • Average ¡dyad ¡scores ¡

for ¡AluSx ¡repe88ve ¡ element ¡

  • Predicted ¡dyad ¡

posi8ons ¡at ¡40bp ¡and ¡ 210 ¡bp ¡rela8ve ¡to ¡the ¡ start ¡of ¡the ¡313 ¡bp ¡ long ¡repe88ve ¡

  • element. ¡
slide-16
SLIDE 16

TF and Nucleosome Binding Positions

  • Dyad ¡posi8ons ¡with ¡

respect ¡to ¡TSS ¡for ¡four ¡ different ¡TF ¡categories ¡

– Red: ¡response ¡to ¡stress ¡ – Green: ¡transla8on ¡ – Dark ¡blue: ¡ribosome ¡ biogenesis ¡and ¡assembly ¡ – Light ¡blue: ¡organelle ¡

  • rganiza8on ¡and ¡

biogenesis ¡

slide-17
SLIDE 17

DBN for Predicting Nucleosome Positioning

  • Many ¡methods ¡for ¡predic8ng ¡nucleosome ¡posi8ons ¡

– HMMs ¡for ¡linker-­‑dyad-­‑linker ¡sites ¡based ¡on ¡experimental ¡data ¡ – Infer ¡sequence ¡paNerns ¡from ¡experimental ¡data, ¡and ¡use ¡it ¡as ¡features ¡ in ¡classifica8on ¡

  • Combine ¡the ¡two ¡ideas ¡using ¡DBN ¡that ¡incorporates ¡mul8ple ¡

evidence ¡track ¡

slide-18
SLIDE 18

DBN State Transition Diagram

  • Three ¡states ¡for ¡

nucleosome ¡core ¡states ¡

– Dyad ¡(5bp) ¡ – 5/ ¡and ¡3’ ¡turns ¡(71 ¡bp ¡ each) ¡

  • Two ¡states ¡for ¡linker ¡

states ¡

– First ¡state ¡with ¡fixed ¡linker ¡ length ¡(9bp) ¡ – Second ¡state ¡with ¡ geometrically ¡distributed ¡ linker ¡length ¡

slide-19
SLIDE 19

DBN for Predicting Nucleosome Position

  • Integra8ng ¡mul8ple ¡sources ¡of ¡informa8on ¡

– Sequence ¡model ¡scores: ¡scores ¡from ¡a ¡DNA-­‑sequence ¡model ¡of ¡ nucleosome ¡posi8oning ¡

  • qi=0: ¡non-­‑dyad ¡state ¡
  • qi=1: ¡dyad ¡state ¡

– Experimental ¡data ¡on ¡nucleosome ¡occupancy ¡derived ¡from ¡ microarray/sequencing ¡assays ¡

slide-20
SLIDE 20

DBN for Predicting Nucleosome Position

  • Integra8ng ¡mul8ple ¡sources ¡of ¡informa8on ¡

– Transcrip8on ¡factor ¡binding ¡probabili8es ¡

  • Rela8ve ¡affinity ¡of ¡a ¡binding ¡site ¡for ¡a ¡TF ¡given ¡as ¡posi8on ¡weight ¡

matrix ¡(PWM) ¡

  • Assumes ¡TF ¡only ¡binds ¡in ¡the ¡linker ¡state: ¡ ¡

– qi=0: ¡any ¡state ¡ – qi=1: ¡either ¡of ¡the ¡two ¡linker ¡state ¡ ¡

slide-21
SLIDE 21

DBN for Predicting Nucleosome Position

  • Integra8ng ¡mul8ple ¡sources ¡of ¡informa8on ¡
slide-22
SLIDE 22

DBN for Predicting Nucleosome Position

  • Determinis8c ¡rela8onship ¡

between ¡state ¡si, ¡the ¡label ¡ci, ¡ and ¡the ¡virtual ¡evidence ¡ci ¡ – P(ci=1| ¡si, ¡qi) ¡= ¡I(si, ¡qi) ¡

  • 1 ¡ ¡if ¡si ¡and ¡qi ¡are ¡consistent, ¡
  • therwise ¡0 ¡
  • P(qi=Q) ¡= ¡1/Q ¡(Uniform ¡

distribu8on) ¡

slide-23
SLIDE 23

Incorporating Experimental Data and Sequence Scores in DBN

  • S. ¡cerevisiae ¡chromosome ¡II ¡

Only ¡ experimental ¡ data ¡as ¡evidence ¡ Experimental ¡ data ¡and ¡ nucleosome-­‑ binding ¡ sequence ¡scores ¡ as ¡evidence ¡

slide-24
SLIDE 24

Incorporating Experimental Data and Sequence Scores in DBN

  • Uniform ¡distribu8on ¡for ¡linker ¡length ¡

– In ¡the ¡presence ¡of ¡experimental ¡data, ¡the ¡predicted ¡nucleosome ¡ posi8ons ¡track ¡the ¡experimental ¡data ¡more ¡closely ¡ – In ¡the ¡absence ¡of ¡experimental ¡data, ¡there ¡is ¡a ¡greater ¡uncertainty ¡in ¡ the ¡length ¡of ¡linker ¡

slide-25
SLIDE 25

TF Binding and Nucleosome Positioning

  • TFs ¡dynamically ¡complete ¡with ¡nucleosomes ¡for ¡an ¡access ¡to ¡

DNA ¡

  • Incorporate ¡TF ¡binding ¡informa8on ¡into ¡the ¡DBN ¡

– Scan ¡the ¡genome ¡with ¡112 ¡TF ¡sequence ¡specifici8es ¡to ¡es8mate ¡TF-­‑ binding ¡landscape ¡ – Include ¡TF ¡binding ¡sequence ¡scores ¡and ¡Nucleosome-­‑binding ¡ sequence ¡scores ¡as ¡evidence ¡tracks ¡in ¡the ¡DBN ¡

slide-26
SLIDE 26

Integrating TF Binding Data

  • S. ¡cerevisiae ¡chromosome ¡II: ¡compe88on ¡with ¡transcrip8on ¡

factors ¡destabilizes ¡weakly ¡posi8oned ¡nucleosomes ¡

slide-27
SLIDE 27

Integrating TF Binding Data

  • 600bp ¡region ¡between ¡two ¡genes ¡GAL10 ¡and ¡GAL1, ¡with ¡

strong ¡matches ¡for ¡several ¡TFs ¡including ¡SIG1 ¡and ¡PHO2 ¡

  • Transcrip8on ¡start ¡sites ¡are ¡predicted ¡to ¡weakly ¡bind ¡with ¡

nucleosomes ¡

  • Including ¡TF ¡binding ¡informa8on ¡nearly ¡eliminates ¡the ¡

possibility ¡of ¡nucleosome ¡binding ¡at ¡the ¡transcrip8on ¡start ¡ sites ¡