SLIDE 1
Nucleosome Positioning 02-715 Advanced Topics in Computa8onal - - PowerPoint PPT Presentation
Nucleosome Positioning 02-715 Advanced Topics in Computa8onal - - PowerPoint PPT Presentation
Nucleosome Positioning 02-715 Advanced Topics in Computa8onal Genomics Nucleosome Core Nucleosome Core and Linker 147 bp DNA wrapping around nucleosome core Varying
SLIDE 2
SLIDE 3
Nucleosome Core and Linker
- 147 ¡bp ¡DNA ¡wrapping ¡
around ¡nucleosome ¡core ¡
- Varying ¡lengths ¡of ¡linkers ¡
between ¡adjacent ¡cores ¡
Linker ¡
SLIDE 4
Predicting Nucleosome Positions
- Many ¡studies ¡reported ¡evidence ¡that ¡nucleosome ¡posi8ons ¡can ¡be ¡
predicted ¡based ¡on ¡DNA ¡sequences ¡
– Enrichment ¡of ¡specific ¡short ¡DNA ¡sequences ¡in ¡the ¡nucleosome ¡occupied ¡ regions ¡ – Both ¡sequen8al ¡and ¡rota8onal ¡nucleosome ¡posi8ons ¡can ¡be ¡predicted ¡ – 10 ¡bp ¡periodicity ¡of ¡certain ¡dinucleo8des ¡as ¡nucleosome ¡affinity ¡feature ¡ ¡
- The ¡period ¡matches ¡the ¡pitch ¡of ¡the ¡DNA ¡helix ¡
- encourage ¡the ¡large-‑scale ¡bending ¡of ¡the ¡DNA ¡molecule ¡necessary ¡to ¡
form ¡a ¡nucleosome ¡ – an ¡enrichment ¡of ¡AA ¡dinucleo8des ¡toward ¡the ¡5’ ¡end ¡of ¡the ¡nucleosome ¡ – nucleosome-‑inhibi8ng ¡rather ¡than ¡nucleosome-‑forming ¡(exclusion ¡signals ¡ than ¡occupancy ¡signals) ¡
- Mono-‑nucleo8de ¡paSern ¡around ¡the ¡dyad ¡posi8on ¡predicts ¡the ¡
nucleosome ¡posi8ons ¡accurately. ¡(Reynolds ¡et ¡al., ¡2010) ¡
SLIDE 5
Datasets
- H. ¡sapiens ¡
– Experimentally ¡determined ¡438,652 ¡nucleosome ¡posi8ons ¡ ¡ – Derived ¡from ¡the ¡histone ¡methyla8on ¡ChIP-‑seq ¡data ¡from ¡CD4+ ¡T-‑cells ¡ a^er ¡MNase ¡diges8on ¡
- S. ¡cerevisiae ¡
– 380,000 ¡nucleosomal ¡sequences ¡
SLIDE 6
Constructing Sequence Patterns
- Examine ¡a ¡window ¡of ¡size ¡W ¡surrounding ¡the ¡dyad ¡posi8ons ¡
- Compute ¡how ¡o^en ¡each ¡k-‑mer ¡is ¡observed ¡within ¡a ¡window ¡for ¡
each ¡nucleosome ¡
- Average ¡the ¡k-‑mer ¡counts ¡over ¡all ¡N ¡nucleosomes ¡in ¡the ¡data ¡
- The ¡k-‑mer ¡paSern ¡Pm ¡at ¡loca8on ¡j, ¡with ¡the ¡loca8on ¡rela8ve ¡to ¡the ¡
dyad ¡posi8on ¡
- S[j1:j2] ¡: ¡subsequence ¡from ¡j1=j+k-‑1 ¡to ¡j2=j+k+K-‑1 ¡
- R[j1:j2] ¡examines ¡the ¡reverse ¡complement ¡
SLIDE 7
DNA Sequence and Nucleosome Positioning
- Mono-‑nucleo8de ¡paSern ¡in ¡H. ¡Sapiens ¡
Derived ¡ from ¡Barski ¡ nucleosome ¡ posi8ons ¡ Derived ¡ from ¡ Schones ¡ nucleosome ¡ posi8ons ¡
SLIDE 8
Mono-nucleotide Patterns around Dyads
- G/C ¡are ¡symmetric ¡with ¡respect ¡to ¡the ¡dyad ¡
- T/A ¡are ¡symmetric ¡with ¡respect ¡to ¡the ¡dyad ¡
- A/C ¡are ¡symmetric ¡with ¡respect ¡to ¡the ¡horizontal ¡line ¡
- T/G ¡are ¡symmetric ¡with ¡respect ¡to ¡the ¡horizontal ¡line ¡
SLIDE 9
Sequence Content in Nucleosome- Occupied Regions
- In ¡the ¡nucleosome ¡core, ¡the ¡average ¡GC ¡content ¡is ¡
significantly ¡higher ¡than ¡the ¡average ¡AT ¡content. ¡
SLIDE 10
DNA Sequence and Nucleosome Positioning
- Dinucleo8de ¡A/T ¡and ¡G/C ¡paSerns ¡
SLIDE 11
Predicting Nucleosome Positions
- Train ¡dataset ¡
– Posi8ve ¡examples: ¡Extract ¡k-‑mer ¡paSerns ¡(k=1,2,3) ¡from ¡the ¡ nucleosome-‑occupied ¡regions ¡of ¡the ¡DNA ¡sequence ¡ – Nega8ve ¡examples: ¡extract ¡the ¡same ¡features ¡from ¡the ¡linker ¡ sequences ¡
SLIDE 12
Predicting Nucleosome Positions
- Building ¡a ¡SVM ¡classifier ¡ ¡
– Features ¡to ¡be ¡used ¡for ¡the ¡classifier ¡
- Correla8on ¡score ¡between ¡the ¡sequence ¡x ¡to ¡be ¡classified ¡and ¡the ¡
Pm ¡scores ¡extracted ¡from ¡posi8ve ¡training ¡set ¡ ¡ ¡ ¡ ¡ ¡where ¡
- K-‑mer ¡count ¡in ¡the ¡sequence ¡to ¡be ¡classified ¡
SLIDE 13
Predicting Nucleosome Positions
- ROC ¡curves ¡for ¡on ¡H. ¡sapiens ¡and ¡S. ¡cerevisiae ¡datasets ¡
SLIDE 14
Predicting Nucleosome Positions
- Classifica8on ¡performance ¡and ¡DNA ¡sequence ¡features ¡used ¡
in ¡classifica8on ¡
SLIDE 15
Nucleosome Positioning
- The ¡average ¡linker ¡length ¡between ¡adjacent ¡nucleosomes ¡
defines ¡the ¡nucleosome ¡repeat ¡length, ¡which ¡in ¡turn ¡affects ¡ the ¡structure ¡and ¡size ¡of ¡the ¡30nm ¡fiber ¡in ¡a ¡larger ¡chroma8n ¡ structure ¡
- Distribu8on ¡of ¡distances ¡between ¡successive ¡nucleosome ¡
dyad ¡posi8ons ¡
SLIDE 16
Nucleosome Positioning and Repetitive Sequences
- Average ¡dyad ¡scores ¡
for ¡AluSx ¡repe88ve ¡ element ¡
- Predicted ¡dyad ¡
posi8ons ¡at ¡40bp ¡and ¡ 210 ¡bp ¡rela8ve ¡to ¡the ¡ start ¡of ¡the ¡313 ¡bp ¡long ¡ repe88ve ¡element. ¡
- Alu ¡sequences ¡have ¡
been ¡shown ¡to ¡ facilitate ¡the ¡forma8on ¡
- f ¡nucleosomes ¡in ¡vivo ¡
SLIDE 17
TF and Nucleosome Binding Positions
- Dyad ¡posi8ons ¡with ¡
respect ¡to ¡TSS ¡for ¡four ¡ different ¡TF ¡categories ¡
– Red: ¡response ¡to ¡stress ¡ – Green: ¡transla8on ¡ – Dark ¡blue: ¡ribosome ¡ biogenesis ¡and ¡assembly ¡ – Light ¡blue: ¡organelle ¡
- rganiza8on ¡and ¡
biogenesis ¡
SLIDE 18
DBN for Predicting Nucleosome Positioning
- Many ¡methods ¡for ¡predic8ng ¡nucleosome ¡posi8ons ¡
– HMMs ¡for ¡linker-‑dyad-‑linker ¡sites ¡based ¡on ¡experimental ¡data ¡ – Infer ¡sequence ¡paSerns ¡from ¡experimental ¡data, ¡and ¡use ¡it ¡as ¡features ¡ in ¡classifica8on ¡
- Combine ¡the ¡two ¡ideas ¡using ¡DBN ¡that ¡incorporates ¡mul8ple ¡
evidence ¡track ¡(experimental ¡data ¡+ ¡DNA ¡sequence ¡specificity) ¡
– scores ¡from ¡a ¡DNA-‑sequence ¡model ¡of ¡nucleosome ¡posi8oning: ¡the ¡
- utput ¡(log-‑ra8o ¡scores) ¡from ¡the ¡binary ¡classifier ¡built ¡on ¡k-‑mer ¡
sequence ¡features ¡ – nucleosome-‑occupancy ¡data ¡from ¡a ¡high-‑throughput ¡sequencing ¡ experiment ¡ – a ¡transcrip8on ¡factor ¡landscape ¡
SLIDE 19
DBN State Transition Diagram
- Three ¡states ¡for ¡
nucleosome ¡core ¡states ¡
– Dyad ¡(5bp) ¡ – 5/ ¡and ¡3’ ¡turns ¡(71 ¡bp ¡ each) ¡
- Two ¡states ¡for ¡linker ¡
states ¡
– First ¡state ¡with ¡fixed ¡linker ¡ length ¡(9bp) ¡ – Second ¡state ¡with ¡ geometrically ¡distributed ¡ linker ¡length ¡
SLIDE 20
DBN for Predicting Nucleosome Position
- Integra8ng ¡mul8ple ¡sources ¡of ¡informa8on ¡
– Sequence ¡model ¡scores: ¡scores ¡from ¡a ¡DNA-‑sequence ¡model ¡of ¡ nucleosome ¡posi8oning ¡
- qi=0: ¡non-‑dyad ¡state ¡
- qi=1: ¡dyad ¡state ¡
– Experimental ¡data ¡on ¡nucleosome ¡occupancy ¡derived ¡from ¡ microarray/sequencing ¡assays ¡
SLIDE 21
DBN for Predicting Nucleosome Position
- Integra8ng ¡mul8ple ¡sources ¡of ¡informa8on ¡
– Transcrip8on ¡factor ¡binding ¡probabili8es ¡
- Rela8ve ¡affinity ¡of ¡a ¡binding ¡site ¡for ¡a ¡TF ¡given ¡as ¡posi8on ¡weight ¡
matrix ¡(PWM) ¡
- Assumes ¡TF ¡only ¡binds ¡in ¡the ¡linker ¡state: ¡ ¡
– qi=0: ¡any ¡state ¡ – qi=1: ¡either ¡of ¡the ¡two ¡linker ¡state ¡ ¡
SLIDE 22
DBN for Predicting Nucleosome Position
- Integra8ng ¡mul8ple ¡sources ¡of ¡informa8on ¡
Virtual ¡ evidence ¡
SLIDE 23
DBN for Predicting Nucleosome Position
- Determinis8c ¡rela8onship ¡
between ¡state ¡si, ¡the ¡label ¡qi, ¡ and ¡the ¡virtual ¡evidence ¡ci ¡ – P(ci=1| ¡si, ¡qi) ¡= ¡I(si, ¡qi) ¡
- 1 ¡ ¡if ¡si ¡and ¡qi ¡are ¡consistent, ¡
- therwise ¡0 ¡
- P(qi=Q) ¡= ¡1/Q ¡(Uniform ¡
distribu8on) ¡
SLIDE 24
Incorporating Experimental Data and Sequence Scores in DBN
- S. ¡cerevisiae ¡chromosome ¡II ¡
Only ¡ experimental ¡ data ¡as ¡evidence ¡ Experimental ¡ data ¡and ¡ nucleosome-‑ binding ¡ sequence ¡scores ¡ as ¡evidence ¡
SLIDE 25
Incorporating Experimental Data and Sequence Scores in DBN
- Uniform ¡distribu8on ¡for ¡linker ¡length ¡
– In ¡the ¡presence ¡of ¡experimental ¡data, ¡the ¡predicted ¡nucleosome ¡ posi8ons ¡track ¡the ¡experimental ¡data ¡more ¡closely ¡ – In ¡the ¡absence ¡of ¡experimental ¡data, ¡there ¡is ¡a ¡greater ¡uncertainty ¡in ¡ the ¡length ¡of ¡linker ¡
SLIDE 26
TF Binding and Nucleosome Positioning
- TFs ¡dynamically ¡compete ¡with ¡nucleosomes ¡for ¡an ¡access ¡to ¡
DNA ¡
- Incorporate ¡TF ¡binding ¡informa8on ¡into ¡the ¡DBN ¡
– Scan ¡the ¡genome ¡with ¡112 ¡TF ¡sequence ¡specifici8es ¡to ¡es8mate ¡TF-‑ binding ¡landscape ¡ – Include ¡TF ¡binding ¡sequence ¡scores ¡and ¡Nucleosome-‑binding ¡ sequence ¡scores ¡as ¡evidence ¡tracks ¡in ¡the ¡DBN ¡
SLIDE 27
Integrating TF Binding Data
- S. ¡cerevisiae ¡chromosome ¡II: ¡compe88on ¡with ¡transcrip8on ¡
factors ¡destabilizes ¡weakly ¡posi8oned ¡nucleosomes ¡
SLIDE 28
Integrating TF Binding Data
- 600bp ¡region ¡between ¡two ¡genes ¡GAL10 ¡and ¡GAL1, ¡with ¡
strong ¡matches ¡for ¡several ¡TFs ¡including ¡SIG1 ¡and ¡PHO2 ¡
- Transcrip8on ¡start ¡sites ¡are ¡predicted ¡to ¡weakly ¡bind ¡with ¡
nucleosomes ¡
- Including ¡TF ¡binding ¡informa8on ¡nearly ¡eliminates ¡the ¡