nucleosome positioning
play

Nucleosome Positioning 02-715 Advanced Topics in Computa8onal - PowerPoint PPT Presentation

Nucleosome Positioning 02-715 Advanced Topics in Computa8onal Genomics Nucleosome Core Nucleosome Core and Linker 147 bp DNA wrapping around nucleosome core Varying


  1. Nucleosome Positioning 02-­‑715 ¡Advanced ¡Topics ¡in ¡Computa8onal ¡ Genomics ¡

  2. Nucleosome Core

  3. Nucleosome Core and Linker • 147 ¡bp ¡DNA ¡wrapping ¡ around ¡nucleosome ¡core ¡ • Varying ¡lengths ¡of ¡linkers ¡ between ¡adjacent ¡cores ¡ Linker ¡

  4. Predicting Nucleosome Positions • Many ¡studies ¡reported ¡evidence ¡that ¡nucleosome ¡posi8ons ¡can ¡be ¡ predicted ¡based ¡on ¡DNA ¡sequences ¡ – Enrichment ¡of ¡specific ¡short ¡DNA ¡sequences ¡in ¡the ¡nucleosome ¡occupied ¡ regions ¡ – Both ¡sequen8al ¡and ¡rota8onal ¡nucleosome ¡posi8ons ¡can ¡be ¡predicted ¡ – 10 ¡bp ¡periodicity ¡of ¡certain ¡dinucleo8des ¡as ¡nucleosome ¡affinity ¡feature ¡ ¡ • The ¡period ¡matches ¡the ¡pitch ¡of ¡the ¡DNA ¡helix ¡ • encourage ¡the ¡large-­‑scale ¡bending ¡of ¡the ¡DNA ¡molecule ¡necessary ¡to ¡ form ¡a ¡nucleosome ¡ – an ¡enrichment ¡of ¡AA ¡dinucleo8des ¡toward ¡the ¡5’ ¡end ¡of ¡the ¡nucleosome ¡ – nucleosome-­‑inhibi8ng ¡rather ¡than ¡nucleosome-­‑forming ¡(exclusion ¡signals ¡ than ¡occupancy ¡signals) ¡ • Mono-­‑nucleo8de ¡paSern ¡around ¡the ¡dyad ¡posi8on ¡predicts ¡the ¡ nucleosome ¡posi8ons ¡accurately. ¡ (Reynolds ¡et ¡al., ¡2010) ¡

  5. Datasets • H. ¡sapiens ¡ – Experimentally ¡determined ¡438,652 ¡nucleosome ¡posi8ons ¡ ¡ – Derived ¡from ¡the ¡histone ¡methyla8on ¡ChIP-­‑seq ¡data ¡from ¡CD4 + ¡T-­‑cells ¡ a^er ¡MNase ¡diges8on ¡ • S. ¡cerevisiae ¡ – 380,000 ¡nucleosomal ¡sequences ¡

  6. Constructing Sequence Patterns • Examine ¡a ¡window ¡of ¡size ¡W ¡surrounding ¡the ¡dyad ¡posi8ons ¡ • Compute ¡how ¡o^en ¡each ¡k-­‑mer ¡is ¡observed ¡within ¡a ¡window ¡for ¡ each ¡nucleosome ¡ • Average ¡the ¡k-­‑mer ¡counts ¡over ¡all ¡N ¡nucleosomes ¡in ¡the ¡data ¡ • The ¡k-­‑mer ¡paSern ¡P m ¡at ¡loca8on ¡j, ¡with ¡the ¡loca8on ¡rela8ve ¡to ¡the ¡ dyad ¡posi8on ¡ • S[j 1 :j 2 ] ¡: ¡subsequence ¡from ¡j 1 =j+k-­‑1 ¡to ¡j 2 =j+k+K-­‑1 ¡ • R[j 1 :j 2 ] ¡examines ¡the ¡reverse ¡complement ¡

  7. DNA Sequence and Nucleosome Positioning • Mono-­‑nucleo8de ¡paSern ¡in ¡H. ¡Sapiens ¡ Derived ¡ from ¡Barski ¡ nucleosome ¡ posi8ons ¡ Derived ¡ from ¡ Schones ¡ nucleosome ¡ posi8ons ¡

  8. Mono-nucleotide Patterns around Dyads • G/C ¡are ¡symmetric ¡with ¡respect ¡to ¡the ¡dyad ¡ • T/A ¡are ¡symmetric ¡with ¡respect ¡to ¡the ¡dyad ¡ • A/C ¡are ¡symmetric ¡with ¡respect ¡to ¡the ¡horizontal ¡line ¡ • T/G ¡are ¡symmetric ¡with ¡respect ¡to ¡the ¡horizontal ¡line ¡

  9. Sequence Content in Nucleosome- Occupied Regions • In ¡the ¡nucleosome ¡core, ¡the ¡average ¡GC ¡content ¡is ¡ significantly ¡higher ¡than ¡the ¡average ¡AT ¡content. ¡

  10. DNA Sequence and Nucleosome Positioning • Dinucleo8de ¡A/T ¡and ¡G/C ¡paSerns ¡

  11. Predicting Nucleosome Positions • Train ¡dataset ¡ – Posi8ve ¡examples: ¡Extract ¡k-­‑mer ¡paSerns ¡(k=1,2,3) ¡from ¡the ¡ nucleosome-­‑occupied ¡regions ¡of ¡the ¡DNA ¡sequence ¡ – Nega8ve ¡examples: ¡extract ¡the ¡same ¡features ¡from ¡the ¡linker ¡ sequences ¡

  12. Predicting Nucleosome Positions • Building ¡a ¡SVM ¡classifier ¡ ¡ – Features ¡to ¡be ¡used ¡for ¡the ¡classifier ¡ • Correla8on ¡score ¡between ¡the ¡sequence ¡x ¡to ¡be ¡classified ¡and ¡the ¡ P m ¡scores ¡extracted ¡from ¡posi8ve ¡training ¡set ¡ ¡ ¡ ¡ ¡ ¡where ¡ • K-­‑mer ¡count ¡in ¡the ¡sequence ¡to ¡be ¡classified ¡

  13. Predicting Nucleosome Positions • ROC ¡curves ¡for ¡on ¡H. ¡sapiens ¡and ¡S. ¡cerevisiae ¡datasets ¡

  14. Predicting Nucleosome Positions • Classifica8on ¡performance ¡and ¡DNA ¡sequence ¡features ¡used ¡ in ¡classifica8on ¡

  15. Nucleosome Positioning • The ¡average ¡linker ¡length ¡between ¡adjacent ¡nucleosomes ¡ defines ¡the ¡nucleosome ¡repeat ¡length, ¡which ¡in ¡turn ¡affects ¡ the ¡structure ¡and ¡size ¡of ¡the ¡30nm ¡fiber ¡in ¡a ¡larger ¡chroma8n ¡ structure ¡ • Distribu8on ¡of ¡distances ¡between ¡successive ¡nucleosome ¡ dyad ¡posi8ons ¡

  16. Nucleosome Positioning and Repetitive Sequences • Average ¡dyad ¡scores ¡ for ¡AluSx ¡repe88ve ¡ element ¡ • Predicted ¡dyad ¡ posi8ons ¡at ¡40bp ¡and ¡ 210 ¡bp ¡rela8ve ¡to ¡the ¡ start ¡of ¡the ¡313 ¡bp ¡long ¡ repe88ve ¡element. ¡ • Alu ¡sequences ¡have ¡ been ¡shown ¡to ¡ facilitate ¡the ¡forma8on ¡ of ¡nucleosomes ¡in ¡vivo ¡

  17. TF and Nucleosome Binding Positions • Dyad ¡posi8ons ¡with ¡ respect ¡to ¡TSS ¡for ¡four ¡ different ¡TF ¡categories ¡ – Red: ¡response ¡to ¡stress ¡ – Green: ¡transla8on ¡ – Dark ¡blue: ¡ribosome ¡ biogenesis ¡and ¡assembly ¡ – Light ¡blue: ¡organelle ¡ organiza8on ¡and ¡ biogenesis ¡

  18. DBN for Predicting Nucleosome Positioning • Many ¡methods ¡for ¡predic8ng ¡nucleosome ¡posi8ons ¡ – HMMs ¡for ¡linker-­‑dyad-­‑linker ¡sites ¡based ¡on ¡experimental ¡data ¡ – Infer ¡sequence ¡paSerns ¡from ¡experimental ¡data, ¡and ¡use ¡it ¡as ¡features ¡ in ¡classifica8on ¡ • Combine ¡the ¡two ¡ideas ¡using ¡DBN ¡that ¡incorporates ¡mul8ple ¡ evidence ¡track ¡(experimental ¡data ¡+ ¡DNA ¡sequence ¡specificity) ¡ – scores ¡from ¡a ¡DNA-­‑sequence ¡model ¡of ¡nucleosome ¡posi8oning: ¡the ¡ output ¡(log-­‑ra8o ¡scores) ¡from ¡the ¡binary ¡classifier ¡built ¡on ¡k-­‑mer ¡ sequence ¡features ¡ – nucleosome-­‑occupancy ¡data ¡from ¡a ¡high-­‑throughput ¡sequencing ¡ experiment ¡ – a ¡transcrip8on ¡factor ¡landscape ¡

  19. DBN State Transition Diagram • Three ¡states ¡for ¡ nucleosome ¡core ¡states ¡ – Dyad ¡(5bp) ¡ – 5/ ¡and ¡3’ ¡turns ¡(71 ¡bp ¡ each) ¡ • Two ¡states ¡for ¡linker ¡ states ¡ – First ¡state ¡with ¡fixed ¡linker ¡ length ¡(9bp) ¡ – Second ¡state ¡with ¡ geometrically ¡distributed ¡ linker ¡length ¡

  20. DBN for Predicting Nucleosome Position • Integra8ng ¡mul8ple ¡sources ¡of ¡informa8on ¡ – Sequence ¡model ¡scores: ¡scores ¡from ¡a ¡DNA-­‑sequence ¡model ¡of ¡ nucleosome ¡posi8oning ¡ • q i =0: ¡non-­‑dyad ¡state ¡ • q i =1: ¡dyad ¡state ¡ – Experimental ¡data ¡on ¡nucleosome ¡occupancy ¡derived ¡from ¡ microarray/sequencing ¡assays ¡

  21. DBN for Predicting Nucleosome Position • Integra8ng ¡mul8ple ¡sources ¡of ¡informa8on ¡ – Transcrip8on ¡factor ¡binding ¡probabili8es ¡ • Rela8ve ¡affinity ¡of ¡a ¡binding ¡site ¡for ¡a ¡TF ¡given ¡as ¡posi8on ¡weight ¡ matrix ¡(PWM) ¡ • Assumes ¡TF ¡only ¡binds ¡in ¡the ¡linker ¡state: ¡ ¡ – q i =0: ¡any ¡state ¡ – q i =1: ¡either ¡of ¡the ¡two ¡linker ¡state ¡ ¡

  22. DBN for Predicting Nucleosome Position • Integra8ng ¡mul8ple ¡sources ¡of ¡informa8on ¡ Virtual ¡ evidence ¡

  23. DBN for Predicting Nucleosome Position • Determinis8c ¡rela8onship ¡ between ¡state ¡s i , ¡the ¡label ¡q i , ¡ and ¡the ¡virtual ¡evidence ¡c i ¡ – P(c i =1| ¡s i , ¡q i ) ¡= ¡I(s i , ¡q i ) ¡ • 1 ¡ ¡if ¡s i ¡and ¡q i ¡are ¡consistent, ¡ otherwise ¡0 ¡ • P(q i =Q) ¡= ¡1/Q ¡(Uniform ¡ distribu8on) ¡

  24. Incorporating Experimental Data and Sequence Scores in DBN • S. ¡cerevisiae ¡chromosome ¡II ¡ Only ¡ experimental ¡ data ¡as ¡evidence ¡ Experimental ¡ data ¡and ¡ nucleosome-­‑ binding ¡ sequence ¡scores ¡ as ¡evidence ¡

Download Presentation
Download Policy: The content available on the website is offered to you 'AS IS' for your personal information and use only. It cannot be commercialized, licensed, or distributed on other websites without prior consent from the author. To download a presentation, simply click this link. If you encounter any difficulties during the download process, it's possible that the publisher has removed the file from their server.

Recommend


More recommend