SLIDE 1
Epigenome and Gene Expression
02-‑715 ¡Advanced ¡Topics ¡in ¡Computa8onal ¡ Genomics ¡
SLIDE 2 Epigenome and Transcription
- Histone ¡modifica8on ¡levels ¡can ¡influence ¡gene ¡expressions ¡
- Nucleosome ¡posi8ons ¡can ¡influence ¡gene ¡expressions ¡
– DNA ¡sequence ¡specifici8es ¡of ¡nucleosome ¡and ¡transcrip8on ¡factor ¡ binding ¡sites ¡ – Nucleosomes ¡as ¡repressors ¡
- Methyla8on ¡usually ¡represses ¡transcrip8on ¡
SLIDE 3 Key Questions
- Is ¡there ¡a ¡quan8ta8ve ¡rela8onship ¡between ¡histone ¡
modifica8ons ¡levels ¡and ¡transcrip8on? ¡
- Is ¡there ¡a ¡subset ¡of ¡histone ¡modifica8ons ¡that ¡predict ¡
transcrip8on ¡beLer ¡than ¡others? ¡
- Are ¡there ¡different ¡requirements ¡for ¡different ¡promoter ¡
types? ¡
- Do ¡these ¡rela8onships ¡between ¡histone ¡modifica8ons ¡and ¡
transcrip8on ¡hold ¡in ¡different ¡8ssue ¡types? ¡
SLIDE 4 Dataset
- 38 ¡histone ¡modifica8ons ¡and ¡one ¡histone ¡variant ¡in ¡human ¡
CD4+ ¡T-‑cells ¡
– ChIP-‑seq ¡data ¡ ¡ – In ¡a ¡region ¡of ¡4,001 ¡bp ¡surrounding ¡the ¡transcrip8on ¡start ¡sites ¡of ¡ 14,801 ¡RefSeq ¡genes ¡
- Gene ¡expression ¡levels ¡in ¡the ¡CD4+ ¡T-‑cells ¡
- 9 ¡histone ¡modifica8ons ¡in ¡CD36+ ¡and ¡CD133+ ¡cells ¡
- Gene ¡expression ¡levels ¡in ¡CD36+ ¡and ¡CD133+ ¡cells ¡
SLIDE 5 Linear Models
- Linear ¡regression ¡method ¡
– Predictors: ¡histone ¡marks ¡ ¡
- No ¡binariza8on ¡
- For ¡genes ¡with ¡no ¡histone ¡modifica8ons ¡for ¡par8cular ¡
modifica8ons, ¡add ¡a ¡pseudocount ¡ – Responses: ¡gene ¡expressions ¡ – Promoter ¡regions ¡of ¡different ¡genes ¡as ¡samples ¡
SLIDE 6 Linear Models
- Full ¡model ¡including ¡all ¡histone ¡modifica8ons ¡
- Compute ¡r2 ¡between ¡observed ¡gene ¡expressions ¡and ¡
predicted ¡values ¡to ¡assess ¡the ¡predic8ve ¡power ¡of ¡the ¡model ¡
SLIDE 7 Linear Models
- Selec8ng ¡the ¡histone ¡modifica8ons ¡with ¡the ¡most ¡predic8ve ¡
power ¡
SLIDE 8 Linear Models
- Selec8ng ¡the ¡histone ¡modifica8ons ¡with ¡the ¡most ¡predic8ve ¡
power ¡with ¡BIC ¡scores ¡
SLIDE 9
Prediction Accuracy
SLIDE 10 Searching for Histone Modifications with the Most Predictive Power
- The ¡most ¡frequently ¡appearing ¡histone ¡modifica8ons ¡in ¡
models ¡with ¡1, ¡2, ¡3 ¡histone ¡modifica8ons ¡
SLIDE 11 Model with One Histone Modification
expressions ¡and ¡each ¡ histone ¡modifica8on ¡
- Redundancy ¡in ¡histone ¡
modifica8ons ¡
SLIDE 12 Histone Modifications and Promoter Types
- Different ¡promoter ¡types ¡to ¡be ¡considered ¡
– LCPs ¡: ¡low ¡CpG ¡content ¡promoters ¡ – HCPs ¡: ¡high ¡CpG ¡content ¡promoters ¡ – Nucleosomes ¡in ¡HCPs ¡almost ¡always ¡have ¡H3K4me3 ¡marks, ¡whereas ¡ nucleosomes ¡in ¡LCPs ¡carry ¡this ¡modifica8on ¡only ¡when ¡they ¡are ¡
- expressed. ¡
- Hypothesis: ¡expression ¡levels ¡of ¡genes ¡with ¡LCPs ¡and ¡HCPs ¡can ¡
be ¡predicted ¡by ¡different ¡sets ¡of ¡histone ¡modifica8ons ¡
SLIDE 13 Histone Modifications and Promoter Types
– 1,779 ¡LCPs ¡and ¡7,089 ¡HCPs ¡in ¡the ¡dataset ¡ – Fit ¡different ¡models ¡to ¡each ¡of ¡LCPs ¡and ¡HCPs ¡and ¡compare ¡them ¡with ¡ the ¡model ¡es8mated ¡from ¡the ¡full ¡dataset ¡
SLIDE 14
Histone Modifications and Promoter Types
SLIDE 15
Histone Modifications and Promoter Types
SLIDE 16 Considering Different Tissue Types
- Used ¡the ¡model ¡trained ¡on ¡CD4+ ¡data ¡to ¡predict ¡gene ¡
expressions ¡in ¡CD133+ ¡and ¡CD36+ ¡cells ¡
- Used ¡only ¡those ¡gene ¡expressions ¡with ¡more ¡than ¡five ¡fold ¡
differences ¡between ¡CD4+ ¡and ¡CD133+ ¡(also ¡between ¡CD4+ ¡ and ¡CD36+) ¡
SLIDE 17
Considering Different Tissue Types
SLIDE 18 Nucleosome and Transcription
- DNA ¡sequence ¡mo8fs ¡with ¡high ¡nucleosome ¡binding ¡affini8es ¡
– Poten8ally ¡related ¡to ¡bending ¡DNA ¡around ¡the ¡nucleosomes ¡
- DNA ¡sequence ¡mo8fs ¡with ¡high ¡transcrip8on ¡factor ¡binding ¡
affini8es ¡
– TF ¡concentra8on ¡can ¡also ¡influence ¡gene ¡expression ¡
- Compe88on ¡between ¡nucleosomes ¡and ¡transcrip8on ¡factors ¡
can ¡influence ¡the ¡transcrip8on ¡
SLIDE 19
Nucleosome and Transcription
SLIDE 20
Nucleosome and Transcription
SLIDE 21 DNA Sequence, DNA-binding Proteins, and Gene Expression
- Mixture ¡model ¡for ¡predic8ng ¡gene ¡expressions ¡from ¡
nucleosomes ¡and ¡other ¡DNA ¡binding ¡proteins ¡
– E: ¡gene ¡expression ¡ – C: ¡protein ¡configura8ons ¡
SLIDE 22 DNA Sequence, DNA-binding Proteins, and Gene Expression
- Mixture ¡propor8ons ¡
- Mixture ¡component ¡models ¡
SLIDE 23
DNA Sequence, DNA-binding Proteins, and Gene Expression
SLIDE 24
Competition between Nucleosomes and Transcription Factors
SLIDE 25
Competition between Nucleosomes and Transcription Factors
SLIDE 26
Competition between Nucleosomes and Transcription Factors
SLIDE 27 Competition between Nucleosomes and Transcription Factors
- Promoter ¡regions ¡with ¡rela8vely ¡high ¡nucleosome ¡affinity ¡and ¡
transcrip8on ¡factor ¡affinity ¡
– Compe88on ¡between ¡nucleosomes ¡and ¡transcrip8on ¡factors ¡ – High ¡transcrip8on ¡noise ¡ – Enriched ¡chroma8n ¡remodeller ¡ac8vi8es ¡ – High-‑rate ¡of ¡histone ¡turnover ¡
SLIDE 28
Transcriptional Noise
SLIDE 29
Cooperative Binding Reduces Transcriptional Noise
SLIDE 30 Fuzzy Nucleosomes
- Well-‑posi8oned ¡vs. ¡fuzzy ¡nucleosomes ¡
– Can ¡be ¡inferred ¡from ¡DNA ¡sequences ¡ – In ¡fuzzy ¡nucleosomes, ¡many ¡nucleosome ¡posi8ons ¡are ¡observed ¡
SLIDE 31
Nucleosome Affinity Landscape
Well-‑posi8oned ¡ nucleosomes ¡ Fuzzy ¡nucleosomes ¡