Lectures 13: High throughput sequencing: Beyond the genome - - PowerPoint PPT Presentation

lectures 13 high throughput sequencing beyond the genome
SMART_READER_LITE
LIVE PREVIEW

Lectures 13: High throughput sequencing: Beyond the genome - - PowerPoint PPT Presentation

Lectures 13: High throughput sequencing: Beyond the genome Spring 2017 March 28, 2017 h@p://www.fejes.ca/2009/06/science-cartoons-5-rna-seq.html Omics


slide-1
SLIDE 1

Lectures ¡13: ¡High ¡throughput ¡ sequencing: ¡Beyond ¡the ¡genome ¡

Spring ¡2017 ¡ March ¡28, ¡2017 ¡

slide-2
SLIDE 2

h@p://www.fejes.ca/2009/06/science-­‑cartoons-­‑5-­‑rna-­‑seq.html ¡

slide-3
SLIDE 3

Omics ¡

  • Transcriptome ¡-­‑ ¡the ¡set ¡of ¡all ¡mRNAs ¡present ¡in ¡a ¡cell ¡
  • Proteome ¡– ¡proteins ¡
  • Metabolome/physiome ¡-­‑ ¡metabolites ¡
  • Microbiome ¡– ¡the ¡collecSon ¡of ¡microbes ¡present ¡in ¡an ¡
  • rganism ¡or ¡other ¡locaSon ¡
  • Interactome ¡

¡

“In ¡physics… ¡the ¡-­‑on ¡suffix ¡has ¡tended ¡to ¡signify ¡an ¡elementary ¡parScle: ¡the ¡photon, ¡ electron, ¡proton, ¡meson, ¡etc., ¡whereas ¡-­‑ome ¡in ¡biology ¡has ¡the ¡opposite ¡intellectual ¡ funcSon, ¡of ¡direcSng ¡a@enSon ¡to ¡a ¡holisSc ¡abstracSon, ¡an ¡eventual ¡goal…” ¡ ¡From: ¡ ‘Ome ¡Sweet ¡‘Omics. ¡The ¡ScienSst ¡15(7), ¡2001 ¡

slide-4
SLIDE 4

Omics ¡

  • Biologists ¡have ¡high-­‑throughput ¡methods ¡for ¡probing ¡

each ¡-­‑ome: ¡

  • Transcriptome ¡– ¡RNA-­‑Seq ¡
  • Proteome ¡– ¡mass ¡spectrometry, ¡protein ¡arrays ¡
  • Microbiome ¡– ¡next ¡generaSon ¡sequencing ¡
  • Interactome ¡– ¡yeast-­‑two-­‑hybrid ¡
  • Regulome ¡– ¡ChIP-­‑Seq ¡

¡

Lots ¡of ¡data ¡for ¡bioinformaScs ¡people ¡to ¡analyze! ¡

slide-5
SLIDE 5

RNA-­‑seq: ¡ ¡profiling ¡the ¡transcriptome ¡

  • Technique: ¡ ¡sequence ¡the ¡total ¡RNA ¡produced ¡by ¡the ¡

cell ¡

slide-6
SLIDE 6

Read ¡mapping ¡

slide-7
SLIDE 7

Pile-­‑ups ¡

From: ¡The ¡ENCODE ¡Project ¡ConsorSum ¡(2011) ¡A ¡User's ¡Guide ¡to ¡the ¡Encyclopedia ¡of ¡DNA ¡ Elements ¡(ENCODE). ¡PLoS ¡Biol ¡9(4): ¡e1001046. ¡ ¡

slide-8
SLIDE 8

Pile-­‑ups ¡

gene ¡ model ¡ read ¡ depth ¡ ¡

Most ¡reads ¡fall ¡into ¡coding ¡exons ¡or ¡UTRs ¡

slide-9
SLIDE 9

RNA-­‑seq: ¡ ¡profiling ¡the ¡transcriptome ¡

  • Technique: ¡ ¡sequence ¡the ¡total ¡RNA ¡produced ¡by ¡the ¡

cell ¡

  • What ¡is ¡this ¡good ¡for? ¡
slide-10
SLIDE 10

RNA-­‑seq: ¡ ¡profiling ¡the ¡transcriptome ¡

  • Genome ¡annotaSon ¡(transcript ¡assembly) ¡
  • Detect ¡alternaSve ¡splicing ¡
  • Obtain ¡gene/transcript ¡expression ¡levels ¡and ¡detecSon ¡
  • f ¡differenSal ¡expression ¡
  • Allele-­‑specific ¡expression ¡
  • Small-­‑RNA ¡transcriptome ¡(different ¡protocol ¡than ¡

regular ¡RNA-­‑seq) ¡ ¡

slide-11
SLIDE 11

All ¡the ¡uses ¡of ¡RNA-­‑seq ¡

h@p://www.rna-­‑seqblog.com/news/informaSon/rna-­‑seq-­‑blog-­‑poll-­‑results/ ¡

slide-12
SLIDE 12

DifferenSal ¡expression ¡

h@p://www.fejes.ca/labels/figures.html ¡

slide-13
SLIDE 13

RNA-­‑seq ¡protocol ¡

slide-14
SLIDE 14

Raw ¡and ¡Aligned ¡Reads ¡

  • Raw ¡data ¡is ¡a ¡(large) ¡set ¡of ¡sequences ¡
  • Typical ¡file ¡format ¡is ¡FASTQ ¡

@HWI-EAS255_4_FC2010Y_1_43_110_790 TTAATCTACAGAATAGATAGCTAGCATATATTT + hhhhhhhhhhhhhhhdhhhhhhhhhhhdRehdh

  • Alignment ¡to ¡genome ¡is ¡done ¡by ¡efficient ¡indexing ¡
  • Aligned ¡reads ¡in ¡SAM ¡format ¡ ¡

@HWI-… 163 chr19 9900 10000 16M2I25M ¡

Base ¡quality ¡codes ¡ Read ¡idenSfier ¡ Bases ¡called ¡ Start ¡and ¡end ¡ ¡ posiSons ¡ Codes ¡for ¡match: ¡ 16 ¡matches, ¡2 ¡extra,… ¡ Where ¡this ¡ ¡ read ¡matched ¡ Read ¡ ¡ idenSfier ¡

slide-15
SLIDE 15

Cataloging ¡the ¡transcriptome ¡

  • Transcriptomics ¡involves ¡studying ¡expression ¡

at ¡

– SpaSal ¡resoluSon: ¡Sssues, ¡individuals, ¡locaSon ¡ – Temporal ¡resoluSon: ¡circadian, ¡seasonal, ¡lifeSme ¡

slide-16
SLIDE 16

Inter-­‑Genic ¡Reads ¡

  • Many ¡reads ¡reflect ¡unannotated ¡genes: ¡ ¡
  • pportunity ¡to ¡discover ¡new ¡genes ¡
slide-17
SLIDE 17

RPKM ¡– ¡A ¡Simple ¡NormalizaSon ¡

  • Different ¡numbers ¡of ¡counts ¡per ¡sample ¡

(sequencing ¡depth) ¡

  • Divide ¡counts ¡in ¡a ¡region ¡of ¡interest ¡(a ¡

genomic ¡region ¡or ¡a ¡gene ¡or ¡an ¡exon) ¡by ¡all ¡ counts ¡(reads ¡per ¡million ¡reads ¡-­‑RPM) ¡

  • Genes ¡have ¡different ¡lengths: ¡divide ¡also ¡by ¡

length ¡of ¡gene ¡ ¡

  • Obtain ¡RPKM ¡(reads ¡per ¡kilobase ¡of ¡exon ¡per ¡

million ¡reads) ¡

– Some ¡use ¡FPKM ¡(fragments/kb/Mr) ¡

slide-18
SLIDE 18

ChIP-­‑seq ¡

h@p://www.fejes.ca/labels/Chip-­‑Seq.html ¡

slide-19
SLIDE 19
slide-20
SLIDE 20

Comments ¡on ¡ChIP-­‑seq ¡

  • Genome-­‑wide ¡mapping ¡of ¡transcripSon ¡factor ¡

binding ¡sites ¡

  • ComputaSonal ¡problems: ¡

– Peak ¡calling ¡ – SSll ¡need ¡moSf ¡finders, ¡but ¡makes ¡the ¡problem ¡ easier ¡

slide-21
SLIDE 21

Variants ¡

  • Apply ¡the ¡methodology ¡to ¡RNA: ¡ ¡map ¡RNA-­‑binding ¡

sites ¡in ¡mRNA ¡that ¡interact ¡with ¡specific ¡RNA-­‑binding ¡ proteins ¡

  • CLIP-­‑Seq ¡(cross-­‑linking ¡immunoprecipitaSon ¡sequencing) ¡ ¡
  • RIP-­‑Seq ¡(RNA ¡immunoprecipitaSon ¡sequencing) ¡
slide-22
SLIDE 22

Other ¡sequencing-­‑based ¡techniques ¡

  • Methyl-­‑seq, ¡BS-­‑seq: ¡methylaSon ¡
  • Chromosome ¡conformaSon ¡capture ¡(3C-­‑4C-­‑5C-­‑HiC): ¡

spaSal ¡organizaSon ¡of ¡chromosomes ¡

h@p://en.wikipedia.org/wiki/Chromosome_conformaSon_capture ¡

slide-23
SLIDE 23

Other ¡sequencing-­‑based ¡techniques ¡

  • Methyl-­‑seq, ¡BS-­‑seq: ¡methylaSon ¡
  • Chromosome ¡conformaSon ¡capture ¡(3C-­‑4C-­‑5C): ¡spaSal ¡
  • rganizaSon ¡of ¡chromosomes ¡
  • seqFold: ¡RNA ¡secondary ¡structure ¡
  • DNAase-­‑seq ¡
  • And ¡many ¡more! ¡

h@p://en.wikipedia.org/wiki/Chromosome_conformaSon_capture ¡

slide-24
SLIDE 24

Read ¡mapping ¡

All ¡the ¡sequencing-­‑based ¡techniques ¡require ¡read ¡mapping ¡as ¡a ¡first ¡step. ¡ ¡ ExisSng ¡alignment ¡tools ¡are ¡not ¡fast ¡enough ¡à ¡need ¡new ¡algorithms! ¡

slide-25
SLIDE 25

Read ¡mapping ¡

  • How ¡is ¡the ¡problem ¡of ¡read ¡mapping ¡different ¡

than ¡sequence ¡alignment ¡as ¡we ¡have ¡ considered ¡it ¡unSl ¡now? ¡