rnaseq analysis
play

RNAseq analysis -its complicated Oktober 2016 RNA - PowerPoint PPT Presentation

RNAseq analysis -its complicated Oktober 2016 RNA reads are not enough to iden;fy func;onal RNAs Defining functional DNA elements in the human genome Kellis M et al.


  1. RNAseq ¡analysis ¡ -­‑it’s ¡complicated ¡ Oktober ¡2016 ¡ ¡

  2. RNA ¡reads ¡are ¡not ¡enough ¡to ¡iden;fy ¡ func;onal ¡RNAs ¡ Defining functional DNA elements in the human genome Kellis M et al. PNAS 2014;111:6131-6138

  3. Depending ¡on ¡the ¡steps ¡from ¡sample ¡ to ¡RNA ¡seq ¡will ¡give ¡different ¡results ¡ RNA-­‑> ¡ PolyA ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡(mRNA) ¡ AAAAAAAA ¡ RiboMinus ¡ ¡ ¡ ¡ ¡ ¡(-­‑ ¡rRNA) ¡ enrichments ¡-­‑> ¡ Size ¡ ¡<50 ¡nt ¡ ¡ ¡ ¡ ¡(miRNA ¡) ¡ ….. ¡ ¡ Size ¡of ¡fragment ¡ Strand ¡specific ¡ 5’ ¡end ¡specific ¡ ¡ 3’ ¡end ¡specific ¡ ….. ¡ ¡ library ¡-­‑> ¡ reads ¡-­‑> ¡ Single ¡end ¡(1 ¡read ¡per ¡fragment) ¡ Paired ¡end ¡(2 ¡reads ¡per ¡fragment) ¡

  4. Mapping ¡(Pär ¡Engström) ¡ • Use ¡RNA ¡specific ¡mapper ¡ • Use ¡a ¡two-­‑pass ¡workflow ¡ • STAR ¡or ¡HISAT ¡ ¡ ¡ • If ¡you ¡want ¡to ¡run ¡Cufflinks, ¡use ¡TopHat ¡or ¡ HISAT ¡ • For ¡long ¡(PacBio) ¡reads, ¡STAR, ¡BLAT ¡or ¡GMAP ¡ can ¡be ¡used ¡

  5. RNA-­‑seq ¡analysis ¡workflow ¡ reads.fastq.gz( STAR( mappedReads.bam( Mapped(reads( Reads( Mapping( Gene(annotaCon:( ref.bed(/(ref.ga( Reference( Gene( genome.fa( expression(

  6. Gene ¡and ¡Isoform ¡detec;on ¡

  7. Do ¡a ¡lot ¡of ¡QC ¡ Read(QC( Mapping( Mapping(QC( $(FastQC( staCsCcs( $(RseQC( reads.fastq.gz( STAR( mappedReads.bam( Reads( Mapping( Mapped(reads( Gene(annotaCon:( ref.bed(/(ref.ga( Reference( Gene( genome.fa( expression( Outlier( detecCon,( sample(swaps(

  8. More ¡varia;on ¡when ¡using ¡top ¡hat ¡2 ¡with ¡ default ¡secngs ¡than ¡when ¡using ¡STAR ¡or ¡ Stampy ¡with ¡default ¡secng ¡ Percent properly mapped paired end reads 60 70 80 90 Compare mapping efficacy of different RNA − seq assemblers Cg4a_KS2 ● ● ● Cg88_14_KS3 ● ● ● Cg88_44_KS2 ● ● ● C.grandiflora ¡ Cg89_16_KS2 ● ● ● Cg89_3_KS1 ● ● ● Cg8c_KS2 ● ● ● Cg8f_KS1 ● ● ● Cg94_6_KS1 ● ● ● Cr1GR1_2_KS1 ● ● ● Cr1GR1_2_KS2 ● ● ● Cr1GR1_2_KS3 ● ● ● Cr23_9_KS2 C.rubella ¡ ● ● ● Cr39_1_TS1_KS1 ● ● ● species Cr75_2_3_KS1 ● ● ● Cr79_29_extra1 ● ● ● Cr84_21_KS1 ● ● ● CrN22561_KS2 ● ● ● Inter3_1 ● ● ● Inter4_1_1 ● ● ● Inter4_1_2 hybrid ¡ ● ● ● Inter4_1_3 ● ● ● Inter4_1_4 Inter5_1 ● ● ● Intra6_3 ● ● ● Intra7_2_1 ● ● ● C.grandiflora ¡ Intra7_2_2 ● ● ● Intra7_2_3 ● ● ● Intra8_2 ● ● ● Shape Colour ● ● ● ● Leaf Flower Tophat2 STAR Stampy

  9. RNA ¡QC ¡ ¡Åsa ¡Björklund ¡

  10. Mapped(reads( Reads( Mapping( Mapped(reads( Reads( Mapping( Mapped(reads( Reads( Mapping( Expression(( Reference( Table(with( Expression(( Mapped(reads( Reads( Mapping( per(gene( Reference( Expression(( Mapped(reads( Reads( Mapping( per(gene( Reference( per(gene( Expression(( counts,( Reference( Table(with( Expression(( per(gene( Reference( Expression(( per(gene( Reference( per(gene( rpkms,( counts,( Mapped(reads( Reads( Mapping( Mapped(reads( Reads( Mapping( Mapped(reads( Reads( Mapping( fpkms(or( rpkms,( Mapped(reads( Reads( Mapping( Mapped(reads( Reads( Mapping( Expression(( Mapped(reads( Reads( Mapping( Reference( Expression(( Mapped(reads( Reads( Mapping( per(gene( Reference( fpkms(or( Expression(( similar( Mapped(reads( Reads( Mapping( per(gene( Reference( Expression(( Expression(( per(gene( Reference( Reference( Expression(( per(gene( per(gene( Reference( Expression(( similar( per(gene( Reference( Expression(( per(gene( Reference( per(gene( Sample$swaps$and$outliers$can$be$ Sample$swaps$and$outliers$can$be$ iden0fied$using$PCA$ iden0fied$using$PCA$

  11. RNA ¡QC ¡ PCA(analysis(detected(potenCal( sample(swaps(

  12. Principal ¡component ¡1 ¡separates ¡ samples ¡from ¡flowers ¡and ¡leaves ¡ ¡ Cg4a_KS2_F ● Cg4a_KS2_L ● Cg88_14_KS3_F Cg88_14_KS3_L Cg88_44_KS2_F ● Cg88_44_KS2_L Cg89_16_KS2_F ● ● Cg89_16_KS2_L ● Cg89_3_KS1_F ● Cg89_3_KS1_L ● ● ● Cg8c_KS2_F C. ¡rubella ¡ ¡ Cg8c_KS2_L 50 ● Cg8f_KS1_F ● Cg8f_KS1_L Cg94_6_KS1_F ● Cg94_6_KS1_L ● ● ● Cr1GR1_2_KS1_F Cr1GR1_2_KS1_L Cr1GR1_2_KS2_F ● Cr1GR1_2_KS2_L Cr1GR1_2_KS3_F ● ● ● Cr1GR1_2_KS3_L Cr23_9_KS2_F ● Cr23_9_KS2_L PC2 ● ● Cr39_1_TS1_KS1_F Cr39_1_TS1_KS1_L Cr75_2_3_KS1_F ● 0 Cr75_2_3_KS1_L Cr79_29_extra1_F ● ● Cr79_29_extra1_L ● ● ● Cr84_21_KS1_F ● Cr84_21_KS1_L ● ● CrN22561_KS2_F ● ● CrN22561_KS2_L ● ● Inter3_1_F ● Inter3_1_L ● ● Inter4_1_1_F ● Inter4_1_1_L ● ● Inter4_1_2_F Inter4_1_2_L Inter4_1_3_F ● − 50 ● Inter4_1_4_L ● Inter5_1_F ● Inter5_1_L ● ● Intra6_3_F Intra6_3_L ● Intra7_2_1_F ● Intra7_2_1_L Intra7_2_2_F ● ● Intra7_2_2_L Intra7_2_3_F ● Intra7_2_3_L ● Intra8_2_F Intra8_2_L − 150 − 100 − 50 0 50 100 150 PC1

  13. Principal ¡component ¡2 ¡and ¡3 ¡separates ¡the ¡different ¡species ¡ ¡ 100 C. ¡rubella ¡ ¡ 50 C. ¡rubella ¡ ¡ hybrid ¡ PC3 0 −50 C. ¡grandiflora ¡ −60 −40 −20 0 20 40 60 80 PC2

  14. Differen;al ¡expression ¡analysis ¡ ¡ Mikael ¡Huss ¡ ¡ The ¡iden;fica;on ¡of ¡genes ¡(or ¡other ¡types ¡of ¡genomic ¡features, ¡such ¡as ¡transcripts ¡or ¡ exons) ¡that ¡are ¡expressed ¡in ¡significantly ¡different ¡quan;;es ¡in ¡dis;nct ¡groups ¡of ¡ samples, ¡be ¡it ¡biological ¡condi;ons ¡(drug-­‑treated ¡vs. ¡controls), ¡diseased ¡vs. ¡healthy ¡ individuals, ¡different ¡;ssues, ¡different ¡stages ¡of ¡development, ¡or ¡something ¡else. ¡ Typically ¡univariate ¡analysis ¡(one ¡ gene ¡at ¡a ¡;me) ¡– ¡even ¡though ¡we ¡ know ¡that ¡genes ¡are ¡not ¡ independent ¡

  15. Decision ¡tree ¡for ¡so/ware ¡selec2on ¡(2016) ¡ Sleuth ¡ , ¡Sleuth ¡ ¡ ? ¡

  16. Gene-­‑set ¡analysis ¡(GSA) ¡ ¡ Samples Immune ¡response Genes Pyruvate PPARG GO-­‑terms Gen Gene-­‑s e-­‑set ¡ ¡analy analysis sis Pathways Gene-­‑level ¡data Gene-­‑set ¡data ¡(results) Chromosomal ¡loca?ons Transcrip?on ¡factors Histone ¡modifica?ons We ¡will ¡focus ¡on ¡transcriptomics ¡and ¡differen;al ¡expression ¡analysis ¡ Diseases However, ¡GSA ¡can ¡in ¡principle ¡be ¡used ¡on ¡all ¡types ¡of ¡genome-­‑wide ¡data. ¡ etc…

  17. miRNA ¡seq ¡analysis ¡ (Berezikov ¡et ¡al. ¡Genome ¡Research, ¡2011.) ¡

  18. Single ¡cell ¡sequencing ¡ (Sandberg,$Nature$Methods$2014)$

  19. Allele ¡specific ¡expression ¡ Adding another layer to transcriptome complexity... � � Adopted from Unneberg, 2010 ...and each gene is present on two chromosomes. => it has two alleles

  20. Exercises ¡ Mapping ¡ Introductory ¡ • • STAR ¡ ¡ Introduc;on ¡to ¡the ¡RNA ¡seq ¡data ¡provided ¡ – – HISAT2 ¡ Short ¡introduc;on ¡to ¡R ¡ – – Tutorial ¡for ¡reference ¡guided ¡assembly ¡ Short ¡introduc;on ¡to ¡IGV ¡ • – Beta ¡ labs ¡ • Cufflinks ¡ – String;e ¡ Single ¡cell ¡RNA ¡PCA ¡and ¡clustering ¡ – – Tutorial ¡for ¡de ¡novo ¡assembly ¡ Gene ¡set ¡analysis ¡ • – UPPMAX ¡ • Trinity ¡ – Visualise ¡mapped ¡reads ¡and ¡assembled ¡ sbatch ¡script ¡example ¡ • – transcripts ¡on ¡reference ¡ IGV ¡ – RNA ¡quality ¡controll ¡ • Tutorial ¡for ¡RNA ¡seq ¡Quality ¡Control ¡ – Differen;al ¡expression ¡analysis ¡ • DEseq2 ¡ – Calisto ¡and ¡Sleuth ¡ – mul; ¡variate ¡analysis ¡in ¡SIMCA ¡ – small ¡RNA ¡analysis ¡ • miRNA ¡analysis ¡ –

  21. Need ¡help?? ¡ • We ¡are ¡here ¡for ¡you. ¡Apply ¡for ¡help. ¡

Download Presentation
Download Policy: The content available on the website is offered to you 'AS IS' for your personal information and use only. It cannot be commercialized, licensed, or distributed on other websites without prior consent from the author. To download a presentation, simply click this link. If you encounter any difficulties during the download process, it's possible that the publisher has removed the file from their server.

Recommend


More recommend