using rna seq to reveal expression diversity in maize
play

Using RNA-Seq to reveal expression & diversity in maize - PowerPoint PPT Presentation

Using RNA-Seq to reveal expression & diversity in maize C Robin Buell Michigan State University Department of Plant Biology Purdue 8 th InternaGonal


  1. Using ¡RNA-­‑Seq ¡to ¡reveal ¡expression ¡ & ¡diversity ¡in ¡maize ¡ C ¡Robin ¡Buell ¡ Michigan ¡State ¡University ¡ Department ¡of ¡Plant ¡Biology ¡ Purdue ¡8 th ¡InternaGonal ¡Symposium ¡on ¡StaGsGcs, ¡ June ¡2012 ¡

  2. What ¡is ¡RNA-­‑Seq? ¡ § RNA ¡sequencing ¡(RNA-­‑seq) ¡ X ¡ § Method ¡to ¡sequence ¡RNA ¡via ¡ DNA ¡intermediate ¡to: ¡ § Determine ¡sequence ¡of ¡ transcripts ¡(proxy ¡for ¡ genome, ¡alternaIve ¡ isoform) ¡ § QuanItaIvely ¡assess ¡ transcript ¡abundances ¡ including ¡allele ¡specific ¡ expression ¡ § IdenIfy ¡variants ¡in ¡ genomes ¡(restricted ¡to ¡the ¡ transcribed ¡regions) ¡ Wang ¡et ¡al. ¡Nat ¡Gen ¡Rev ¡2009 ¡

  3. Next ¡GeneraGon ¡Sequencing ¡PlaNorm-­‑Illumina ¡ -­‑Illumina ¡ia ¡the ¡predomoninant ¡plaRorm ¡for ¡next ¡generaIon ¡sequencing ¡that ¡is ¡ being ¡used ¡for ¡RNA-­‑seq ¡ ¡ -­‑Other ¡plaRorms: ¡SoLiD, ¡Ion ¡Torrent, ¡Roche ¡454, ¡Pacific ¡Biosciences ¡ Flow ¡cell: ¡8 ¡lanes ¡

  4. What ¡happens ¡on ¡the ¡flow ¡cell ¡ AmplificaIon ¡of ¡template ¡on ¡flow ¡cell ¡via ¡bridge ¡PCR ¡(Shendure ¡& ¡Li ¡2008) ¡ Sequencing-­‑by-­‑Synthesis ¡using ¡fluorescent ¡reversible ¡dye ¡terminators ¡(Shendure ¡& ¡Li ¡ 2008) ¡

  5. Output: ¡The ¡good, ¡the ¡bad, ¡and ¡the ¡ugly ¡ => ¡Get ¡ TONS ¡of ¡data ¡ 1 ¡Lane ¡of ¡Illumina, ¡~250M ¡paired ¡end ¡sequences, ¡100 ¡bp ¡ ¡ 250,000,000 ¡*100 ¡bp ¡= ¡25 ¡Gb ¡of ¡sequence ¡ ¡ The ¡sequenced ¡reads ¡can ¡(do) ¡have ¡errors. ¡ ¡ ¡ ¡ Generate ¡more ¡sequence ¡to ¡compensate ¡ Use ¡quality ¡values ¡to ¡filter ¡sequences ¡ When ¡in ¡doubt, ¡throw ¡it ¡out ¡(probably ¡over-­‑ sampled ¡the ¡library ¡anyway) ¡ Use ¡“quality ¡aware” ¡algorithms ¡for ¡analysis ¡ Assume ¡the ¡staIsIcian ¡that ¡wrote ¡the ¡soeware ¡ knows ¡more ¡than ¡you ¡do ¡ ¡ ¡

  6. Workflow ¡ -­‑Get ¡the ¡reads ¡ -­‑Check ¡the ¡quality ¡of ¡the ¡reads ¡ -­‑Clean ¡the ¡reads ¡ -­‑Map ¡the ¡reads ¡to ¡the ¡genome ¡ -­‑Decide ¡how ¡to ¡penalize ¡mulI-­‑mapping ¡ reads, ¡mismatches ¡due ¡to ¡polymorphisms ¡ between ¡the ¡query ¡RNA ¡and ¡the ¡reference ¡ genome ¡(i.e., ¡Single ¡NucleoIde ¡ Polymorphisms ¡(SNPs)) ¡ -­‑QuanItate ¡the ¡reads ¡= ¡expression ¡ ¡ abundances ¡ ¡ FPKM : ¡Fragments ¡per ¡kb ¡exon ¡model ¡per ¡ million ¡reads ¡mapped ¡(normalized ¡for ¡ gene ¡length ¡and ¡depth ¡of ¡sequencing ¡in ¡ each ¡experiment) ¡ Older ¡papers ¡used ¡RPKM ¡ (reads ¡instead ¡of ¡ fragments) ¡ Trapnell ¡et ¡al. ¡ ¡BioinformaIcs ¡ 2009 ¡

  7. Lineage-­‑specific ¡genes: ¡An ¡enigma ¡in ¡all ¡ genomes ¡ -­‑Genome ¡scale ¡comparisons ¡ have ¡revealed ¡sets ¡of ¡genes ¡ restricted ¡to ¡specific ¡lineages ¡ -­‑Lineage ¡specific ¡genes ¡may ¡be ¡ key ¡to ¡phenotypic ¡differences ¡ between ¡taxa ¡ ¡ -­‑An ¡overwhelming ¡majority ¡of ¡ these ¡genes ¡have ¡no ¡known ¡ funcIon ¡ ¡ -­‑Improve ¡our ¡understanding ¡of ¡ the ¡funcIon ¡of ¡lineage ¡specific ¡ Comparison ¡of ¡gene ¡complements ¡in ¡ genes ¡through ¡addiIonal ¡ 12 ¡plant ¡species ¡ annotaIon ¡in ¡the ¡form ¡of ¡ expression ¡data ¡ Potato ¡Genome ¡Sequencing ¡ConsorIum, ¡Nature ¡2011 ¡

  8. Maize ¡ReproducIve ¡Organs ¡ Male: ¡Tassels ¡(top ¡of ¡plant: ¡ pollen, ¡anthers) ¡ ¡ Female: ¡Ears ¡(cob, ¡silk, ¡ovule) ¡ ¡ Seed: ¡FerIlized ¡ovule ¡(seed: ¡ whole ¡seed, ¡embryo, ¡ endosperm) ¡ ¡ Non-­‑reproducIve: ¡Leaf ¡ (vegetaIve) ¡ hkp://www.sciencekids.co.nz/pictures/plants/ maizeplantdiagram.html ¡

  9. RNA-­‑Seq ¡Data ¡ RNA ¡ Davidson ¡et ¡al. ¡Plant ¡Genome ¡2011 ¡

  10. RNA-­‑Seq ¡Data ¡ ~80% ¡of ¡all ¡genes ¡ expressed ¡in ¡ RNA ¡ these ¡13 ¡Gssues ¡ Davidson ¡et ¡al. ¡Plant ¡Genome ¡2011 ¡

  11. Transcriptome ¡correlaIons ¡across ¡Issues ¡ 75 70 30 41 54 80 64 86 90 87 91 Embryo 25 DAP Post-em Tassel Whole Anthers Pre-em Tassel -­‑Similar ¡Issues ¡cluster ¡ Post-em Cob Endo 25 DAP Seed 10 DAP Pre-em Cob Mature Silk Seed 5 DAP -­‑Pollen ¡disInct ¡ Leaves Pollen Ovule Leaves Mature Silk Seed 5 DAP Seed 10 DAP Pre-em Cob Post-em Cob Ovule Embryo 25 DAP Endo 25 DAP Pollen Whole Anthers Pre-em Tassel Post-em Tassel 0.2 0.6 1.0 Davidson ¡et ¡al. ¡Plant ¡Genome ¡2011 ¡ �����������������������������

  12. How ¡does ¡RNA-­‑seq ¡compare ¡to ¡microarrays? ¡ Leaves vs. V13 First Leaf Embryo 25 DAP vs. Embryo 24 DAP 15 SCC = 0.76 SCC = 0.82 12 log2 FPKM 9 6 3 0 Pre-emergence cob vs. V18 Immature Cob Pollen vs. R1 Silks 15 SCC = 0.82 SCC = 0.30 12 log2 FPKM 9 6 3 0 0 3 6 9 12 15 0 3 6 9 12 15 log2 intensity log2 intensity Davidson ¡et ¡al. ¡Plant ¡Genome ¡2011 ¡

  13. Value ¡of ¡RNA-­‑seq ¡over ¡microarrays ¡ Davidson ¡et ¡al. ¡Plant ¡Genome ¡2011 ¡

  14. RNA-­‑seq ¡resolves ¡gene ¡structure ¡ Davidson ¡et ¡al. ¡Plant ¡Genome ¡2011 ¡

  15. Shared Expression Patterns of Orthologous Genes Male specific expression Orthologous Groups (protein Lvs Stg1 Stg2 Anth Pist Sd5 Sd10 Emb25 level clustering) Rice Rice – 1454 genes 519 74 149 411 Sorghum – 1456 genes 159 489 145 Sorghum Maize Maize – 1003 genes k-means clustering, k = 8 8 core tissues log2FPKM > 0.5 across libraries

  16. Improving ¡use ¡of ¡maize ¡as ¡a ¡biofuel ¡ feedstock ¡ Corn ¡Stover ¡ Corn ¡stover ¡is ¡an ¡important ¡source ¡of ¡ lignocellulosic ¡biomass ¡in ¡the ¡short ¡term ¡and ¡can ¡ be ¡used ¡as ¡a ¡model ¡C4 ¡grass ¡for ¡improvement ¡of ¡ dedicated ¡bioenergy ¡grasses ¡in ¡the ¡long ¡term ¡ CollaboraIon ¡with ¡the ¡Kaeppler/de ¡Leon ¡groups ¡at ¡ University ¡of ¡Wisconsin ¡(maize ¡geneIcists/ stalks, ¡leaves, ¡ breeders) ¡ husks, ¡cobs, ¡ ¡ tassels ¡ Goal ¡is ¡to ¡idenIfy ¡genes ¡(and ¡more ¡specifically ¡ alleles) ¡for ¡improved ¡biomass ¡yield ¡and ¡ composiIon ¡through ¡linkage ¡mapping, ¡gene ¡ expression, ¡and ¡linkage ¡disequilibrium ¡mapping ¡ ¡ Developed ¡diversity ¡panel ¡of ¡maize ¡inbred ¡lines ¡ adapted ¡to ¡Wisconsin=> ¡phenotype, ¡genotype ¡ ¡

  17. Underlying ¡Causes ¡of ¡Phenotypic ¡Diversity ¡ Sequence ¡Level ¡ Structural ¡VariaIon ¡ Gene ¡Expression ¡VariaIon ¡– ¡ VariaIon ¡(SNPs, ¡ (Copy ¡Number ¡VariaIon ¡ Gene ¡and ¡Isoform ¡level ¡variaIon ¡ small ¡InserIons/ – ¡CNV ¡and ¡Presence/ (quanItaIve ¡expression ¡ DeleIons) ¡ Absence ¡VariaIon ¡– ¡PAV) ¡ differences) ¡ ¡ Phenotypic ¡Diversity ¡ Underlying ¡geneIc ¡variaIon ¡that ¡can ¡be ¡evaluated ¡with ¡RNA-­‑seq ¡

  18. UIlity ¡of ¡RNAseq ¡for ¡Variant ¡DetecIon ¡ MulIple ¡Copies ¡of ¡Genes ¡ Extensive ¡repeIIve ¡intergenic ¡sequence ¡ Whole ¡Genome ¡ Sequencing ¡ ~30% ¡of ¡reads ¡are ¡informaIve ¡ 2.3 ¡Gb ¡of ¡sequence ¡ RNAseq ¡ ~60% ¡of ¡reads ¡are ¡informaIve ¡ 97 ¡Mb ¡of ¡sequence ¡

  19. UIlity ¡of ¡RNAseq ¡for ¡Variant ¡DetecIon ¡ • RNA-­‑seq ¡limitaIons ¡ – Genes/alleles ¡must ¡be ¡expressed ¡in ¡the ¡Issue ¡ used ¡to ¡detect ¡variants ¡ • Seedling ¡Issue ¡has ¡a ¡high ¡percentage ¡of ¡genes ¡(66%) ¡ expressed ¡ (Sekhon ¡and ¡Lin ¡et ¡al., ¡2011) ¡ • Genotypes ¡in ¡this ¡study ¡are ¡highly ¡homozygous ¡ removing ¡concerns ¡of ¡allele ¡specific ¡expression ¡

Download Presentation
Download Policy: The content available on the website is offered to you 'AS IS' for your personal information and use only. It cannot be commercialized, licensed, or distributed on other websites without prior consent from the author. To download a presentation, simply click this link. If you encounter any difficulties during the download process, it's possible that the publisher has removed the file from their server.

Recommend


More recommend