genome sequencing part 1
play

Genome Sequencing (Part 1) Lecture 4: August 30, 2012 - PowerPoint PPT Presentation

Genome Sequencing (Part 1) Lecture 4: August 30, 2012 Review from Last Lecture De novo vs. Re-sequencing De novo assembly (from the


  1. Genome ¡Sequencing ¡(Part ¡1) ¡ Lecture ¡4: ¡August ¡30, ¡2012 ¡ ¡

  2. Review ¡from ¡Last ¡Lecture ¡

  3. De ¡novo ¡vs. ¡Re-­‑sequencing ¡ • De ¡novo ¡ assembly ¡(“from ¡the ¡beginning”) ¡ implies ¡that ¡you ¡have ¡no ¡prior ¡knowledge ¡of ¡ the ¡genome. ¡ ¡No ¡reference, ¡no ¡conNgs, ¡only ¡ reads. ¡ • Re-­‑sequencing ¡assembly ¡assumes ¡you ¡have ¡a ¡ copy ¡of ¡the ¡reference ¡genome ¡(that ¡has ¡been ¡ verified ¡to ¡a ¡certain ¡degree). ¡ • The ¡programs ¡that ¡work ¡for ¡re-­‑sequencing ¡will ¡ not ¡work ¡for ¡de ¡novo ¡and ¡vice ¡versa. ¡However, ¡ both ¡can ¡create ¡copies ¡of ¡the ¡genome. ¡

  4. De ¡novo ¡vs. ¡Re-­‑sequencing ¡

  5. Sample ¡PreparaNon ¡ Re-sequencing (LOCAS, Shrimp) requires 15x to 30x coverage. Anything less and re-sequencing programs will not produce results or produce questionable results. Fragments

  6. Sample ¡PreparaNon ¡ De-novo assembly requires higher coverage. At least 30x but upwards to 100x’s coverage. Most de novo assemblers require paired-end data. Fragments

  7. IntroducNon ¡and ¡History ¡

  8. Sample ¡PreparaNon ¡

  9. Sample ¡PreparaNon ¡ Fragments ¡

  10. Sample ¡PreparaNon ¡ Fragments ¡ Sequencing ¡ Next ¡GeneraNon ¡Sequencing ¡(NGS) ¡ ACGTAGAATCGACCATG ACGTAGAATACGTAGAA GGGACGTAGAATACGAC Reads ¡

  11. Sample ¡PreparaNon ¡ Fragments ¡ Sequencing ¡ Reads ¡ ACGTAGAATACGTAGAA Assembly ¡ ACGTAGAATCGACCATG GGGACGTAGAATACGAC ACGTAGAATACGTAGAAACAGATTAGAGAG… ConNgs ¡

  12. Sample ¡PreparaNon ¡ Fragments ¡ Sequencing ¡ Reads ¡ Assembly ¡ ConNgs ¡ Analysis ¡

  13. Sample ¡PreparaNon ¡ Our ¡focus ¡for ¡today’s ¡lecture: ¡ 1. Comparison ¡of ¡sequencing ¡ Fragments ¡ plaXorms ¡ 2. Details ¡of ¡sample ¡preparaNon ¡ Sequencing ¡ 3. DefiniNons ¡and ¡terminologies ¡ concerning ¡data ¡and ¡ sequencing ¡plaXorms ¡ Reads ¡ Assembly ¡ ConNgs ¡ Analysis ¡

  14. Landmarks ¡in ¡Sequencing ¡ Efficiency ¡ ¡ Year ¡ Event ¡ (bp/person/year) ¡ 1870 ¡ Miescher: ¡ ¡Discovers ¡DNA ¡ 1940 ¡ Avery: ¡ ¡Proposes ¡DNA ¡as ¡“GeneNc ¡Material” ¡ 1953 ¡ Watson ¡& ¡Crick: ¡ ¡Double ¡Helix ¡Structure ¡of ¡DNA ¡ 1 ¡ 1965 ¡ Holley: ¡ ¡Sequenced ¡transfer ¡RNA ¡from ¡Yeast ¡ 1,500 ¡ 1977 ¡ Maxam ¡& ¡Gilbert: ¡"DNA ¡sequencing ¡by ¡chemical ¡degradaNon” ¡ Sanger: ¡“DNA ¡sequencing ¡with ¡chain-­‑terminaNng ¡inhibitors” ¡ 1980 ¡ Messing: ¡DNA ¡cloning ¡ 15,000 ¡ 1981 ¡ Messing: ¡Messing ¡and ¡his ¡colleagues ¡developed ¡“shotgun ¡ sequencing” ¡method ¡ 25,000 ¡ 1986 ¡ Hood ¡et ¡al.: ¡ ¡ParNal ¡AutomaNon ¡ 1987 ¡ ABI ¡markets ¡the ¡first ¡sequencing ¡plaXorm, ¡ABI ¡370 ¡

  15. Landmarks ¡in ¡Sequencing ¡ Efficiency ¡ ¡ Year ¡ Event ¡ (bp/person/year) ¡ 50,000 ¡ 1990 ¡ NIH ¡begins ¡large-­‑scale ¡sequencing ¡trials ¡of ¡bacteria ¡genomes. ¡ 200,000 ¡ 1995 ¡ Craig ¡Venture ¡and ¡Hamilton ¡Smith ¡at ¡the ¡InsNtute ¡for ¡ Genomic ¡Research ¡(TIGR) ¡published ¡the ¡first ¡complete ¡ genome ¡of ¡a ¡free-­‑living ¡organism ¡in ¡Science. ¡ ¡This ¡marks ¡the ¡ first ¡use ¡of ¡whole-­‑genome ¡shotgun ¡sequencing, ¡eliminaNng ¡ the ¡need ¡for ¡iniNal ¡mapping ¡efforts. ¡ ¡ 2001 ¡ A ¡drai ¡of ¡the ¡human ¡genome ¡was ¡published ¡in ¡Science. ¡ 2001 ¡ A ¡drai ¡of ¡the ¡human ¡genome ¡was ¡published ¡in ¡Nature. ¡ 50,000,000 ¡ 2002 ¡ 454 ¡Life ¡Sciences ¡comes ¡out ¡with ¡a ¡pyrosequencing ¡machine. ¡ 100,000,000 ¡ 2008 ¡ Next ¡generaNon ¡sequencing ¡machines ¡arrive. ¡ Huge ¡ 2011 ¡ Oxford ¡Nanopore: ¡600 ¡Million ¡base ¡pairs ¡per ¡hour. ¡ ¡

  16. Robert ¡Holley ¡and ¡team ¡in ¡1965 ¡ Watson ¡and ¡Crick ¡ Messing: ¡World’s ¡most-­‑cited ¡ ¡ scienNst ¡ Francis ¡and ¡Collins: ¡Private ¡Human ¡Genome ¡project. ¡ ¡

  17. Next-­‑Gen ¡Sequencing ¡PlaXorms ¡ 454/Roche ¡GS-­‑20/FLX ¡ (2005) ¡ PacBio ¡RS ¡(2009-­‑2010) ¡ 3 rd ¡generaNon? ¡ Illumina ¡HISeq ¡ ¡ (2007) ¡

  18. Comparison ¡of ¡NGS ¡PlaXorms ¡ Technology ¡ Reads ¡per ¡run ¡ Average ¡Read ¡ bp ¡per ¡run ¡ Types ¡of ¡ Length ¡ errors ¡ 454 ¡(Roche) ¡ 400,000 ¡ 250-­‑1000bp ¡ 70 ¡Million ¡ SubsNtuNon ¡ SoLID ¡(ABI) ¡ 88-­‑132 ¡Million ¡ 35bp ¡ 1 ¡Billion ¡ Illumina ¡HISeq ¡ 150 ¡Million ¡ 100 ¡– ¡200bp ¡ 15 ¡Billion ¡ SubsNtuNon ¡ with ¡ exponenNal ¡ increase ¡ PacBio ¡ 45,000 ¡ 1000-­‑2000bp ¡ 45 ¡Million ¡ InserNons ¡and ¡ deleNons ¡ \ ¡

  19. Sequencing ¡Methods ¡and ¡ Terminology ¡

  20. Sanger ¡Sequencing ¡ • The ¡key ¡principle ¡of ¡the ¡Sanger ¡method ¡was ¡the ¡ dideoxynucleoNde ¡triphosphates ¡(ddNTPs) ¡as ¡ DNA ¡chain ¡terminators. ¡ ¡ • These ¡ddNTPs ¡will ¡also ¡be ¡radioacNvely ¡for ¡ detecNon ¡in ¡automated ¡sequencing ¡machines. ¡ • PosiNves: ¡longer ¡reads ¡(600 ¡to ¡1000 ¡bp). ¡ • NegaNves: ¡poor ¡coverage ¡(6x), ¡expensive, ¡ inaccurate. ¡ ¡ ¡ • SNll ¡commonly ¡used ¡for ¡small ¡scale ¡sequencing. ¡

  21. Sanger ¡Sequencing ¡Video ¡

  22. Sanger ¡Sequencing ¡ DNA target sample SHEAR

  23. Sanger ¡Sequencing ¡ DNA target sample SHEAR Close each fragment many times. T ¡ T ¡ A ¡ A ¡ T ¡ A ¡ A ¡ T ¡ C ¡ G ¡ C ¡ G ¡ C ¡ G ¡ C ¡ G ¡

  24. Sanger ¡Sequencing ¡ DNA target sample SHEAR T T ¡ T ¡ A ¡ A ¡ A T ¡ A ¡ A ¡ T ¡ C C ¡ G ¡ C ¡ G ¡ C ¡ G ¡ C ¡ G ¡ G 28 ¡

  25. Sanger ¡Sequencing ¡ Primer ¡ DNA ¡polymerase ¡ T ¡ A A ¡ C ¡ G ¡

  26. Sanger ¡Sequencing ¡ Primer ¡ DNA ¡polymerase ¡ T ¡ A A ¡ C ¡ G ¡ T ¡ A A ¡ Primer ¡ C ¡ G ¡ DNA ¡polymerase ¡

  27. Sanger ¡Sequencing ¡ A ¡ Primer ¡ G ¡ DNA ¡polymerase ¡ C ¡ C ¡ G ¡ A ¡ T ¡ A A ¡ C ¡ C ¡ G ¡ T ¡ A ¡ C ¡ T ¡ A ¡ C ¡ T ¡

  28. Sanger ¡Sequencing ¡ A ¡ Primer ¡ G ¡ DNA ¡polymerase ¡ C ¡ G ¡ C ¡ G ¡ A ¡ T ¡ A A ¡ C ¡ C ¡ G ¡ T ¡ A ¡ C ¡ T ¡ A ¡ C ¡ T ¡

  29. Sanger ¡Sequencing ¡ A ¡ Primer ¡ G ¡ C ¡ G ¡ C ¡ G ¡ G ¡ A ¡ T ¡ A A ¡ C ¡ C ¡ G ¡ T ¡ A ¡ C ¡ T ¡ A ¡ C ¡ T ¡

  30. Sanger ¡Sequencing ¡ A ¡ Primer ¡ G ¡ C ¡ G ¡ C ¡ G ¡ G ¡ C ¡ A ¡ T ¡ A A ¡ C ¡ C ¡ G ¡ T ¡ A ¡ C ¡ T ¡ A ¡ C ¡ T ¡

  31. Sanger ¡Sequencing ¡ A ¡ Primer ¡ G ¡ C ¡ G ¡ C ¡ G ¡ G ¡ C ¡ A ¡ T ¡ T ¡ A A ¡ C ¡ G ¡ C ¡ G ¡ T ¡ A ¡ A ¡ C ¡ T ¡ A ¡ C ¡ T ¡

  32. Sanger ¡Sequencing ¡ A ¡ Primer ¡ G ¡ C ¡ C ¡ G ¡ A ¡ C ¡ T ¡ A ¡ C ¡ T ¡ A ¡ C ¡ T ¡

  33. Sanger ¡Sequencing ¡ A ¡ Primer ¡ G ¡ C ¡ C ¡ G ¡ A ¡ C ¡ T ¡ A ¡ C ¡ ConNnue ¡unNl ¡all ¡strands ¡of ¡DNA ¡ ¡ T ¡ have ¡undergone ¡this ¡reacNon. ¡ ¡If ¡you ¡ choose ¡the ¡reagents ¡correctly ¡then ¡you ¡ ¡ A ¡ should ¡have ¡all ¡possible ¡A-­‑terminated ¡ ¡ C ¡ strands; ¡resulNng ¡in ¡sequences ¡of ¡varying ¡ T ¡ lengths. ¡

  34. Sanger ¡Sequencing ¡

  35. Sanger ¡Sequencing ¡ In ¡the ¡radioacNve ¡gel, ¡the ¡longer ¡DNA ¡fragments ¡ move ¡to ¡the ¡bopom ¡and ¡the ¡shorter ¡ones ¡move ¡to ¡ ¡ the ¡top. ¡ ¡ ¡ ¡ Aierward ¡the ¡sequence ¡can ¡be ¡read ¡off ¡by ¡going ¡ ¡ from ¡top ¡to ¡bopom. ¡

Download Presentation
Download Policy: The content available on the website is offered to you 'AS IS' for your personal information and use only. It cannot be commercialized, licensed, or distributed on other websites without prior consent from the author. To download a presentation, simply click this link. If you encounter any difficulties during the download process, it's possible that the publisher has removed the file from their server.

Recommend


More recommend