genome sequencing introduc1on and history
play

Genome Sequencing Introduc1on and History Sample Prepara1on - PowerPoint PPT Presentation

Genome Sequencing Introduc1on and History Sample Prepara1on Sample Prepara1on Fragments Sample Prepara1on Fragments Sequencing Next Genera1on Sequencing (NGS)


  1. Genome ¡Sequencing ¡

  2. Introduc1on ¡and ¡History ¡

  3. Sample ¡Prepara1on ¡

  4. Sample ¡Prepara1on ¡ Fragments ¡

  5. Sample ¡Prepara1on ¡ Fragments ¡ Sequencing ¡ Next ¡Genera1on ¡Sequencing ¡(NGS) ¡ ACGTAGAATCGACCATG ACGTAGAATACGTAGAA GGGACGTAGAATACGAC Reads ¡

  6. Sample ¡Prepara1on ¡ Fragments ¡ Sequencing ¡ Reads ¡ ACGTAGAATACGTAGAA Assembly ¡ ACGTAGAATCGACCATG GGGACGTAGAATACGAC ACGTAGAATACGTAGAAACAGATTAGAGAG… Con1gs ¡

  7. Sample ¡Prepara1on ¡ Fragments ¡ Sequencing ¡ Reads ¡ Assembly ¡ Con1gs ¡ Analysis ¡

  8. Reference ¡Genome ¡ 9 ¡

  9. De ¡novo ¡vs. ¡Re-­‑sequencing ¡ • De ¡novo ¡ assembly ¡(“from ¡the ¡beginning”) ¡ implies ¡that ¡you ¡have ¡ no ¡prior ¡knowledge ¡of ¡ the ¡genome. ¡ ¡ ¡ • Re-­‑sequencing ¡assembly ¡assumes ¡you ¡have ¡a ¡ copy ¡of ¡the ¡reference ¡genome ¡(that ¡has ¡been ¡ verified ¡to ¡a ¡certain ¡degree). ¡ • The ¡programs ¡that ¡work ¡for ¡re-­‑sequencing ¡will ¡ not ¡work ¡for ¡ de ¡novo . ¡ ¡

  10. De ¡novo ¡vs. ¡Re-­‑sequencing ¡

  11. Sample ¡Prepara1on ¡ Re-sequencing (LOCAS, Shrimp) requires 15x to 30x coverage. Anything less and re-sequencing programs will not produce results or produce questionable results. Fragments

  12. Sample ¡Prepara1on ¡ De-novo assembly requires higher coverage. At least 30x but upwards to 100x’s coverage. Most de novo assemblers require paired-end data. Fragments

  13. Sample ¡Prepara1on ¡ Our ¡focus ¡for ¡today’s ¡lecture: ¡ 1. Comparison ¡of ¡sequencing ¡ Fragments ¡ plaSorms ¡ 2. Details ¡of ¡sample ¡prepara1on ¡ Sequencing ¡ 3. Defini1ons ¡and ¡terminologies ¡ concerning ¡data ¡and ¡ sequencing ¡plaSorms ¡ Reads ¡ Assembly ¡ Con1gs ¡ Analysis ¡

  14. History ¡and ¡Background ¡

  15. Landmarks ¡in ¡Sequencing ¡ Efficiency ¡ ¡ Year ¡ Event ¡ (bp/person/ year) ¡ 1870 ¡ Miescher: ¡ ¡Discovers ¡DNA ¡ 1940 ¡ Avery: ¡ ¡Proposes ¡DNA ¡as ¡“Gene1c ¡Material” ¡ 1953 ¡ Watson ¡& ¡Crick: ¡ ¡Double ¡Helix ¡Structure ¡of ¡DNA ¡ 1 ¡ 1965 ¡ Holley: ¡ ¡transfer ¡RNA ¡from ¡Yeast ¡ 1,500 ¡ 1977 ¡ Maxam ¡& ¡Gilbert: ¡"DNA ¡sequencing ¡by ¡chemical ¡ degrada1on” ¡ Sanger: ¡“DNA ¡sequencing ¡with ¡chain-­‑termina1ng ¡ inhibitors” ¡ 15,000 ¡ 1981 ¡ Messing ¡and ¡his ¡colleagues ¡developed ¡“shotgun ¡ sequencing” ¡method ¡ 25,000 ¡ 1987 ¡ ABI ¡markets ¡the ¡first ¡sequencing ¡plaSorm, ¡ABI ¡ 370 ¡

  16. Landmarks ¡in ¡Sequencing ¡ Efficiency ¡ ¡ Year ¡ Event ¡ (bp/person/year) ¡ 50,000 ¡ 1990 ¡ NIH ¡begins ¡large-­‑scale ¡sequencing ¡bacteria ¡genomes. ¡ 200,000 ¡ 1995 ¡ Craig ¡Venture ¡and ¡Hamilton ¡Smith ¡at ¡the ¡Ins1tute ¡for ¡ Genomic ¡Research ¡(TIGR) ¡published ¡the ¡first ¡complete ¡ genome ¡of ¡a ¡free-­‑living ¡organism ¡in ¡Science. ¡ ¡This ¡marks ¡the ¡ first ¡use ¡of ¡whole-­‑genome ¡shotgun ¡sequencing, ¡elimina1ng ¡ the ¡need ¡for ¡ini1al ¡mapping ¡efforts. ¡ ¡ 2001 ¡ A ¡drai ¡of ¡the ¡human ¡genome ¡was ¡published ¡in ¡Science. ¡ 2001 ¡ A ¡drai ¡of ¡the ¡human ¡genome ¡was ¡published ¡in ¡Nature. ¡ 50,000,000 ¡ 2002 ¡ 454 ¡Life ¡Sciences ¡comes ¡out ¡with ¡a ¡pyrosequencing ¡machine. ¡ 100,000,000 ¡ 2008 ¡ Next ¡genera1on ¡sequencing ¡machines ¡arrive. ¡ Huge ¡ 2011 ¡ Oxford ¡Nanopore: ¡600 ¡Million ¡base ¡pairs ¡per ¡hour. ¡ ¡

  17. Robert ¡Holley ¡and ¡team ¡in ¡1965 ¡ Watson ¡and ¡Crick ¡ Messing: ¡World’s ¡most-­‑cited ¡ ¡ scien1st ¡ Francis ¡and ¡Collins: ¡Private ¡Human ¡Genome ¡project. ¡ ¡

  18. Next-­‑Gen ¡Sequencing ¡PlaSorms ¡ 454/Roche ¡GS-­‑20/FLX ¡ (2005) ¡ PacBio ¡RS ¡(2009-­‑2010) ¡ 3 rd ¡genera1on? ¡ Illumina ¡HISeq ¡ ¡ (2007) ¡

  19. 23 ¡

  20. Comparison ¡of ¡PlaSorms ¡ Technology ¡ Reads ¡per ¡run ¡ Average ¡Read ¡ bp ¡per ¡run ¡ Types ¡of ¡ Length ¡ errors ¡ 454 ¡(Roche) ¡ 400,000 ¡ 250-­‑1000bp ¡ 70 ¡Million ¡ Subs1tu1on ¡ SoLID ¡(ABI) ¡ 88-­‑132 ¡Million ¡ 35bp ¡ 1 ¡Billion ¡ Illumina ¡HISeq ¡ 150 ¡Million ¡ 100 ¡– ¡200bp ¡ 15 ¡Billion ¡ Subs1tu1on ¡ with ¡ exponen1al ¡ increase ¡ PacBio ¡ 45,000 ¡ 1000-­‑2000bp ¡ 45 ¡Million ¡ Inser1ons ¡and ¡ dele1ons ¡ \ ¡

  21. Sequencing ¡Methods ¡and ¡ Terminology ¡

  22. Sanger ¡Sequencing ¡ • The ¡key ¡principle ¡of ¡the ¡Sanger ¡method ¡was ¡the ¡ dideoxynucleo1de ¡triphosphates ¡(ddNTPs) ¡as ¡ DNA ¡chain ¡terminators. ¡ ¡ • These ¡ddNTPs ¡will ¡also ¡be ¡radioac1vely ¡for ¡ detec1on ¡in ¡automated ¡sequencing ¡machines. ¡ • Posi1ves: ¡longer ¡reads ¡(600 ¡to ¡1000 ¡bp). ¡ • Nega1ves: ¡poor ¡coverage ¡(6x), ¡expensive, ¡ inaccurate. ¡ ¡ ¡ • S1ll ¡commonly ¡used ¡for ¡small ¡scale ¡sequencing. ¡

  23. Sanger ¡Sequencing ¡Video ¡

  24. Sanger ¡Sequencing ¡ DNA target sample SHEAR

  25. Sanger ¡Sequencing ¡ DNA target sample SHEAR Close each fragment many times. T ¡ T ¡ A ¡ A ¡ T ¡ A ¡ A ¡ T ¡ C ¡ G ¡ C ¡ G ¡ C ¡ G ¡ C ¡ G ¡

  26. Sanger ¡Sequencing ¡ DNA target sample SHEAR T T ¡ T ¡ A ¡ A ¡ A T ¡ A ¡ A ¡ T ¡ C C ¡ G ¡ C ¡ G ¡ C ¡ G ¡ C ¡ G ¡ G 30 ¡

  27. Sanger ¡Sequencing ¡ Primer ¡ DNA ¡polymerase ¡ T ¡ A A ¡ C ¡ G ¡

  28. Sanger ¡Sequencing ¡ Primer ¡ DNA ¡polymerase ¡ T ¡ A A ¡ C ¡ G ¡ T ¡ A A ¡ Primer ¡ C ¡ G ¡ DNA ¡polymerase ¡

  29. Sanger ¡Sequencing ¡ A ¡ Primer ¡ G ¡ DNA ¡polymerase ¡ C ¡ C ¡ G ¡ A ¡ T ¡ A A ¡ C ¡ C ¡ G ¡ T ¡ A ¡ C ¡ T ¡ A ¡ C ¡ T ¡

  30. Sanger ¡Sequencing ¡ A ¡ Primer ¡ G ¡ DNA ¡polymerase ¡ C ¡ G ¡ C ¡ G ¡ A ¡ T ¡ A A ¡ C ¡ C ¡ G ¡ T ¡ A ¡ C ¡ T ¡ A ¡ C ¡ T ¡

  31. Sanger ¡Sequencing ¡ A ¡ Primer ¡ G ¡ C ¡ G ¡ C ¡ G ¡ G ¡ A ¡ T ¡ A A ¡ C ¡ C ¡ G ¡ T ¡ A ¡ C ¡ T ¡ A ¡ C ¡ T ¡

  32. Sanger ¡Sequencing ¡ A ¡ Primer ¡ G ¡ C ¡ G ¡ C ¡ G ¡ G ¡ C ¡ A ¡ T ¡ A A ¡ C ¡ C ¡ G ¡ T ¡ A ¡ C ¡ T ¡ A ¡ C ¡ T ¡

  33. Sanger ¡Sequencing ¡ A ¡ Primer ¡ G ¡ C ¡ G ¡ C ¡ G ¡ G ¡ C ¡ A ¡ T ¡ T ¡ A A ¡ C ¡ G ¡ C ¡ G ¡ T ¡ A ¡ A ¡ C ¡ T ¡ A ¡ C ¡ T ¡

  34. Sanger ¡Sequencing ¡ A ¡ Primer ¡ G ¡ C ¡ C ¡ G ¡ A ¡ C ¡ T ¡ A ¡ C ¡ T ¡ A ¡ C ¡ T ¡

  35. Sanger ¡Sequencing ¡ A ¡ Primer ¡ G ¡ C ¡ C ¡ G ¡ A ¡ C ¡ T ¡ A ¡ C ¡ Con1nue ¡un1l ¡all ¡strands ¡of ¡DNA ¡ ¡ T ¡ have ¡undergone ¡this ¡reac1on. ¡ ¡If ¡you ¡ choose ¡the ¡reagents ¡correctly ¡then ¡you ¡ ¡ A ¡ should ¡have ¡all ¡possible ¡A-­‑terminated ¡ ¡ C ¡ strands; ¡resul1ng ¡in ¡sequences ¡of ¡varying ¡ T ¡ lengths. ¡

  36. Sanger ¡Sequencing ¡

  37. Sanger ¡Sequencing ¡ In ¡the ¡radioac1ve ¡gel, ¡the ¡longer ¡DNA ¡fragments ¡ move ¡to ¡the ¡bopom ¡and ¡the ¡shorter ¡ones ¡move ¡to ¡ ¡ the ¡top. ¡ ¡ ¡ ¡ Aierward ¡the ¡sequence ¡can ¡be ¡read ¡off ¡by ¡going ¡ ¡ from ¡top ¡to ¡bopom. ¡

Download Presentation
Download Policy: The content available on the website is offered to you 'AS IS' for your personal information and use only. It cannot be commercialized, licensed, or distributed on other websites without prior consent from the author. To download a presentation, simply click this link. If you encounter any difficulties during the download process, it's possible that the publisher has removed the file from their server.

Recommend


More recommend