using gvf for clinical annota3on of personal genomes
play

Using GVF for Clinical Annota3on of Personal Genomes . - PowerPoint PPT Presentation

Using GVF for Clinical Annota3on of Personal Genomes . Barry Moore, Shawn Rynearson, Fiona Cunningham, Graham Ritchie, Karen Eilbeck Ensembl and


  1. Using ¡GVF ¡for ¡Clinical ¡Annota3on ¡of ¡ Personal ¡Genomes ¡ . ¡ ¡ Barry ¡Moore, ¡Shawn ¡Rynearson, ¡ Fiona ¡Cunningham, ¡Graham ¡Ritchie, ¡ Karen ¡Eilbeck ¡ Ensembl ¡and ¡University ¡of ¡Utah ¡ ¡

  2. Challenges ¡of ¡translaConal ¡genomics ¡ • The ¡size, ¡scope ¡and ¡complexity ¡of ¡genomic ¡ data ¡provides ¡many ¡challenges ¡to ¡efficient ¡use ¡ in ¡medicine. ¡ • How ¡do ¡we ¡describe ¡a ¡personal ¡genome? ¡ • What ¡is ¡needed ¡for ¡inclusion ¡of ¡genomic ¡data ¡ into ¡the ¡EHR. ¡ • What ¡level ¡of ¡complexity ¡is ¡needed ¡for ¡each ¡ kind ¡of ¡user? ¡

  3. Today’s ¡talk ¡ • MoCvaCon: ¡The ¡genomic ¡variant ¡informaCon ¡ boNle ¡neck ¡ • Sequence ¡AnnotaCon ¡– ¡the ¡Sequence ¡ Ontology ¡ • EHR ¡standards ¡ • GVFClin ¡is ¡a ¡variant ¡file ¡with ¡standards ¡

  4. Technical ¡desiderata ¡for ¡the ¡integra3on ¡of ¡genomic ¡data ¡into ¡the ¡ medical ¡record ¡(Masys ¡et ¡al ¡2011) ¡ 1 ¡ Maintain ¡separaCon ¡of ¡primary ¡molecular ¡observaCons ¡from ¡the ¡ clinical ¡interpretaCons ¡of ¡those ¡data ¡ 2 ¡ Support ¡lossless ¡compression ¡from ¡primary ¡molecular ¡observaCons ¡ to ¡clinically ¡manageable ¡subsets ¡ 3 ¡ Maintain ¡linkage ¡of ¡molecular ¡observaCons ¡to ¡the ¡laboratory ¡ methods ¡used ¡to ¡generate ¡them ¡ 4 ¡ Support ¡compact ¡representaCon ¡of ¡clinically ¡acConable ¡subsets ¡for ¡ opCmal ¡performance ¡ 5 ¡ Simultaneously ¡support ¡human ¡viewable ¡formats ¡and ¡machine ¡ readable ¡formats ¡in ¡order ¡to ¡facilitate ¡implementaCon ¡of ¡decision ¡ support ¡rules ¡ 6 ¡ AnCcipate ¡fundamental ¡changes ¡in ¡the ¡understanding ¡of ¡human ¡ molecular ¡variaCon ¡ 7 ¡ Support ¡both ¡individual ¡clinical ¡ ¡care ¡and ¡discovery ¡science ¡

  5. Kinds ¡of ¡genomic ¡test ¡ • Known ¡disease ¡variants ¡ – Single ¡gene ¡sequenced ¡ – Panel ¡of ¡genes ¡sequenced ¡ • Unknown ¡variant ¡sought ¡ – Exome ¡sequenced ¡ – Genome ¡sequence ¡ – Trio ¡family ¡genome/exome ¡sequenced ¡

  6. NG ¡sequencing ¡bioinformaCcs ¡ • Base ¡calling ¡– ¡done ¡by ¡sequencing ¡machine ¡trace ¡ files ¡and ¡fastq ¡files ¡ • Read ¡mapping ¡(mappers ¡and ¡aligners) ¡BWA, ¡Bfast ¡ and ¡BowCe ¡produce ¡SAM/BAM ¡files ¡ • Alignment ¡polishing ¡– ¡remove ¡duplicate ¡reads ¡ and ¡re-­‑align ¡around ¡indels ¡ • SNP ¡calling ¡uses ¡BAM ¡files, ¡produces ¡variant ¡files ¡ • Structural ¡variant ¡detecCon ¡– ¡large ¡deleCons ¡etc ¡ • Variant ¡prioriCzaCon ¡– ¡which ¡of ¡these ¡3 ¡million ¡ variants ¡caused ¡the ¡disorder? ¡

  7. HL7 Clinician Orders NGS Exome or Genome Message NGS Exome/Genome Genomics ¡ FASTQ Sequencing Reads Aligned to Reference BAM/SAM Assembly Variant Calling Pipeline VCF/GVF InformaCon ¡ GVFclin boNleneck ¡ Annotate, ¡prioriCze, ¡analyze ¡ Medicine ¡ HL7 Diagnostic Report Message Clinician Counsels and Treats EHR Patient

  8. Current ¡state ¡of ¡the ¡art ¡ • Paper/PDF ¡geneCc ¡reports ¡ • The ¡tesCng ¡laboratory ¡faxes ¡or ¡emails ¡a ¡text ¡ write ¡up ¡of ¡the ¡result ¡and ¡interpretaCon ¡to ¡ the ¡clinic. ¡ • The ¡genomic ¡data ¡does ¡not ¡oden ¡enter ¡the ¡ EHR. ¡ • The ¡HL7 ¡working ¡group ¡is ¡creaCng ¡a ¡drad ¡ geneCc ¡test ¡report. ¡

  9. Inside ¡the ¡EHR ¡ CDS system monitors genomic information: provides alerts Variants in EHR Interpretation Diagnostic Clinician Report Counsels and Treats Patient Patient data archive Discovery Science The ¡variants ¡need ¡to ¡be ¡computaConally ¡amenable ¡to ¡both ¡scienCfic ¡ discovery ¡such ¡as ¡cohort ¡collecCon, ¡and ¡to ¡Clinical ¡Decision ¡Support ¡ Systems ¡

  10. Sequence ¡Ontology ¡provides ¡a ¡ community ¡developed ¡and ¡approved ¡ vocabulary ¡for ¡annotaCon ¡ • GVF ¡heavily ¡relies ¡on ¡the ¡terminology ¡ provided ¡by ¡SO ¡ • www.sequenceontology.org ¡ • SO ¡is ¡used ¡for ¡reference ¡sequence ¡annotaCon ¡ ¡

  11. Sequence ¡Ontology ¡ • Funded ¡by ¡the ¡NHGRI ¡since ¡2003 ¡ • Grew ¡out ¡of ¡the ¡Gene ¡Ontology ¡project ¡ • Describes ¡genomic ¡features ¡such ¡as ¡the ¡parts ¡ of ¡gene ¡models, ¡transposons, ¡assembly ¡ components, ¡ ¡experimental ¡results ¡relaCng ¡to ¡ genome ¡sequence ¡such ¡as ¡alignments ¡ • Describes ¡the ¡kinds ¡of ¡variants, ¡the ¡effect ¡of ¡ variants, ¡and ¡the ¡locaCon ¡of ¡variants ¡within ¡ exisCng ¡features. ¡

  12. 3 ¡aspects ¡for ¡variant ¡annotaCon ¡ • The ¡sequence ¡alteraCon ¡ • The ¡affected ¡feature ¡ ¡ • The ¡consequence ¡of ¡the ¡alteraCon ¡on ¡the ¡ feature ¡

  13. Kinds ¡of ¡alteraCon ¡

  14. sequence_variant ¡ structural_variant ¡ funcConal_variant ¡ feature_variant ¡ feature_ablaCon ¡ feature_amplificaCon ¡ feature_translocaCon ¡ feature_fusion ¡ transcript_ablaCon ¡ transcript_amplificaCon ¡ transcript_translocaCon ¡ transcript_fusion ¡ gene_variant ¡ feature_elongaCon ¡ feature_truncaCon ¡ regulatory_region_ablaCon ¡ regulatory_region_amplificaCon ¡ regulatory_region_translocaCon ¡ regulatory_region_variant ¡ regulatory_region_fusion ¡ terminal_elongaCon ¡ internal_elongaCon ¡ TFBS_ablaCon ¡ TFBS_translocaCon ¡ TFBS_amplificaCon ¡ TFBS_fusion ¡

  15. feature_variant ¡ upstream_gene_variant ¡ downstream_gene_variant ¡ 5KB_upstream_variant ¡ regulatory_region_variant ¡ gene_variant ¡ 5KB_downstream_variant ¡ splicing_variant ¡ 500B_downstream_variant ¡ 2KB_upstream_variant ¡ TFBS_variant ¡ splice_region_variant ¡ transcript_variant ¡ complex_change_in_transcript ¡ exon_variant ¡ non_coding_exon_variant ¡ coding_sequence_variant ¡ NMD_transcript_variant ¡ intron_variant ¡ protein_altering_variant ¡ nc_transcript_variant ¡ splice_site_variant ¡ terminator_codon_variant ¡ frameshiG_variant ¡ mature_miRNA_variant ¡ synonymous_variant ¡ inframe_variant ¡ splice_donor_variant ¡ frameshid_ ¡ frameshid_ ¡ splice_acceptor_variant ¡ elongaCon ¡ UTR_variant ¡ truncaCon ¡ incomplete_terminal_codon_variant ¡ 3_prime_UTR_variant ¡ stop_retained_variant ¡ inframe_indel ¡ ini3ator_codon_variant ¡ 5_prime_UTR_variant ¡ stop_lost ¡ stop_gained ¡ missense_variant ¡ inframe_inser3on ¡ inframe_dele3on ¡

  16. ExisCng ¡standards ¡in ¡the ¡EHR ¡ • Especially ¡important ¡now ¡because ¡of ¡the ¡ HITEC ¡act. ¡Providers ¡must ¡reach ¡a ¡set ¡of ¡goals ¡ to ¡get ¡subsidy. ¡ • One ¡of ¡the ¡goals ¡is ¡to ¡use ¡standards ¡such ¡as: ¡ – LOINC ¡-­‑ ¡to ¡idenCfy ¡tests ¡ – SNOMED-­‑CT ¡-­‑ ¡name ¡diseases ¡etc. ¡ – RxNorm ¡-­‑ ¡name ¡drugs ¡ • Goes ¡by ¡the ¡name ¡of ¡‘meaningful ¡use’ ¡

  17. TranslaCon ¡to ¡health ¡record ¡ • Integrate ¡research ¡type ¡data ¡with ¡established ¡ EHR ¡ ¡ • Not ¡so ¡easy ¡as ¡EHR ¡uses ¡established ¡non ¡ genomic ¡standards ¡and ¡research ¡is ¡a ¡moving ¡ target. ¡ • Following ¡HL7 ¡clinical ¡genomics ¡ recommendaCons ¡for ¡incorporaCng ¡genomic ¡ data ¡into ¡EHR. ¡

  18. GVFClin ¡is ¡an ¡annotated ¡variant ¡file ¡ • Variant ¡files ¡condense ¡the ¡whole ¡genome ¡into ¡list ¡ of ¡annotated ¡variants ¡(3 ¡billion ¡bases ¡to ¡3 ¡million ¡ changes) ¡ • VCF ¡ hNp://www.1000genomes.org/wiki/Analysis/ Variant%20Call%20Format/vcf-­‑variant-­‑call-­‑ format-­‑version-­‑41 ¡ • GVF ¡ hNp://www.sequenceontology.org/resources/ gvf.html ¡ ¡

Download Presentation
Download Policy: The content available on the website is offered to you 'AS IS' for your personal information and use only. It cannot be commercialized, licensed, or distributed on other websites without prior consent from the author. To download a presentation, simply click this link. If you encounter any difficulties during the download process, it's possible that the publisher has removed the file from their server.

Recommend


More recommend