The ¡Human ¡Mitochondrial ¡Locus ¡Specific ¡Database ¡
Anshu ¡Bhardwaj ¡ Scien=st, ¡CSIR ¡ India ¡ 9th ¡September ¡2012 ¡ Council ¡of ¡Scien=fic ¡and ¡Industrial ¡Research, ¡India ¡ AIMM2012 ¡
The Human Mitochondrial Locus Specific Database Council of - - PowerPoint PPT Presentation
The Human Mitochondrial Locus Specific Database Council of Scien=fic and Industrial Research, India Anshu Bhardwaj Scien=st, CSIR India AIMM2012 9 th September
The ¡Human ¡Mitochondrial ¡Locus ¡Specific ¡Database ¡
Anshu ¡Bhardwaj ¡ Scien=st, ¡CSIR ¡ India ¡ 9th ¡September ¡2012 ¡ Council ¡of ¡Scien=fic ¡and ¡Industrial ¡Research, ¡India ¡ AIMM2012 ¡
¡ ¡* ¡A ¡circular ¡molecule ¡ ¡ ¡* ¡Genome ¡size: ¡~16569bp ¡ ¡ ¡* ¡Maternally ¡inherited ¡ ¡ ¡* ¡Genes: ¡ ¡ ¡ ¡ ¡ ¡ ¡-‑2 ¡rRNAs ¡ ¡ ¡ ¡ ¡ ¡-‑22 ¡tRNAs ¡ ¡ ¡ ¡ ¡ ¡-‑13 ¡proteins ¡ * ¡Only ¡non-‑coding ¡region ¡is ¡d-‑loop ¡ * ¡Other ¡proteins ¡encoded ¡by ¡nuclear ¡ ¡DNA! ¡
mtDNA: ¡Genome ¡& ¡Organiza=on ¡
Nucleus ¡ Mitochondria ¡ CELL ¡ Varia=ons ¡
mtDNA ¡varia=ons: ¡Structural ¡and ¡Func=onal ¡complexity ¡ Genotype-‑Phenotype ¡correla=on ¡
Mitochondrial ¡dysfunc=on ¡has ¡pleiotropic ¡effects ¡leading ¡to ¡disease ¡ phenotypes ¡with ¡over-‑lapping ¡symptoms ¡ ¡
¡
More ¡than ¡250 ¡mtDNA ¡point ¡muta=ons ¡and ¡dele=ons ¡have ¡been ¡linked ¡ to ¡Human ¡Mitochondrial ¡disorders ¡& ¡over ¡3000 ¡varia=ons ¡have ¡ reported ¡for ¡the ¡16kb ¡genome ¡
¡ ¡Establishing ¡pathogenicity ¡of ¡a ¡sequence ¡change ¡in ¡mtDNA ¡is ¡a ¡major ¡ difficulty ¡despite ¡many ¡a`empts ¡made ¡in ¡this ¡direc=on ¡(for ¡example ¡– ¡ pathogenicity ¡criteria ¡developed ¡by ¡DiMauro ¡and ¡Schon ¡2001; ¡Turnbull ¡ 2004 ¡& ¡2006) ¡ ¡
Genotype-‑Phenotype ¡correla=on ¡in ¡mitochondrial ¡diseases ¡
Combined ¡evidence ¡based ¡approach ¡for ¡assessing ¡ cumula=ve ¡impact ¡of ¡mtDNA ¡varia=ons ¡ ¡
Priori=zed ¡varia=ons ¡ DATA ¡PROCESSING ¡ BMC ¡Bioinforma=cs. ¡2009 ¡Aug ¡27;10 ¡Suppl ¡8:S7. ¡
MtSNPscore: ¡a ¡combined ¡evidence ¡approach ¡for ¡assessing ¡cumula=ve ¡impact ¡of ¡mitochondrial ¡varia=ons ¡in ¡disease. ¡
Bhardwaj ¡A, ¡Mukerji ¡M, ¡Sharma ¡S, ¡Paul ¡J, ¡Gokhale ¡CS, ¡Srivastava ¡AK, ¡Tiwari ¡S ¡
Differ ¡in ¡frequency ¡ (cases ¡and ¡controls) ¡ Reported ¡ ¡ in ¡literature ¡ Regulatory ¡sites ¡ Computa=onal ¡ Predic=ons ¡
Parameters ¡
1 ¡
2 ¡
3 ¡
4 ¡
10 ¡ ¡1 ¡
Collaborator: ¡Dr. ¡Mitali ¡Mukerji ¡ ¡ ¡ ¡ ¡CSIR-‑IGIB ¡
Rare ¡variants ¡are ¡disease ¡associated ¡
Reported ¡ Predicted ¡ Only ¡one ¡published ¡report ¡ Supported ¡by ¡cybrid/func=onal ¡assay ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡6 ¡ Observed ¡in ¡par=cular ¡background ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡4 ¡ Reported ¡by ¡>1 ¡ ¡independent ¡groups ¡ Supported ¡by ¡a ¡cybrid/ ¡func=onal ¡assay ¡ ¡ ¡ ¡ ¡ ¡8 ¡ Observed ¡in ¡par=cular ¡background ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡6 ¡ ¡ Only ¡associa=on ¡studies ¡no ¡experimental ¡ ¡ ¡valida=on ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡6 ¡ Observed ¡in ¡par=cular ¡background ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡4 ¡ ¡ ¡ Protein ¡coding ¡gene ¡ SIFT ¡-‑ ¡Intolerant ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡5 ¡ SIFT ¡-‑ ¡Intolerant ¡Low ¡Confidence ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡2 ¡ PolyPhen ¡-‑ ¡Probably ¡damaging ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡5 ¡ PolyPhen ¡-‑ ¡Possible ¡damaging ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡3 ¡ PLHOST ¡-‑ ¡Invariant ¡base ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡6 ¡ Start/stop ¡codons ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡10 ¡ Varia=on ¡in ¡the ¡HRE ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡8 ¡ tRNA ¡genes ¡ Predicted ¡deleterious ¡by ¡EBCA ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡6 ¡ Varia=on ¡in ¡the ¡mTERF ¡(3243G) ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡8 ¡ Varia=on ¡in ¡the ¡mTERF ¡(3237-‑3240) ¡7 ¡ Varia=on ¡in ¡the ¡mTERF ¡(3237-‑3249) ¡6 ¡ rRNA ¡genes ¡ Varia=on ¡in ¡the ¡HRE ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡8 ¡ Other ¡regulatory ¡regions ¡ Light ¡Strand ¡Promoter ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡10 ¡ ¡ Heavy ¡Strand ¡Promoter ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡8 ¡
Combined ¡evidence ¡approach ¡for ¡assessing ¡cumula=ve ¡ impact ¡of ¡varia=ons ¡ ¡
10 ¡ 1 ¡
mRNA ¡ Protein ¡ tRNA ¡ rRNA ¡
Transcrip=on ¡ Transla=on ¡ Scoring ¡Scale ¡
mtDNA ¡
Bhardwaj ¡et ¡al ¡BMC ¡Bioinforma=cs ¡2009 ¡
Score ¡ Score ¡
Ataxia ¡Data ¡– ¡ ¡
¡ ¡ ¡genes ¡was ¡excluded ¡in ¡all ¡these ¡samples ¡ Complete ¡mitochondrial ¡genome ¡ sequences ¡of ¡Japanese ¡individuals ¡ belonging ¡to ¡6 ¡different ¡groups, ¡ with ¡96 ¡individuals ¡in ¡each ¡group ¡
Metabolic ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡Neurodegenera=ve ¡
mtSNP ¡Data– ¡ ¡ Case ¡study ¡with ¡Ataxia ¡and ¡mtSNP ¡data ¡
Frequency ¡difference ¡is ¡not ¡sufficient ¡to ¡priori=ze ¡disease ¡ associated ¡varia=ons ¡
All unique variation Variations with frequency difference Prioritized variations
Summary of selected variations compared to all SNPs with and without frequency difference 100 200 300 400 500 600 AT AD PD OB TH T2D T2DA Datasets Number of unique variations¡ ¡ ¡Almost ¡50% ¡of ¡the ¡total ¡varia=on ¡in ¡all ¡the ¡ ¡ ¡ ¡ ¡datasets ¡differ ¡in ¡frequency ¡between ¡normal ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡individuals ¡and ¡pa=ents ¡ * ¡When ¡the ¡func=onal ¡impact ¡of ¡each ¡varia=on ¡was ¡assessed ¡only ¡3-‑4% ¡ ¡ ¡ ¡ ¡ ¡of ¡the ¡total ¡varia=ons ¡were ¡priori=zed ¡ * ¡Our ¡method ¡predicted ¡84 ¡novel ¡puta=ve ¡disease ¡associated ¡varia=ons ¡ * ¡It ¡is ¡observed ¡that ¡rare ¡variants ¡are ¡the ¡high-‑scoring ¡varia=ons ¡ ¡
Need ¡is ¡to ¡have ¡a ¡centralized ¡database ¡of ¡mtDNA ¡varia=on ¡in ¡ standardized ¡format ¡which ¡is ¡community ¡editable ¡
Repeated ¡reports ¡of ¡‘Novel’ ¡muta=ons ¡in ¡context ¡of ¡disease ¡associa=on ¡ studies ¡– ¡ ¡-‑ ¡Varia=on ¡in ¡a ¡stretch ¡of ¡the ¡MT-‑ND3 ¡Gene ¡(MIM] ¡516002 ¡ ¡-‑ ¡mtDNA ¡muta=ons ¡in ¡a ¡rare ¡variety ¡of ¡hypertrophic ¡cardiomyopathy ¡ ¡-‑ ¡Varia=on ¡in ¡the ¡mt-‑tRNA ¡Cys ¡(MT-‑TC) ¡Gene ¡(MIM] ¡590020 ¡ ¡ Simple ¡Google ¡based ¡searches ¡iden=fy ¡these ¡varia=on, ¡however, ¡lack ¡of ¡a ¡ community ¡editable ¡central ¡database ¡leads ¡to ¡redundancy ¡in ¡repor=ng ¡ ‘novel’ ¡varia=ons ¡
Need ¡for ¡a ¡centralized ¡community ¡editable ¡plarorm ¡
h/p://onlinelibrary.wiley.com/store/10.1002/humu.20846/asset/20846_Sp.pdf?v=1&t=h6v8aqql&s=5a1d4569f9accd9a85f83d5f67d929cdb7e537df ¡
h`p://www.lovd.nl/2.0/ ¡
MitoMap ¡ mtDB ¡ OMIM ¡
mitoLSDB ¡
Ins=tutes ¡
Groups ¡ Individuals ¡
h0p://mitolsdb.igib.res.in ¡
¡ h/p://www.ianlogan.co.uk/checker/genbank.htm ¡ ¡ www.phylotree.org ¡ ¡ Am ¡J ¡Hum ¡Genet. ¡2009 ¡May;84(5):628-‑40 ¡
¡ ¡ MitoLSDB ¡provides ¡access ¡to ¡standardized ¡and ¡annotated ¡data ¡from ¡literature ¡ and ¡databases ¡on ¡mtDNA ¡encompassing ¡informa=on ¡from ¡– ¡ ¡ ¡ ¡ ¡ ¡ ¡ 5231 ¡individuals ¡ 675 ¡popula=ons ¡ 27 ¡phenotypes ¡ ¡ ¡
37 ¡genes ¡in ¡each ¡popula=on ¡ 132397 ¡variants ¡ 5147 ¡unique ¡variants ¡ ¡
MitoLSDB: data & coverage
For ¡each ¡variant ¡its ¡genomic ¡loca=on ¡as ¡per ¡the ¡Revised ¡Cambridge ¡Reference ¡ Sequence ¡
Codon ¡change ¡ ¡
Amino ¡acid ¡change ¡
Frequency ¡
Disease/phenotype ¡
Popula=on ¡
Tissue ¡
Genotyping ¡method ¡
References ¡and ¡remarks ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡Errors ¡documented ¡in ¡literature ¡which ¡includes: ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡94 ¡phantom ¡muta=ons, ¡10 ¡NUMTs, ¡six ¡documenta=on ¡errors ¡and ¡one ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡artefactual ¡recombina=on ¡
h/p://bioforensics.com/conference/mtDNA/mtmistakes.pdf ¡
MitoLSDB: data structure
Gene ¡wise ¡distribu=on ¡of ¡synonymous ¡& ¡non-‑synonymous ¡changes ¡
The ¡frequency ¡of ¡transi=ons ¡is ¡higher ¡than ¡transversions ¡ ¡
Numts ¡Cause ¡Confusion ¡ Due ¡to ¡their ¡sequence ¡similarity ¡to ¡ mtDNA, ¡numts ¡are ¡responsible ¡for ¡ many ¡instances ¡of ¡misiden`fica`on, ¡ both ¡in ¡mitochondrial ¡disease ¡studies ¡ and ¡phylogene`c ¡reconstruc`on. ¡ ¡ Mitochondrial ¡Disease ¡Confusions ¡ Even ¡HapMap ¡misclassified ¡varia`on ¡ in ¡pseudogene. ¡ ¡ Ancient ¡DNA ¡That ¡Isn't ¡Ancient ¡ Report ¡of ¡80-‑million-‑year-‑old ¡dinosaur ¡ bones ¡harbouring ¡DNA. ¡It ¡did ¡not ¡take ¡ long ¡to ¡uncover ¡the ¡real ¡source ¡of ¡ dinosaur ¡bone ¡DNA; ¡it ¡was ¡a ¡mtDNA ¡ pseuodgene ¡in ¡the ¡human ¡nuclear ¡ genome ¡now ¡called ¡a ¡numt. ¡
NUMTs ¡: ¡Nuclear ¡Mitochondrial ¡DNA ¡ ¡ ¡
h`p://www.plosgene=cs.org/ar=cle/info%3Adoi%2F10.1371%2Fjournal.pgen.1000834 ¡
associa=on ¡of ¡muta=ons ¡in ¡MT-‑CO1 ¡and ¡MT-‑CO2 ¡with ¡development ¡of ¡ Alzheimer’s ¡disease, ¡which ¡were ¡later ¡shown ¡to ¡be ¡an ¡artefact ¡resul=ng ¡from ¡ the ¡accidental ¡amplifica=on ¡of ¡nuclear ¡mitochondrial ¡pseudo ¡genes. ¡ ¡
according ¡to ¡its ¡haplogroup ¡status. ¡For ¡example, ¡the ¡sequence ¡ [GenBank:DQ826448] ¡lacks ¡an ¡addi=onal ¡nine ¡expected ¡variants ¡to ¡group ¡that ¡ sequence ¡into ¡haplogroup ¡M7b1. ¡ ¡
sequencing ¡process. ¡ ¡
Examples: ¡types ¡of ¡errors ¡or ¡data ¡discrepancy ¡issues ¡
These ¡errors ¡have ¡been ¡reported ¡in ¡the ¡‘remarks’ ¡sec=on ¡of ¡the ¡db ¡
Common ¡vs ¡Unique ¡set ¡of ¡varia=ons ¡across ¡popula=ons ¡
Visualiza=on ¡of ¡the ¡overlapping ¡vs ¡unique ¡varia=on ¡across ¡ en=re ¡dataset ¡
Phenotype ¡ Varia=on ¡
There ¡are ¡some ¡unique ¡varia=ons ¡to ¡each ¡phenotype ¡but ¡a ¡ majority ¡are ¡overlapping ¡
MitoLSDB ¡has ¡all ¡obligatory ¡ and ¡recommended ¡metadata ¡ listed ¡as ¡minimal ¡requirements ¡ for ¡LSDBs ¡ ¡ This ¡ensures ¡that ¡migra=on ¡to ¡ a ¡be`er/modified ¡metadata ¡ structure ¡is ¡possible ¡in ¡ automated ¡fashion ¡
h/p://www.gen2phen.org/post/lsdb-‑minimal-‑requirements-‑d34-‑compared-‑lovd-‑and-‑lsdb-‑xml-‑format ¡
Metadata ¡used ¡in ¡MitoLSDB ¡follows ¡the ¡standards ¡of ¡LOVD ¡
Variant/Exon ¡ Recommended ¡ Variant/DNA_genomic ¡ Obligatory ¡ Variant/DNA_coding ¡ Recommended ¡ Variant/RNA ¡ Obligatory ¡ Variant/Protein ¡ Obligatory ¡ Variant/DBID ¡ Obligatory ¡ Variant/Reference ¡ Obligatory ¡ Variant/DNA_published ¡ Recommended ¡ Variant/Detec`on/Template ¡ Obligatory ¡ Variant/Detec`on/Technique ¡ Obligatory ¡ Variant/DNA_remark ¡ Recommended ¡ Variant/Frequency ¡ Recommended ¡ Variant/Origin ¡ Recommended ¡ Variant/Allele ¡ Recommended ¡ Variant/Pathogenicity ¡ Recommended ¡ Pa`ent/Pa`ent_ID ¡ Obligatory ¡ Pa`ent/Phenotype/Disease ¡ Obligatory ¡ Pa`ent/Remarks ¡ Recommended ¡ Pa`ent/Origin/Geographic ¡ Recommended ¡ Pa`ent/Origin/Ethnic ¡ Recommended ¡ Pa`ent/Gender ¡ Recommended ¡ ID_submi/erid ¡ Obligatory ¡ Variant/HGNC ¡gene ¡Symbol ¡ Obligatory ¡
Controlled ¡vocabulary ¡for ¡repor=ng ¡phenotype ¡-‑ ¡MeSH ¡
Standard ¡metadata ¡and ¡controlled ¡vocabularies ¡facilitate ¡ interoperable ¡data ¡formats ¡for ¡web ¡services ¡and ¡workflow ¡engines ¡
standardized ¡and ¡presented ¡using ¡the ¡LOVD ¡plarorm. ¡ ¡
which ¡would ¡facilitate ¡researchers ¡in ¡genotype-‑phenotype ¡studies ¡and ¡also ¡ streamline ¡the ¡task ¡of ¡repor=ng ¡novel ¡muta=ons. ¡ ¡
and ¡help ¡understand ¡the ¡molecular ¡correlates ¡of ¡mitochondrial ¡disease ¡ phenotypes ¡
¡
variants ¡and ¡provide ¡a ¡solu=on ¡to ¡documented ¡issues ¡in ¡context ¡of ¡spurious ¡ reports ¡and ¡faulty ¡conclusions ¡on ¡disease ¡associa=on ¡status ¡of ¡mtDNA ¡variants ¡ ¡
Quick ¡recap ¡
Collabora9ve ¡ Standardisa9on ¡of ¡ Variome ¡Data ¡
A ¡Combined ¡evidence ¡based ¡ approach ¡for ¡assessing ¡cumula9ve ¡ impact ¡of ¡mtDNA ¡varia9ons ¡ ¡
Applica=ons ¡for ¡varia=on ¡data ¡analysis ¡and ¡standardiza=on ¡
h`p://mitolsdb.igib.res.in ¡
Developed ¡with ¡the ¡aim ¡to ¡func9on ¡as ¡the ¡ central ¡repository ¡for ¡mtDNA ¡varia9ons ¡with ¡ disease ¡informa9on ¡ 5147 ¡unique ¡varia=ons ¡in ¡37 ¡Genes ¡ ¡across ¡ 27 ¡Phenotypes ¡and ¡675 ¡popula=ons ¡ A ¡mitochondrial ¡DNA ¡(mtDNA) ¡ Varia9on ¡Database ¡for ¡Genotype ¡ to ¡Phenotype ¡Correla9ons ¡ ¡
Acknowledgements ¡
¡ ¡ ¡
Friends ¡and ¡Colleagues ¡@CSIR, ¡India ¡
h`p://www.lovd.nl/2.0/ ¡Shamna ¡Mole ¡
Saakshi ¡Jalali ¡ Vinod ¡Scaria ¡