Pa#ent Privacy and Research on Genomes March 16, 2015 - - PowerPoint PPT Presentation

pa ent privacy and research on genomes
SMART_READER_LITE
LIVE PREVIEW

Pa#ent Privacy and Research on Genomes March 16, 2015 - - PowerPoint PPT Presentation

Pa#ent Privacy and Research on Genomes March 16, 2015 - La Jolla, CA Lucila Ohno-Machado, MD, PhD funded by NIH U54 HL108460,


slide-1
SLIDE 1

Pa#ent ¡Privacy ¡and ¡Research ¡on ¡Genomes ¡ ¡ ¡

March ¡16, ¡2015 ¡ ¡-­‑ ¡ ¡La ¡Jolla, ¡CA ¡

Lucila ¡Ohno-­‑Machado, ¡MD, ¡PhD ¡

funded ¡by ¡NIH ¡U54 ¡HL108460, ¡R01HG007078, ¡K99HG008175 ¡ ¡ ¡ ¡ ¡ ¡

slide-2
SLIDE 2

Pa#ent ¡ Interac#on ¡

Data ¡Analysis ¡ StaGsGcs ¡ ¡ Machine ¡Learning ¡ ¡ Data ¡Structuring ¡ Natural ¡Language ¡Processing ¡ Data ¡Modeling ¡ ¡ Predic#ve ¡Modeling ¡ EvaluaGon ¡Methods ¡ ¡ Decision ¡Support ¡ Tools ¡ Guidelines, ¡Alert ¡& ¡ Reminders ¡ ¡ Data ¡Collec#on ¡Tools ¡ Clinical ¡Data ¡ Warehouse ¡ Data ¡Integra#on ¡ ¡ ¡ ¡Genomics ¡ Proteomics ¡ Sensors ¡ Data ¡De-­‑ Iden#fica#on ¡ Privacy ¡Technology ¡ ¡ Communica#on ¡Strategies ¡ Consumer ¡Health ¡InformaGcs ¡ ¡ Medical ¡EducaGon ¡ ¡

slide-3
SLIDE 3

Medicine ¡in ¡the ¡Era ¡of ¡Big ¡Data ¡

  • Biomedical ¡science ¡

is ¡moving ¡towards ¡ data-­‑driven ¡ approaches ¡

» 60+ ¡geneGc ¡variants ¡are ¡ adopted ¡in ¡clinical ¡pracGce ¡ » Sequencing ¡is ¡geYng ¡ cheaper ¡ » Family ¡history ¡data ¡is ¡ consider ¡as ¡"the ¡best ¡geneGc ¡ test ¡available” ¡ ¡

3 ¡

slide ¡from ¡Dr. ¡Xiaoqian ¡ ¡Jiang ¡

slide-4
SLIDE 4

Genomes ¡are ¡Biometrics ¡

PHI ¡requires ¡HIPAA ¡ protecGon ¡ ¡

  • Biometrics ¡require ¡

HIPAA ¡protecGon ¡ ¡ Biometrics ¡are ¡ ¡ Protected ¡Health ¡InformaGon ¡(PHI) ¡

slide-5
SLIDE 5

Health ¡Insurance ¡Portability ¡& ¡Accountability ¡Act ¡ HIPAA ¡

  • Security ¡ ¡

» Risk ¡of ¡disclosure ¡ » Liability ¡

  • Privacy ¡ ¡

» Risk ¡of ¡re-­‑idenGficaGon ¡ » Informed ¡consent ¡

  • PresidenGal ¡Commission ¡for ¡the ¡Study ¡of ¡

Bioethical ¡Issues. ¡Privacy ¡and ¡progress ¡in ¡whole ¡genome ¡

  • sequencing. ¡hdp://www.bioethics.gov ¡covers ¡genome ¡sequencing, ¡exome ¡

sequencing, ¡genome-­‑wide ¡SNV ¡analysis, ¡and ¡data ¡from ¡large ¡scale ¡genomic ¡ studies ¡

5 ¡

HIPAA ¡‘De-­‑idenGfied’ ¡data ¡

  • removal ¡of ¡18 ¡idenGfiers, ¡such ¡

as ¡dates, ¡biometrics, ¡names, ¡etc. ¡

  • expert ¡cerGficaGon ¡of ¡low ¡risk ¡of ¡

re-­‑idenGficaGon ¡ ¡

  • ‘Limited’ ¡data ¡sets ¡have ¡dates ¡
slide-6
SLIDE 6

6 ¡

slide-7
SLIDE 7

Precision Medicine

EHR Group recommendations

  • Patient participation: Blue button

rights (Synch for Science)

  • Patient portals: patient-reported

data

  • Security/privacy of EHR systems

1M people longitudinal cohort will want privacy protection Lots of data to protect

– Genomics, imaging, sensors – EHR data already harmonized to national standards – Point of care contact via EHR, mHealth – Health gaming, cloud, privacy – Biorepositories

slide-8
SLIDE 8

What ¡is ¡the ¡problem? ¡

  • Imagine ¡a ¡public ¡data ¡set ¡of ¡genomes ¡about ¡a ¡

certain ¡disease ¡(e.g., ¡Alzheimer’s) ¡

  • Can ¡you ¡find ¡out ¡if ¡your ¡neighbor ¡has ¡

Alzheimer’s? ¡

  • Same ¡problem ¡happens ¡with ¡clinical ¡data, ¡

which ¡can ¡be ¡re-­‑idenGfied ¡to ¡a ¡target ¡paGent ¡ ¡

» Dates ¡of ¡visits ¡ » CombinaGon ¡of ¡paGent ¡characterisGcs ¡

3/18/15 ¡ Supported ¡by ¡the ¡NIH ¡Grant ¡U54 ¡HL108460 ¡to ¡the ¡University ¡of ¡California, ¡San ¡Diego ¡ 8 ¡

slide-9
SLIDE 9

Bigger ¡data, ¡bigger ¡challenges ¡

  • High ¡dimensional ¡data ¡(e.g., ¡whole ¡genomic ¡

sequencing) ¡

  • Privacy ¡rules ¡(PHI, ¡including ¡genomic ¡data ¡need ¡

to ¡be ¡protected ¡under ¡HIPAA) ¡

  • InsGtuGonal ¡processes ¡(internal ¡review ¡boards) ¡
  • PaGent ¡informaGon ¡consent ¡
  • Clinical-­‑genomic ¡data ¡research ¡networks ¡

» Secure ¡mulGparty ¡computaGon ¡ » Homomorphic ¡encrypGon ¡

9 ¡

Jiang ¡X, ¡Sarwate ¡A, ¡Ohno-­‑Machado ¡L, ¡Privacy ¡technology ¡to ¡support ¡data ¡sharing ¡for ¡comparaGve ¡effecGveness ¡research: ¡ A ¡systemaGc ¡review, ¡Medical ¡Care, ¡51(8 ¡Suppl ¡3):S58-­‑65, ¡2013. ¡PMID: ¡23774511 ¡

adapted ¡ ¡from ¡Dr. ¡Xiaoqian ¡ ¡Jiang ¡

slide-10
SLIDE 10

Knowledge ¡ & ¡Tools ¡ Privacy ¡ Consent ¡ Data ¡

Our ¡Goals ¡in ¡iDASH ¡

  • Share ¡access ¡to ¡data ¡and ¡

computaGon ¡

  • Train ¡the ¡new ¡generaGon ¡of ¡

data ¡scienGsts ¡

  • Provide ¡innovaGve ¡sopware, ¡

plaqorm, ¡and ¡infrastructure ¡

  • Protect ¡privacy ¡

Develop ¡ » Algorithms ¡ » Tools ¡ » Infrastructure ¡ » Policies ¡

10 ¡

iDASH ¡

Knowledge ¡ ¡& ¡Tools ¡ Services ¡ Plaqorm ¡ Data ¡

Sensors Genomic Clinical

¡ ¡

Service ¡

WWW Apps Exec. Aggreg. Hosting Sharing Policies

Plaqorm ¡

Research Develop. Federation Supported ¡by ¡the ¡NIH ¡Grant ¡U54 ¡HL108460 ¡to ¡the ¡University ¡of ¡California, ¡San ¡Diego ¡

slide-11
SLIDE 11

Ohno-­‑Machado ¡L. ¡To ¡Share ¡or ¡Not ¡To ¡Share: ¡That ¡Is ¡Not ¡the ¡Ques;on. ¡Science ¡Transla;onal ¡Medicine, ¡2012 ¡4(165) ¡

Supported ¡by ¡the ¡NIH ¡Grant ¡U54 ¡HL108460 ¡to ¡the ¡University ¡of ¡California, ¡San ¡Diego ¡ 11 ¡

differenGal ¡privacy ¡ homomorphic ¡encrypGon ¡ secure ¡mulGparty ¡computaGon ¡

“commons” ¡

slide-12
SLIDE 12

iDASH ¡On-­‑Demand ¡Resources ¡

3/18/15 ¡ Supported ¡by ¡the ¡NIH ¡Grant ¡U54 ¡HL108460 ¡to ¡the ¡University ¡of ¡California, ¡San ¡Diego ¡ 12 ¡

Safe ¡ HIPAA-­‑compliant ¡ Annotated ¡ ¡ Data ¡deposit ¡box ¡ Environment ¡ On-­‑demand ¡ Virtualized ¡ ElasGc ¡ Resilient ¡ Compute ¡ ¡ And ¡ Storage ¡ Technology ¡ ¡ HIPAA ¡and ¡ ¡ non-­‑public ¡data ¡ public ¡data, ¡ tools, ¡recipes ¡

Powered ¡by ¡ ¡ MIDAS ¡

ü Data ¡ ü Tools ¡ ü Recipes ¡ upload ¡& ¡download ¡ data ¡ compute ¡request, ¡ direct ¡upload ¡& ¡download ¡of ¡ proprietary ¡data, ¡tool, ¡recipe ¡

middleware ¡and ¡HIPAA ¡security ¡developed ¡by ¡iDASH ¡

ü Compute ¡nodes ¡ ü Memory ¡ ü Disk ¡storage ¡ ü Networking ¡

¡ Powered ¡by ¡ ¡VMware ¡

AUTOMATED ¡

slide-13
SLIDE 13

OVERCAST ¡

3 ¡computa#on ¡#ers ¡ 3 ¡storage ¡#ers ¡ 10GbE ¡throughout ¡ Full ¡redundancy ¡ RSA ¡Two ¡Factor ¡Auth. ¡ Remote ¡data ¡replica#on ¡ 800+ ¡cores ¡ 7TB+ ¡RAM ¡ 600TB+ ¡storage ¡ More ¡planned: ¡ 600+ ¡cores ¡ 4TB+ ¡RAM ¡ 200TB+ ¡storage ¡

slide-14
SLIDE 14

Research ¡Data ¡ Clinical ¡Data ¡ Applica;ons ¡ Integra;on ¡

2008-­‑2009 ¡ 2010-­‑2011 ¡ 2012-­‑2013 ¡ 2014-­‑2015 ¡

Electronic ¡Health ¡ Record ¡System ¡ Epic ¡& ¡Clarity ¡ Other ¡Systems ¡ PACS, ¡lab, ¡etc ¡

Personnel ¡Systems ¡ AcGve ¡Directory ¡ Query ¡Tools ¡ UC-­‑ReX ¡Explorer ¡ Privacy ¡Technology ¡ Clinical ¡Research ¡ Data ¡ RedCAP ¡ Velos ¡ Other ¡DBs ¡ iDASH ¡HIPAA ¡ SHADE ¡ Images, ¡human ¡ genomes, ¡etc ¡ Analy#cal ¡Tools ¡ Recruitment ¡ Consent ¡tools ¡ Custom ¡Apps ¡ ¡VA ¡ LA ¡Clinics ¡ UCSF ¡ Davis ¡ Irvine ¡ UCLA ¡ Healthcare ¡Clinical ¡ Data ¡ Clinical ¡Data ¡ Warehouse ¡for ¡ Research ¡ Scalable ¡Network ¡ (Distributed ¡AnalyGcs ¡ Tools) ¡

HIPAA ¡

External ¡data ¡ (paGent ¡reported ¡ data) ¡ pSCANNER ¡ PCORI ¡CDRN ¡ iDASH ¡HIPAA/FISMA ¡ OVERCAST ¡ iDASH, ¡CTRI, ¡School ¡of ¡ Medicine ¡ De-­‑ID ¡Tools ¡

UCSD’s ¡ ¡ Journey ¡

SCANNER ¡ BRIGHT ¡ iDASH ¡ PhenDISCO ¡ NLM ¡Training ¡Grant ¡ K22, ¡K99 ¡ PCORI ¡contracts ¡ Cloud ¡ iCONCUR ¡ UC-­‑ReX ¡ pSCANNER ¡

Accrual ¡for ¡Clinical ¡Trials ¡

FISMA ¡ bioCADDIE ¡ Cancer ¡Genomics ¡ Text ¡Mining ¡/ ¡NLP ¡ USC/LAC ¡ Cedars ¡ Sinai ¡ San ¡Mateo ¡ Epic ¡ CDDS ¡ New ¡modules ¡

slide-15
SLIDE 15

Clinical Data Network – UC-ReX

  • Clinical ¡Data ¡Warehouses ¡

from ¡5 ¡Medical ¡Centers ¡ and ¡affiliated ¡insGtuGons ¡ exchange ¡(>12 ¡million ¡ paGents) ¡

  • Improve ¡paGent ¡safety ¡

surveillance, ¡quality ¡improvement, ¡ translaGonal ¡research ¡

¡

¡Funded ¡by ¡the ¡UC ¡Office ¡of ¡the ¡President ¡

slide-16
SLIDE 16

User requests data for Quality Improvement

  • r Research

Clinical Data Network

  • Identity & Trust

Management

  • Policy

enforcement Trusted Broker(s)

Big Healthcare Data, Big Clinical Sequencing Data

How ¡many ¡paGents ¡over ¡65 ¡are ¡on ¡ Warfarin ¡or ¡Dabigatran? ¡ ¡ What ¡are ¡the ¡major ¡and ¡minor ¡ bleeding ¡rates ¡for ¡paGents ¡on ¡these ¡ drugs, ¡adjusted ¡for ¡co-­‑morbidiGes? ¡ ¡ Which ¡CYP2C9 ¡variants ¡are ¡most ¡ influenGal? ¡

AHRQ R01HS19913 Kim ¡K, ¡et ¡al. ¡Development ¡of ¡a ¡Privacy ¡and ¡Security ¡Policy ¡ Framework ¡for ¡a ¡MulG-­‑State ¡ComparaGve ¡EffecGveness ¡ Research ¡Network. ¡Medical ¡Care ¡2013 ¡ ¡ Jiang ¡X ¡et ¡al. ¡Privacy ¡Technology ¡to ¡Support ¡Data ¡Sharing ¡for ¡ ComparaGve ¡EffecGveness ¡Research: ¡A ¡SystemaGc ¡Review. ¡ Medical ¡Care ¡2013 ¡ ¡ Kim ¡KK ¡et ¡al. ¡Data ¡Governance ¡Requirements ¡for ¡Distributed ¡ Clinical ¡Research ¡Networks: ¡TriangulaGng ¡PerspecGves ¡of ¡ Diverse ¡Stakeholders. ¡JAMIA ¡2014 ¡

Diverse Healthcare Entities in 3 different states (federal, state, private)

slide-17
SLIDE 17
  • Predictive modeling and adjustment for cofounders require lots of data
  • Some institutions cannot move data outside their firewalls
  • We can bring computation to the data

User requests data for Quality Improvement or Research

  • Identity & Trust

Management

  • Policy

enforcement Trusted Broker(s) Security Entity

AHRQ R01HS19913 / EDM forum

Distributed regression models

Wu Y et al. Grid Binary LOgistic REgression (GLORE): Building Shared Models Without Sharing Data. JAMIA 2012

Diverse Healthcare Entities in 3 different states (federal, state, private)

Privacy-­‑preserving ¡distributed ¡compuGng ¡

Scalable ¡NaGonal ¡Network ¡for ¡ ComparaGve ¡EffecGveness ¡Research ¡

slide-18
SLIDE 18

pSCANNER ¡ ¡

paGent-­‑centered ¡SCAlable ¡NaGonal ¡ Network ¡for ¡EffecGveness ¡Research ¡

¡

pSCANNER CENTRAL UCSF

3m

  • UCD

2.2m

  • UCLA

4.1m

  • UCI

1.4m

  • VA

8.7m

  • SFGH

0.5m

  • ?-

VM OMOP DATASET PREP TO STUDY

  • ALTAMED

0.3m

  • QUEENSCARE

19k

  • TCC

24k

  • QUERY

SUMMARY

  • UCSD

2.1m

  • Legend:

Patient count

  • Site

21 ¡M ¡people: ¡5 ¡UCs, ¡NaGonal ¡VA ¡(VINCI ¡resource), ¡3 ¡Federally ¡Qualified ¡Health ¡Systems ¡in ¡LA ¡(USC), ¡RAND ¡ 3 ¡Cohorts: ¡Kawasaki ¡Disease, ¡CongesGve ¡Heart ¡Failure, ¡Obesity ¡

TCC: The Children’s Clinic VM: Virtual Machine SFGH: San Francisco General Hospital OMOP: Observational Medical Outcomes Partnership

¡ New ¡Partners ¡

(~9 ¡M ¡people) ¡ ¡ ¡

  • Cedars-­‑Sinai ¡
  • USC ¡Keck ¡/ ¡LA ¡Children’s ¡
  • San ¡Mateo ¡Med ¡Ctr ¡
  • Intermountain ¡Healthcare ¡
  • U ¡Colorado ¡
  • U ¡Washington-­‑led ¡WWAMI ¡

pracGce-­‑based ¡network ¡

  • SAFTiNet ¡
  • FQHCs ¡

¡

slide-19
SLIDE 19

Privacy ¡Workshops ¡

3/18/15 ¡ Supported ¡by ¡the ¡NIH ¡Grant ¡U54 ¡HL108460 ¡to ¡the ¡University ¡of ¡California, ¡San ¡Diego ¡ 19 ¡

slide-20
SLIDE 20

iDASH’14 ¡ ¡ First ¡Privacy ¡ProtecGon ¡Challenge ¡

  • Task ¡1: ¡Privacy-­‑preserving ¡SNP ¡Data ¡Sharing ¡
  • Task ¡2: ¡Privacy-­‑preserving ¡release ¡of ¡top ¡K ¡

most ¡significant ¡SNPs ¡

Evaluate ¡soluGons ¡of ¡guaranteed ¡privacy ¡protec#on ¡for ¡ protecGng ¡the ¡output ¡of ¡genomic ¡data ¡analysis ¡ ¡ ¡ ¡

slide-21
SLIDE 21

21 ¡

slide-22
SLIDE 22

iDASH’15 ¡Privacy ¡Protec#on ¡Challenge ¡

  • Task ¡1: ¡Homomorphic ¡encrypGon ¡(HME) ¡based ¡

secure ¡genomic ¡data ¡analysis ¡

  • Task ¡2: ¡Secure ¡comparison ¡between ¡genomic ¡data ¡in ¡

a ¡distributed ¡seYng ¡

  • Focus ¡on ¡secure ¡outsourcing ¡and ¡secure ¡data ¡analysis ¡in ¡a ¡

distributed ¡seYng ¡(humangenomeprivacy.org) ¡ ¡ ¡ ¡

slide-23
SLIDE 23

Acknowledgements: ¡DBMI ¡

At UCSD since 2009, funded by

NIH U54, UL1, U24, UH3, R21, U01, T15, R00, K22, K99, D43, UCBRAID/OP, PCORI, NVIDIA

slide-24
SLIDE 24

Research ¡ Service ¡ EducaGon ¡ Change ¡ THANK ¡YOU ¡ ¡ ¡

Photo ¡by ¡Hai ¡Yang ¡ ¡2014 ¡ ¡