gene expressions and genomes
play

Gene Expressions and Genomes 02-223 Personalized Medicine: - PowerPoint PPT Presentation

Gene Expressions and Genomes 02-223 Personalized Medicine: Understanding Your Own Genome Fall 2014 Why Gene Expression? Genome-wide associaGon mapping


  1. Gene ¡Expressions ¡and ¡Genomes ¡ 02-­‑223 ¡Personalized ¡Medicine: ¡ Understanding ¡Your ¡Own ¡Genome ¡ Fall ¡2014 ¡

  2. Why ¡Gene ¡Expression? ¡ Genome-­‑wide ¡associaGon ¡mapping ¡ DNA ¡sequence ¡ Disease ¡or ¡healthy? ¡ Molecular ¡ mechanism? ¡

  3. Why ¡Gene ¡Expression ¡ • IdenGfying ¡the ¡geneGc ¡variants ¡that ¡confer ¡disease ¡risk ¡is ¡not ¡ enough ¡to ¡decipher ¡the ¡molecular ¡mechanisms ¡of ¡how ¡the ¡ geneGc ¡variaGon ¡influence ¡the ¡disease: ¡ – In ¡medicine ¡ ¡ • We ¡need ¡to ¡determine ¡which ¡biological ¡pathways ¡and ¡genes ¡are ¡ involved ¡in ¡the ¡disease ¡process. ¡ • The ¡idenGfied ¡pathways ¡and ¡genes ¡can ¡be ¡a ¡target ¡for ¡drug. ¡ – In ¡science ¡ • Determining ¡which ¡pathways ¡underlie ¡the ¡associaGon ¡between ¡the ¡ geneGc ¡variaGon ¡and ¡phenotype ¡can ¡provide ¡insights ¡on ¡the ¡ funcGon ¡of ¡genes. ¡

  4. Microarrays ¡for ¡Molecular ¡Biology ¡ TranscripGon ¡factor ¡ Microarray ¡for ¡measuring ¡ DNA ¡ gene ¡expression ¡levels ¡ transcription mRNA ¡ translation Proteins ¡

  5. Microarray ¡Hybridiza=on ¡ • Watson-­‑Crick ¡base ¡pairing ¡of ¡complementary ¡DNA ¡sequences. ¡ • Microarrays ¡have ¡tens ¡of ¡thousands ¡of ¡spots, ¡each ¡represenGng ¡a ¡ piece ¡of ¡one ¡gene, ¡immobilized ¡on ¡a ¡glass ¡slide. ¡ • The ¡intensity ¡(or ¡intensity ¡raGo) ¡of ¡each ¡spot ¡indicates ¡the ¡amount ¡ of ¡labeled ¡cDNA ¡hybridized, ¡thus, ¡represenGng ¡the ¡starGng ¡mRNA ¡ transcript ¡abundance. ¡

  6. Hybridization and Scanning— cDNA arrays � - Prepare Cy3, Cy5- � labeled ss cDNA � - Scan � - Hybridize 600 ng of � labeled ss cDNA to � glass slide array �

  7. Individuals ¡ What ¡is ¡gene ¡ baseline ¡ expression? ¡ expression ¡ Expression ¡= ¡acGvity ¡ 0 10 ¡ 20 ¡ 70 ¡ 80 ¡ gene ¡1 ¡ level ¡of ¡gene ¡in ¡ experiment ¡ genes ¡ Higher ¡ Lower ¡ expression ¡ expression ¡ compared ¡to ¡ compared ¡to ¡ baseline ¡ baseline ¡

  8. Hierarchical ¡Clustering ¡ • Probably ¡the ¡most ¡popular ¡clustering ¡algorithm ¡in ¡ computaGonal ¡biology ¡ • AgglomeraGve ¡( bo^om-­‑up) ¡ • Algorithm: ¡ 1. IniGalize: ¡each ¡item ¡a ¡cluster ¡ 2. Iterate: ¡ • select ¡two ¡most ¡ similar ¡clusters ¡ • merge ¡them ¡ 3. ¡ ¡ ¡Halt: ¡when ¡there ¡is ¡only ¡one ¡cluster ¡le_ ¡ dendrogram

  9. Similarity ¡Criterion: ¡Single ¡Linkage ¡ • cluster ¡similarity ¡= ¡similarity ¡of ¡two ¡most ¡similar ¡ members ¡ - Potentially long and skinny clusters

  10. In ¡most ¡cases ¡(1-­‑ r 2 ), ¡ where ¡ r 2 ¡is ¡the ¡correlaGon ¡ coefficient, ¡is ¡used ¡as ¡ Example: ¡Single ¡Linkage ¡ similarity ¡measure ¡ between ¡samples ¡ 5 4 3 2 1

  11. In ¡most ¡cases ¡(1-­‑ r 2 ), ¡ where ¡ r 2 ¡is ¡the ¡correlaGon ¡ coefficient, ¡is ¡used ¡as ¡ Example: ¡Single ¡Linkage ¡ similarity ¡measure ¡ between ¡samples ¡ 5 4 3 2 1

  12. In ¡most ¡cases ¡(1-­‑ r 2 ), ¡ where ¡ r 2 ¡is ¡the ¡correlaGon ¡ coefficient, ¡is ¡used ¡as ¡ Example: ¡Single ¡Linkage ¡ similarity ¡measure ¡ between ¡samples ¡ (1,2) 3 4 5 (1,2) ⎡ ⎤ ⎢ ⎥ 3 ⎢ ⎥ 4 ⎢ ⎥ ⎢ ⎥ 5 ⎣ ⎦ 5 4 3 2 1

  13. In ¡most ¡cases ¡(1-­‑ r 2 ), ¡ where ¡ r 2 ¡is ¡the ¡correlaGon ¡ coefficient, ¡is ¡used ¡as ¡ Example: ¡Single ¡Linkage ¡ similarity ¡measure ¡ between ¡samples ¡ 5 4 3 2 1

  14. Example: ¡Single ¡Linkage ¡ 5 4 3 2 1

  15. Example: ¡Single ¡Linkage ¡ 5 4 3 2 1

  16. Similarity ¡Criterion: ¡Complete ¡Linkage ¡ • cluster ¡similarity ¡= ¡similarity ¡of ¡two ¡least ¡similar ¡ members ¡ + tight clusters

  17. Similarity ¡Criterion: ¡Average ¡Linkage ¡ • cluster ¡similarity ¡= ¡average ¡similarity ¡of ¡all ¡pairs ¡ the ¡most ¡widely ¡used ¡ similarity ¡measure ¡ Robust ¡against ¡noise ¡

  18. But ¡What ¡Are ¡the ¡Clusters? ¡ In ¡some ¡cases ¡we ¡can ¡determine ¡the ¡“correct” ¡number ¡of ¡clusters. ¡However, ¡things ¡are ¡rarely ¡ this ¡clear ¡cut, ¡unfortunately. ¡

  19. • Nonhierarchical, ¡each ¡object ¡is ¡placed ¡in ¡exactly ¡one ¡of ¡K ¡non-­‑ overlapping ¡clusters. ¡ • the ¡user ¡has ¡to ¡specify ¡the ¡desired ¡number ¡of ¡clusters ¡K. ¡ • In ¡hierarchical ¡clustering, ¡we ¡use ¡similarity ¡measures ¡between ¡ two ¡observed ¡samples, ¡whereas ¡in ¡K-­‑means ¡clustering, ¡we ¡use ¡ the ¡similarity ¡measures ¡between ¡an ¡observed ¡sample ¡and ¡the ¡ cluster ¡center ¡(mean). ¡ ¡

  20. Example: ¡Clustering ¡Genes ¡ • Clustering ¡genes ¡helps ¡determine ¡ new ¡funcGons ¡for ¡unknown ¡genes ¡ • Applying ¡hierarchical ¡clustering ¡ algorithm ¡to ¡gene ¡expression ¡data ¡ was ¡an ¡early ¡“killer ¡applicaGon” ¡in ¡ this ¡area ¡

  21. Gene ¡Expression ¡Data ¡and ¡Personalized ¡ Medicine ¡ (Golub ¡et ¡al., ¡Science, ¡1999) ¡ • One ¡of ¡the ¡earliest ¡work ¡that ¡demonstrated ¡the ¡ feasibility ¡of ¡using ¡only ¡microarray ¡gene ¡expression ¡data ¡ to ¡determine ¡cancer ¡subtypes ¡for ¡paGents ¡ • A ¡staGsGcal ¡model ¡was ¡learned ¡to ¡predict ¡the ¡labels ¡for ¡ acute ¡myeloid ¡leukemia ¡(ALL) ¡and ¡acute ¡lymphoblasGc ¡ leukemia ¡ ¡(AML) ¡for ¡each ¡paGent ¡given ¡gene ¡expression ¡ data ¡ – ¡Dataset ¡used ¡to ¡learn ¡the ¡model ¡consisted ¡of ¡27 ¡ALL ¡and ¡11 ¡ AML ¡paGents ¡ – Tested ¡the ¡learned ¡model ¡on ¡20 ¡ALL ¡and ¡14 ¡AML ¡paGents ¡and ¡ 29 ¡out ¡of ¡34 ¡paGents ¡were ¡predicted ¡to ¡have ¡correct ¡cancer ¡ subtypes ¡

  22. Gene ¡Expression ¡Signature ¡Can ¡Dis=nguish ¡ Cancer ¡Types ¡ PaGents ¡ Genes ¡that ¡are ¡informaGve ¡for ¡predicGng ¡ cancer ¡types ¡

  23. FDA ¡Approves ¡Gene-­‑Based ¡Breast ¡Cancer ¡ Test* ¡ “MammaPrint ¡is ¡a ¡DNA ¡ microarray-­‑based ¡test ¡that ¡ measures ¡the ¡acGvity ¡of ¡70 ¡ genes... ¡The ¡test ¡measures ¡each ¡ of ¡these ¡genes ¡in ¡a ¡sample ¡of ¡a ¡ woman's ¡breast-­‑cancer ¡tumor ¡ and ¡then ¡uses ¡a ¡specific ¡formula ¡ to ¡determine ¡whether ¡the ¡ paGent ¡is ¡deemed ¡low ¡risk ¡or ¡ high ¡risk ¡for ¡the ¡spread ¡of ¡the ¡ cancer ¡to ¡another ¡site.” ¡

  24. Learning ¡Bayesian ¡Networks ¡ • Probability ¡distribuGon ¡over ¡directed ¡graph ¡ ¡ – Model ¡data ¡distribuGon ¡in ¡populaGon ¡ Data – CondiGonal ¡probability ¡distribuGon ¡(CPD) ¡for ¡ each ¡variable/node ¡condiGonal ¡on ¡its ¡parent ¡ nodes ¡ – ProbabilisGc ¡inference: ¡ • PredicGon ¡ • ClassificaGon ¡ MSFT ¡ • Dependency ¡structure ¡ INTL ¡ NVLS ¡ – InteracGons ¡between ¡variables ¡ – Causality ¡ n ∏ P( x 1 ,..., x n ) = P( x i | x i + 1 ,..., x n ) MOT ¡ – ScienGfic ¡discovery ¡ i = 1 n ∏ = P( x i | Pa( x i )) i = 1 Slides ¡from ¡the ¡presentaGon ¡by ¡Segal ¡et ¡al. ¡UAI03 ¡

  25. The ¡Module ¡Network ¡Idea ¡ Bayesian Network Module Network CPD 1 CPD 1 MSFT ¡ MSFT ¡ Module I CPD 2 CPD 2 CPD 3 MOT ¡ MOT ¡ CPD 4 DELL ¡ INTL ¡ DELL ¡ INTL ¡ Module II CPD 6 CPD 5 CPD 3 AMAT ¡ AMAT ¡ HPQ ¡ HPQ ¡ Module III Slides ¡from ¡the ¡presentaGon ¡by ¡Segal ¡et ¡al. ¡UAI03 ¡

  26. • Applying ¡module ¡ network ¡to ¡2355 ¡genes ¡ in ¡the ¡173 ¡arrays ¡of ¡the ¡ yeast ¡stress ¡data ¡set ¡

Download Presentation
Download Policy: The content available on the website is offered to you 'AS IS' for your personal information and use only. It cannot be commercialized, licensed, or distributed on other websites without prior consent from the author. To download a presentation, simply click this link. If you encounter any difficulties during the download process, it's possible that the publisher has removed the file from their server.

Recommend


More recommend