working on cancer
play

Working on Cancer Ola Bini computational metalinguist & - PowerPoint PPT Presentation

Working on Cancer Ola Bini computational metalinguist & paranoia principal ola.bini@gmail.com http://olabini.com/blog 698E 2885 C1DE 74E3 2CD5 03AD 295C 7469 84AF 7F0C


  1. Working ¡on ¡Cancer Ola ¡Bini computational ¡metalinguist ¡& ¡paranoia ¡principal ola.bini@gmail.com ¡ http://olabini.com/blog 698E ¡2885 ¡C1DE ¡74E3 ¡2CD5 ¡03AD ¡295C ¡7469 ¡84AF ¡7F0C måndag 30 september 13

  2. The ¡problem måndag 30 september 13

  3. Terms DNA A ¡string ¡of ¡bases, ¡usually ¡organized ¡in ¡a ¡double ¡helix Nucleobases ¡/ ¡bases One ¡of ¡four ¡molecules, ¡called ¡A, ¡C, ¡G ¡and ¡T RNA A ¡DNA ¡like ¡molecule. ¡Uses ¡A, ¡C, ¡G ¡and ¡U ¡instead. måndag 30 september 13

  4. Terms Protein ¡/ ¡Polypeptides ¡/ ¡Amino ¡Acids A ¡protein ¡is ¡a ¡chain ¡of ¡amino ¡acids. ¡It ¡can ¡be ¡enzymes ¡or ¡other ¡types ¡ of ¡proteins Codon A ¡set ¡of ¡three ¡bases ¡that ¡gets ¡translated ¡to ¡an ¡amino ¡acid Gene An ¡inherited ¡unit ¡under ¡selection Variant A ¡mutation måndag 30 september 13

  5. Sequencing Taking ¡DNA ¡and ¡turning ¡it ¡into ¡bits Steps Prepare ¡the ¡analyte Shred ¡the ¡DNA ¡into ¡200bp ¡long ¡segments ¡(called ¡ reads ) Sequence ¡all ¡the ¡reads ¡separately Find ¡overlapping ¡reads ¡( assembly ) Find ¡where ¡the ¡reads ¡belong ¡by ¡comparing ¡to ¡a ¡reference ¡ ( alignment ) Optional: ¡compare ¡against ¡another ¡genome ¡and ¡output ¡the ¡ results ¡( variant ¡calling ) The ¡$1000 ¡genome måndag 30 september 13

  6. Cancer Not ¡one ¡disease ¡-­‑ ¡at ¡least ¡10 ¡000 ¡diseases Organ ¡of ¡origin ¡less ¡interesting ¡than ¡molecular ¡make ¡up Cancer ¡is ¡modifications ¡of ¡DNA ¡in ¡various ¡ways Stops ¡apoptosis Enhances ¡G ¡cell ¡cycle ¡(growth) Removes ¡error ¡correcting ¡mechanisms Through ¡genetic ¡modifications ¡of ¡various ¡kinds Driver ¡mutations ¡vs ¡passenger ¡mutations Lots ¡of ¡noise måndag 30 september 13

  7. The ¡treatment ¡problem Standard ¡of ¡care ¡is ¡based ¡on ¡organ Ovarian ¡cancer ¡has ¡ca ¡3 ¡first ¡level ¡chemo’s If ¡one ¡doesn’t ¡work, ¡try ¡the ¡next But ¡they’re ¡expensive: ¡$100 ¡000 ¡for ¡a ¡round And ¡3 ¡months ¡of ¡time And ¡severe ¡pain ¡and ¡damage ¡to ¡the ¡body The ¡information ¡is ¡out ¡there In ¡research ¡papers In ¡clinical ¡trial ¡data måndag 30 september 13

  8. The ¡team måndag 30 september 13

  9. The ¡process måndag 30 september 13

  10. Our ¡solution måndag 30 september 13

  11. Our ¡solution Suck ¡in ¡data ¡from ¡lots ¡of ¡resources Unify ¡and ¡normalize Types ¡of ¡data Patient Reference Experience Put ¡everything ¡in ¡a ¡graph Model ¡biology Enhance ¡raw ¡information ¡with ¡deduced ¡information Connect ¡up ¡treatments ¡in ¡relationships ¡with ¡biomarkers måndag 30 september 13

  12. Tech ¡stack Clojure Neo4J JRuby CoffeeScript Sinatra Compojure Jetty måndag 30 september 13

  13. Graph ¡database måndag 30 september 13

  14. Infrastructure måndag 30 september 13

  15. Infrastructure AWS Puppet Boto ¡& ¡Fabric Custom ¡provisioning ¡code Ca ¡12 ¡repositories, ¡all ¡with ¡“go” ¡scripts Self-­‑installing, ¡using ¡setuptools ¡& ¡virtualenv måndag 30 september 13

  16. Go Started ¡with ¡Jenkins Switched ¡to ¡Go ¡for ¡easy ¡deployment ¡pipelines Master ¡have ¡to ¡be ¡built ¡from ¡a ¡dev ¡machine Agents ¡can ¡be ¡added ¡on ¡the ¡fly måndag 30 september 13

  17. On ¡every ¡deploy... Provision ¡a ¡new ¡EC2 ¡instance Copy ¡necessary ¡keys ¡to ¡the ¡new ¡instance Attach ¡a ¡data ¡volume ¡cloned ¡from ¡snapshots Install ¡puppet Copy ¡all ¡puppet ¡manifests ¡to ¡machine Apply ¡puppet Install ¡all ¡deployment ¡RPMs Start ¡servers ¡(Apache, ¡Jetty, ¡etc...) Associate ¡elastic ¡IP ¡with ¡new ¡box Terminate ¡old ¡instance måndag 30 september 13

  18. Monitoring ¡etc Piwik Statsd ¡& ¡Graphite Monit ¡for ¡notifications Fairly ¡standard ¡logging ¡setup Status ¡checking ¡using ¡Go måndag 30 september 13

  19. Data ¡ingestion måndag 30 september 13

  20. One-­‑page ¡app måndag 30 september 13

  21. Polyglot ¡ architecture måndag 30 september 13

  22. Internal ¡DSLs måndag 30 september 13

  23. Conclusions Small ¡teams ¡win ¡over ¡large ¡teams Use ¡the ¡right ¡language Molecular ¡biology ¡is ¡very ¡cool ¡and ¡needs ¡more ¡work Continuous ¡Delivery ¡is ¡a ¡must This ¡approach ¡to ¡cancer ¡will ¡likely ¡work ¡for ¡the ¡next ¡10 ¡years måndag 30 september 13

  24. Questions? O LA B INI @olabini http://olabini.com obini@thoughtworks.com måndag 30 september 13

Download Presentation
Download Policy: The content available on the website is offered to you 'AS IS' for your personal information and use only. It cannot be commercialized, licensed, or distributed on other websites without prior consent from the author. To download a presentation, simply click this link. If you encounter any difficulties during the download process, it's possible that the publisher has removed the file from their server.

Recommend


More recommend