Working on Cancer Ola Bini computational metalinguist & - - PowerPoint PPT Presentation

working on cancer
SMART_READER_LITE
LIVE PREVIEW

Working on Cancer Ola Bini computational metalinguist & - - PowerPoint PPT Presentation

Working on Cancer Ola Bini computational metalinguist & paranoia principal ola.bini@gmail.com http://olabini.com/blog 698E 2885 C1DE 74E3 2CD5 03AD 295C 7469 84AF 7F0C


slide-1
SLIDE 1

Ola ¡Bini

computational ¡metalinguist ¡& ¡paranoia ¡principal

  • la.bini@gmail.com ¡

http://olabini.com/blog 698E ¡2885 ¡C1DE ¡74E3 ¡2CD5 ¡03AD ¡295C ¡7469 ¡84AF ¡7F0C

Working ¡on ¡Cancer

måndag 30 september 13

slide-2
SLIDE 2

The ¡problem

måndag 30 september 13

slide-3
SLIDE 3

Terms

DNA

A ¡string ¡of ¡bases, ¡usually ¡organized ¡in ¡a ¡double ¡helix

Nucleobases ¡/ ¡bases

One ¡of ¡four ¡molecules, ¡called ¡A, ¡C, ¡G ¡and ¡T

RNA

A ¡DNA ¡like ¡molecule. ¡Uses ¡A, ¡C, ¡G ¡and ¡U ¡instead.

måndag 30 september 13

slide-4
SLIDE 4

Terms

Protein ¡/ ¡Polypeptides ¡/ ¡Amino ¡Acids

A ¡protein ¡is ¡a ¡chain ¡of ¡amino ¡acids. ¡It ¡can ¡be ¡enzymes ¡or ¡other ¡types ¡

  • f ¡proteins

Codon

A ¡set ¡of ¡three ¡bases ¡that ¡gets ¡translated ¡to ¡an ¡amino ¡acid

Gene

An ¡inherited ¡unit ¡under ¡selection

Variant

A ¡mutation

måndag 30 september 13

slide-5
SLIDE 5

Sequencing

Taking ¡DNA ¡and ¡turning ¡it ¡into ¡bits Steps

Prepare ¡the ¡analyte Shred ¡the ¡DNA ¡into ¡200bp ¡long ¡segments ¡(called ¡reads) Sequence ¡all ¡the ¡reads ¡separately Find ¡overlapping ¡reads ¡(assembly) Find ¡where ¡the ¡reads ¡belong ¡by ¡comparing ¡to ¡a ¡reference ¡ (alignment) Optional: ¡compare ¡against ¡another ¡genome ¡and ¡output ¡the ¡ results ¡(variant ¡calling)

The ¡$1000 ¡genome

måndag 30 september 13

slide-6
SLIDE 6

Cancer

Not ¡one ¡disease ¡-­‑ ¡at ¡least ¡10 ¡000 ¡diseases Organ ¡of ¡origin ¡less ¡interesting ¡than ¡molecular ¡make ¡up Cancer ¡is ¡modifications ¡of ¡DNA ¡in ¡various ¡ways

Stops ¡apoptosis Enhances ¡G ¡cell ¡cycle ¡(growth) Removes ¡error ¡correcting ¡mechanisms

Through ¡genetic ¡modifications ¡of ¡various ¡kinds Driver ¡mutations ¡vs ¡passenger ¡mutations Lots ¡of ¡noise

måndag 30 september 13

slide-7
SLIDE 7

The ¡treatment ¡problem

Standard ¡of ¡care ¡is ¡based ¡on ¡organ Ovarian ¡cancer ¡has ¡ca ¡3 ¡first ¡level ¡chemo’s

If ¡one ¡doesn’t ¡work, ¡try ¡the ¡next

But ¡they’re ¡expensive: ¡$100 ¡000 ¡for ¡a ¡round

And ¡3 ¡months ¡of ¡time And ¡severe ¡pain ¡and ¡damage ¡to ¡the ¡body

The ¡information ¡is ¡out ¡there

In ¡research ¡papers In ¡clinical ¡trial ¡data

måndag 30 september 13

slide-8
SLIDE 8

The ¡team

måndag 30 september 13

slide-9
SLIDE 9

The ¡process

måndag 30 september 13

slide-10
SLIDE 10

Our ¡solution

måndag 30 september 13

slide-11
SLIDE 11

Our ¡solution

Suck ¡in ¡data ¡from ¡lots ¡of ¡resources

Unify ¡and ¡normalize Types ¡of ¡data

Patient Reference Experience

Put ¡everything ¡in ¡a ¡graph Model ¡biology Enhance ¡raw ¡information ¡with ¡deduced ¡information Connect ¡up ¡treatments ¡in ¡relationships ¡with ¡biomarkers

måndag 30 september 13

slide-12
SLIDE 12

Clojure Neo4J JRuby CoffeeScript Sinatra Compojure Jetty

Tech ¡stack

måndag 30 september 13

slide-13
SLIDE 13

Graph ¡database

måndag 30 september 13

slide-14
SLIDE 14

Infrastructure

måndag 30 september 13

slide-15
SLIDE 15

AWS Puppet Boto ¡& ¡Fabric Custom ¡provisioning ¡code Ca ¡12 ¡repositories, ¡all ¡with ¡“go” ¡scripts Self-­‑installing, ¡using ¡setuptools ¡& ¡virtualenv

Infrastructure

måndag 30 september 13

slide-16
SLIDE 16

Started ¡with ¡Jenkins Switched ¡to ¡Go ¡for ¡easy ¡deployment ¡pipelines Master ¡have ¡to ¡be ¡built ¡from ¡a ¡dev ¡machine Agents ¡can ¡be ¡added ¡on ¡the ¡fly

Go

måndag 30 september 13

slide-17
SLIDE 17

Provision ¡a ¡new ¡EC2 ¡instance Copy ¡necessary ¡keys ¡to ¡the ¡new ¡instance Attach ¡a ¡data ¡volume ¡cloned ¡from ¡snapshots Install ¡puppet Copy ¡all ¡puppet ¡manifests ¡to ¡machine Apply ¡puppet Install ¡all ¡deployment ¡RPMs Start ¡servers ¡(Apache, ¡Jetty, ¡etc...) Associate ¡elastic ¡IP ¡with ¡new ¡box Terminate ¡old ¡instance

On ¡every ¡deploy...

måndag 30 september 13

slide-18
SLIDE 18

Piwik Statsd ¡& ¡Graphite Monit ¡for ¡notifications Fairly ¡standard ¡logging ¡setup Status ¡checking ¡using ¡Go

Monitoring ¡etc

måndag 30 september 13

slide-19
SLIDE 19

Data ¡ingestion

måndag 30 september 13

slide-20
SLIDE 20

One-­‑page ¡app

måndag 30 september 13

slide-21
SLIDE 21

Polyglot ¡ architecture

måndag 30 september 13

slide-22
SLIDE 22

Internal ¡DSLs

måndag 30 september 13

slide-23
SLIDE 23

Small ¡teams ¡win ¡over ¡large ¡teams Use ¡the ¡right ¡language Molecular ¡biology ¡is ¡very ¡cool ¡and ¡needs ¡more ¡work Continuous ¡Delivery ¡is ¡a ¡must This ¡approach ¡to ¡cancer ¡will ¡likely ¡work ¡for ¡the ¡next ¡10 ¡years

Conclusions

måndag 30 september 13

slide-24
SLIDE 24

Questions?

OLA BINI

http://olabini.com

  • bini@thoughtworks.com

@olabini

måndag 30 september 13