Mul$scale Molecular Systems Biology: Reconstruc$on and - - PowerPoint PPT Presentation

mul scale molecular systems biology reconstruc on and
SMART_READER_LITE
LIVE PREVIEW

Mul$scale Molecular Systems Biology: Reconstruc$on and - - PowerPoint PPT Presentation

Mul$scale Molecular Systems Biology: Reconstruc$on and Model Op$miza$on Dr. Ronan M.T. Fleming, Systems Biochemistry Group, Luxembourg Centre for Systems


slide-1
SLIDE 1

Mul$scale ¡Molecular ¡Systems ¡Biology: ¡ ¡ Reconstruc$on ¡and ¡Model ¡Op$miza$on ¡

  • Dr. ¡Ronan ¡M.T. ¡Fleming, ¡

Systems ¡Biochemistry ¡Group, ¡ Luxembourg ¡Centre ¡for ¡Systems ¡Biomedicine, ¡ University ¡of ¡Luxembourg. ¡ ¡ ¡ Friday, ¡August ¡16, ¡2013 ¡ Interagency ¡Modeling ¡and ¡Analysis ¡Group ¡Webinar ¡ ¡ ¡ ¡

slide-2
SLIDE 2

Mul$scale ¡Systems ¡Biology ¡Collabora$on ¡ ¡

  • Molecular ¡Systems ¡Physiology ¡Group ¡

– Ines ¡Thiele, ¡Luxembourg ¡Centre ¡for ¡Systems ¡

  • Biomedicine. ¡
  • Systems ¡Biology ¡Research ¡Group ¡

– Bernhard ¡Palsson, ¡University ¡of ¡California, ¡San ¡

  • Diego. ¡
  • Systems ¡Op$miza$on ¡Laboratory ¡

– Michael ¡Saunders, ¡Stanford ¡University. ¡

  • Systems ¡Biochemistry ¡Group ¡

– Ronan ¡Fleming, ¡Luxembourg ¡Centre ¡for ¡Systems ¡

  • Biomedicine. ¡
slide-3
SLIDE 3

Mul$scale ¡Molecular ¡Systems ¡Biology: ¡ ¡ Reconstruc$on ¡and ¡Model ¡Op$miza$on ¡

Variables ¡with ¡ magnitudes ¡ spread ¡over ¡ many ¡orders ¡of ¡

  • magnitude. ¡

Chemical ¡ formula ¡known ¡ for ¡each ¡

  • molecule. ¡

System ¡of ¡ biochemical ¡ reac$ons ¡with ¡ defined ¡ boundary ¡ condi$ons. ¡ Biomedical, ¡ biotechnological, ¡ environmental, ¡ applica$ons. ¡ An ¡abstrac$on ¡of ¡select ¡ biochemical, ¡gene$c, ¡and ¡ genomic ¡experimental ¡ knowledge ¡about ¡a ¡ chosen ¡biochemical ¡ subsystem ¡ General ¡mathema$cal ¡ model, ¡combined ¡with ¡ par$cular ¡reconstruc$on, ¡ thus ¡crea$ng ¡a ¡ computa$onal ¡model. ¡ Numerical ¡op$miza$on ¡ problems ¡with ¡a ¡firm ¡ grounding ¡in ¡ mathema$cal ¡

  • p$miza$on ¡theory. ¡
slide-4
SLIDE 4

Increasing ¡the ¡comprehensiveness ¡of ¡ genome ¡scale ¡computa$onal ¡models ¡…. ¡

– Increasing ¡size ¡

  • ¡e.g. ¡single ¡microbe ¡versus ¡whole ¡microbial ¡community ¡

– 1 ¡microbial ¡species ¡~ ¡1e3 ¡reac$ons ¡ – 1 ¡community ¡(1000 ¡species) ¡~ ¡1e6 ¡reac$ons ¡

– Increasing ¡ra$o ¡of ¡fastest ¡to ¡slowest ¡$mescale ¡

  • ¡e.g. ¡genome ¡scale ¡metabolic ¡model ¡versus ¡integrated ¡model ¡
  • f ¡metabolism ¡and ¡macromolecular ¡synthesis ¡

– Metabolic ¡reac$ons ¡ – Macromolecular ¡synthesis ¡reac$ons ¡

– Increased ¡simula$on ¡fidelity ¡

  • e.g. ¡mass ¡conserva$on ¡alone, ¡versus ¡mass ¡conserva$on, ¡

energy ¡conserva$on, ¡second ¡law ¡of ¡thermodynamics, ¡reac$on ¡ kine$cs, ¡etc. ¡

¡

slide-5
SLIDE 5
  • Large ¡scale ¡numerical ¡op$miza$on ¡

– Reduce ¡computa$onal ¡complexity ¡of ¡algorithms ¡to ¡solve ¡

  • p$miza$on ¡problems ¡
  • Mul$scale ¡numerical ¡op$miza$on ¡

– Standard ¡op$miza$on ¡soXware ¡ideal ¡for ¡ ¡O(1) ¡variables ¡

  • Mathema$cal ¡formula$on ¡

– Biochemical ¡func$on ¡is ¡an ¡inherently ¡nonlinear ¡process ¡ – How ¡to ¡formulae ¡a ¡mathema$cal ¡modeling ¡problem ¡in ¡a ¡ form ¡amenable ¡to ¡a ¡polynomial ¡$me ¡algorithm ¡

… ¡leads ¡to ¡a ¡mathema$cal ¡and ¡ numerical ¡op$miza$on ¡challenge: ¡

slide-6
SLIDE 6

History ¡of ¡the ¡Mul$scale ¡Systems ¡Biology ¡Collabora$on ¡

McCloskey ¡D, ¡Palsson ¡BØ, ¡Feist ¡AM. ¡ ¡Basic ¡and ¡applied ¡uses ¡of ¡genome-­‑scale ¡metabolic ¡network ¡ reconstruc$ons ¡of ¡Escherichia ¡coli. ¡Mol ¡Syst ¡Biol. ¡9:661, ¡2013. ¡

slide-7
SLIDE 7

Reconstruc$on ¡of ¡reac$on ¡stoichiometry ¡

Stoichiometric ¡Matrix ¡(denoted ¡S) ¡

slide-8
SLIDE 8

Reconstruc$on ¡of ¡macromolecular ¡synthesis ¡machinery ¡

Thiele ¡I, ¡Jamshidi ¡N, ¡Fleming ¡RMT, ¡Palsson ¡BØ. ¡Genome-­‑scale ¡reconstruc$on ¡of ¡Escherichia ¡coli's ¡ transcrip$onal ¡and ¡transla$onal ¡machinery: ¡a ¡knowledge ¡base, ¡its ¡mathema$cal ¡formula$on, ¡ and ¡its ¡func$onal ¡characteriza$on. ¡PLoS ¡computa$onal ¡biology. ¡5(3):e1000312., ¡2009. ¡

DNA Transcription Unit rRNA mRNA Protein i Chaperones Protein j Prosthetic group, metallo -ions Complex ij RNA Polymerase Transcription Factors Nucleotides Amino acids tRNA Map/Def Charged and modifed tRNA modifed rRNA

P P P P P P P P P P P P P P P P

I II II III III IV IV V VII VII IX IX X VIII VIII

Gene Gene

VI VI XI XI XII XII

# transcription units 249 # genes 423 tRNA/rRNA/misc RNA 86/22/1 proteins (w/o genes) 228 (34) # subsystems 27 # reactions 13,694 # components 11,991 # references +500

slide-9
SLIDE 9

Integra$on ¡of ¡metabolism ¡with ¡macromolecular ¡synthesis ¡ ¡

Thiele ¡I, ¡Fleming ¡RMT, ¡Que ¡R, ¡Bordbar ¡A, ¡Diep ¡D, ¡Palsson ¡BO. ¡ ¡Mul$scale ¡Modeling ¡of ¡ Metabolism ¡and ¡Macromolecular ¡Synthesis ¡in ¡E. ¡coli ¡and ¡Its ¡Applica$on ¡to ¡the ¡Evolu$on ¡of ¡ Codon ¡Usage. ¡PLoS ¡One. ¡7(9):e45635, ¡2012. ¡ Metabolic ¡reac$on ¡ fluxes ¡ ¡ ~ ¡milimol/gDW/hr ¡ Macromolecular ¡ reac$on ¡fluxes ¡ ¡ ~ ¡nanomol/gDW/hr ¡ 6 ¡orders ¡of ¡ magnitude ¡ ¡

slide-10
SLIDE 10

E ¡ ¡ C E ¡ E* ¡ ¡ D ¡ F

v4 ¡

¡ C ¡ D ¡ G

vS ¡ vD ¡ vu ¡

ü If ¡metabolic ¡reac.on ¡is ¡used, ¡then ¡protein ¡& ¡ mRNA ¡need ¡to ¡be ¡produced ¡ ü If ¡flux ¡through ¡metabolic ¡reac.on ¡increases, ¡ the ¡synthesis ¡rate ¡of ¡protein ¡and ¡mRNA ¡needs ¡ to ¡increase ¡accordingly ¡ Canonical ¡steady-­‑state ¡modeling ¡ Coupling ¡constraints ¡ Thiele ¡I, ¡Fleming ¡RMT, ¡Bordbar ¡A, ¡Schellenberger ¡J, ¡Palsson ¡BØ. ¡Func$onal ¡characteriza$on ¡of ¡ alternate ¡op$mal ¡solu$ons ¡of ¡Escherichia ¡coli's ¡transcrip$onal ¡and ¡transla$onal ¡machinery. ¡ Biophysical ¡journal. ¡98(10):2072-­‑81, ¡2010. ¡

Conversion ¡of ¡integrated ¡reconstruc$on ¡of ¡metabolism ¡and ¡ macromolecular ¡synthesis ¡into ¡a ¡computa$onal ¡model ¡

slide-11
SLIDE 11

Conversion ¡of ¡integrated ¡reconstruc$on ¡of ¡metabolism ¡and ¡ macromolecular ¡synthesis ¡into ¡a ¡computa$onal ¡model ¡

  • Increasing ¡scope ¡of ¡molecular ¡processes ¡represented ¡
  • However, ¡molecular ¡processes ¡are ¡intrinsically ¡on ¡different ¡$mescales ¡scales… ¡
slide-12
SLIDE 12

Computa$onal ¡modeling ¡requires ¡numerical ¡op$miza$on ¡ involving ¡large, ¡sparse ¡& ¡s$ff ¡stoichiometric ¡matrices: ¡ ¡numerical ¡analysis ¡challenge ¡

Many ¡metabolic ¡ moieGes ¡in ¡one ¡ macromolecule ¡ ReacGon ¡rates ¡over ¡many ¡

  • rders ¡of ¡magnitude ¡
slide-13
SLIDE 13

reformulate ¡ reformulate ¡ BMC ¡Bioinforma$cs ¡2013, ¡14:240 ¡doi:10.1186/1471-­‑2105-­‑14-­‑240 ¡ Reformula$on ¡involves ¡a ¡trade ¡off ¡between ¡ computa$onal ¡efficiency ¡and ¡reliability. ¡

slide-14
SLIDE 14

BMC ¡Bioinforma$cs ¡2013, ¡14:240 ¡doi:10.1186/1471-­‑2105-­‑14-­‑240 ¡

slide-15
SLIDE 15

BMC ¡Bioinforma$cs ¡2013, ¡14:240 ¡doi:10.1186/1471-­‑2105-­‑14-­‑240 ¡

slide-16
SLIDE 16

Thiele ¡I, ¡Fleming ¡RMT, ¡Que ¡R, ¡Bordbar ¡A, ¡Diep ¡D, ¡Palsson ¡BO. ¡ ¡Mul$scale ¡Modeling ¡of ¡Metabolism ¡and ¡Macromolecular ¡ Synthesis ¡in ¡E. ¡coli ¡and ¡Its ¡Applica$on ¡to ¡the ¡Evolu$on ¡of ¡Codon ¡Usage. ¡PLoS ¡One. ¡7(9):e45635, ¡2012. ¡

  • The ¡gene$c ¡code ¡has ¡redundancy ¡but ¡no ¡ambiguity ¡
  • 1. can ¡be ¡mul$ple ¡codons ¡per ¡amino ¡acid ¡
  • 2. mul$ple ¡tRNA ¡can ¡read ¡the ¡same ¡codon ¡
  • 3. tRNA ¡can ¡read ¡mul$ple ¡synonymous ¡codons ¡
  • Codon ¡usage ¡bias ¡i.e. ¡frequency ¡of ¡synonymous ¡codons ¡differs ¡between ¡organisms, ¡within ¡

genomes, ¡and ¡along ¡genes. ¡

New ¡insights ¡from ¡mul$scale ¡systems ¡biology ¡models: ¡ mechanics ¡of ¡the ¡genotype-­‑phenotype ¡rela.onship ¡

slide-17
SLIDE 17

UUU ¡ Phe ¡(2) ¡ UCU ¡ Ser ¡(5) ¡ UAU ¡ Tyr ¡(3) ¡ UGU ¡ Cys ¡(1) ¡ UUC ¡ UCC ¡ UAC ¡ UGC ¡ UUA ¡ Leu ¡(8) ¡ UCA ¡ UAA ¡ Ochre ¡ UGA ¡ Opal ¡ UUG ¡ UCG ¡ UAG ¡ Amber ¡ UGG ¡ Trp ¡(1) ¡ CUU ¡ Leu ¡(8) ¡ CCU ¡ Pro ¡(3) ¡ CAU ¡ His ¡(1) ¡ CGU ¡ Arg ¡(7) ¡ CUC ¡ CCC ¡ CAC ¡ CGC ¡ CUA ¡ CCA ¡ CAA ¡ Gln ¡(4) ¡ CGA ¡ CUG ¡ CCG ¡ CAG ¡ CGG ¡ AUU ¡ Ile ¡(5) ¡ ACU ¡ Thr ¡(4) ¡ AAU ¡ Asn ¡(4) ¡ AGU ¡ Ser ¡(5) ¡ AUC ¡ ACC ¡ AAC ¡ AGC ¡ AUA ¡ ACA ¡ AAA ¡ Lys ¡(6) ¡ AGA ¡ Arg ¡(7) ¡ AUG ¡ Met ¡(6) ¡ ACG ¡ AAG ¡ AGG ¡ GUU ¡ Val ¡(7) ¡ GCU ¡ Ala ¡(5) ¡ GAU ¡ Asp ¡(3) ¡ GGU ¡ Gly ¡(6) ¡ GUC ¡ GCC ¡ GAC ¡ GGC ¡ GUA ¡ GCA ¡ GAA ¡ Glu ¡(4) ¡ GGA ¡ GUG ¡ GCG ¡ GAG ¡ GGG ¡

U U C A G C A G

U C A G U C A G U C A G U C A G

  • E. coli has 86 tRNA

molecules. Number of distinct tRNA molecules per amino acid are given in parenthesis. Leu = Leucine

  • 6 different

synonymous

  • 8 different tRNA
  • In wild type E. coli,

CUG is the dominant synonymous codon

New ¡insights ¡from ¡mul$scale ¡systems ¡biology ¡models: ¡ mechanics ¡of ¡the ¡genotype-­‑phenotype ¡rela.onship ¡

Gene$c ¡code ¡of ¡E. ¡coli ¡(RNA ¡perspec$ve) ¡

Thiele ¡I, ¡Fleming ¡RMT, ¡Que ¡R, ¡Bordbar ¡A, ¡Diep ¡D, ¡Palsson ¡BO. ¡ ¡Mul$scale ¡Modeling ¡of ¡Metabolism ¡and ¡Macromolecular ¡ Synthesis ¡in ¡E. ¡coli ¡and ¡Its ¡Applica$on ¡to ¡the ¡Evolu$on ¡of ¡Codon ¡Usage. ¡PLoS ¡One. ¡7(9):e45635, ¡2012. ¡

slide-18
SLIDE 18

New ¡insights ¡from ¡mul$scale ¡systems ¡biology ¡models: ¡ mechanics ¡of ¡the ¡genotype-­‑phenotype ¡rela.onship ¡

Thiele ¡I, ¡Fleming ¡RMT, ¡Que ¡R, ¡Bordbar ¡A, ¡Diep ¡D, ¡Palsson ¡BO. ¡ ¡Mul$scale ¡Modeling ¡of ¡Metabolism ¡and ¡Macromolecular ¡ Synthesis ¡in ¡E. ¡coli ¡and ¡Its ¡Applica$on ¡to ¡the ¡Evolu$on ¡of ¡Codon ¡Usage. ¡PLoS ¡One. ¡7(9):e45635, ¡2012. ¡

slide-19
SLIDE 19

New ¡insights ¡from ¡mul$scale ¡systems ¡biology ¡models: ¡ mechanics ¡of ¡the ¡genotype-­‑phenotype ¡rela.onship ¡

Thiele ¡I, ¡Fleming ¡RMT, ¡Que ¡R, ¡Bordbar ¡A, ¡Diep ¡D, ¡Palsson ¡BO. ¡ ¡Mul$scale ¡Modeling ¡of ¡Metabolism ¡and ¡Macromolecular ¡ Synthesis ¡in ¡E. ¡coli ¡and ¡Its ¡Applica$on ¡to ¡the ¡Evolu$on ¡of ¡Codon ¡Usage. ¡PLoS ¡One. ¡7(9):e45635, ¡2012. ¡

00$ 0.50$ 0.75$ 1.00$ EQ5$ EQ4$ EQ3$ EQ2$ EQ1$ B10$ B9$ B8$ B7$ B6$ B5$ B4$ B3$ B2$ B1$

Lactate)

00$ 0.50$ 0.75$ 1.00$ EQ5$ EQ4$ EQ3$ EQ2$ EQ1$ B10$ B9$ B8$ B7$ B6$ B5$ B4$ B3$ B2$ B1$

Glucose,)Aerobic)

EQ EQ EQ EQ EQ B10$

Growth ¡rate ¡(rela$ve ¡to ¡wild ¡type) ¡

  • Changes ¡in ¡codon ¡usage ¡

affect ¡ ¡

  • ability ¡to ¡grow ¡
  • maximal ¡possible ¡

growth ¡rate ¡in ¡silico. ¡

  • Analysis ¡of ¡numerical ¡proper$es ¡of ¡flux ¡balance ¡analysis ¡

solu$ons ¡used ¡to ¡derive ¡causal ¡molecular ¡mechanis$c ¡ hypothesis ¡connec$ng ¡codon ¡usage ¡with ¡growth ¡rate ¡

  • Limit ¡to ¡growth ¡was ¡ribosomal ¡RNA ¡operon ¡transcrip$on ¡rate ¡in ¡

wild ¡type, ¡but ¡leucyl-­‑tRNA ¡transcrip$on ¡rate ¡in ¡biased ¡strains ¡ CUG ¡(LeuP/Q/T/V/W) ¡ CUU ¡(LeuU) ¡ UUA ¡(LeuZ) ¡ CUC ¡(LeuU) ¡ CUA ¡(LeuW) ¡ UUG ¡(LeuX/Z) ¡ WT, ¡B2, ¡B9 ¡ B1 ¡ B6, ¡B7, ¡B8, ¡B10 ¡ B3 ¡ B4 ¡ B5 ¡

Increased ¡tRNA ¡demand ¡may ¡be ¡met ¡by ¡augmen$ng ¡supply ¡

  • e.g. ¡modifica$on ¡of ¡a ¡tRNA ¡to ¡expand ¡its ¡set ¡of ¡read ¡codons ¡
  • In ¡E. ¡coli ¡MAS39, ¡a ¡second ¡leucyl-­‑tRNA ¡(tRNAleuW ¡) ¡is ¡

able ¡to ¡read ¡CUU ¡due ¡to ¡a ¡uridine-­‑5-­‑oxyace$c ¡acid ¡ modifica$on. ¡

  • It ¡remains ¡to ¡be ¡experimentally ¡established ¡if ¡E. ¡coli ¡

MG1655 ¡tRNAleuW ¡can ¡also ¡read ¡CUU. ¡

slide-20
SLIDE 20

New ¡insights ¡from ¡mul$scale ¡systems ¡biology ¡models: ¡ itera$ve ¡annota$on ¡of ¡gene ¡func$on ¡

Cellobiose Transcription Flux [mmol mRNA gDW-1 h-1] L-Arabinose Transcription Flux [mmol mRNA gDW-1 h-1]

10-14 10-12 10-10 10-8 10-6 10-14 10-12 10-10 10-8 10-6

TM0276 TM0283 TM0284

  • TM1219-TM1223,

TM1469, TM1848

In silico expression

> 8 fold change

L-Arabinose Normalized mRNA Cellobiose Normalized mRNA [Log2(Intensity Units)]

2-8 fold change

  • 6

8 10 12 14 16 6 8 10 12 14 16

> 8 fold change 2-8 fold change TM1219-TM1223, TM1848 TM0276 TM0283 TM0284

In vivo expression

a b c d

TM0280/0281/0282/0283/0284/0285

GTACGTAC

2 1 bits

AraR motif

T

A

A

T

A C

TG AAA TTT CA

TG

2 1 bits

CelR motif TM0276 TM1847/1848 TM1223 TM1218/1219/1220/1221/1222

Log2 [I.U.]

16 8

  • i. No annotated

L-arab transporter

  • ii. Regulon expansion

with predicted AraR motif

  • iii. Putative L-arab

ABC transporter

Transcription unit correction L-Arabinose Cellobiose

TM1223 TM1218/1219/1220/1221/1222

L-arab L-arab

TM1218/1219/1220/1221/1222/1223

TM0277/0278/0279

[Log2(Intensity Units)]

Iterative Workflow

Lerman ¡JA, ¡et ¡al. ¡In ¡silico ¡method ¡for ¡modelling ¡metabolism ¡and ¡gene ¡product ¡expression ¡at ¡ genome ¡scale. ¡Nat ¡Commun. ¡3:929, ¡2012. ¡

  • (a ¡& ¡b) ¡In ¡vivo ¡transcriptome ¡

measurements ¡ ¡confirm ¡the ¡in ¡silico ¡ transcriptomics ¡predic$ons ¡for ¡ differen$al ¡expression ¡of ¡genes ¡ when ¡growing ¡on ¡L-­‑Arabinose ¡or ¡ cellobiose ¡minimal ¡medium. ¡

  • (c) ¡scanning ¡of ¡promoter ¡and ¡

upstream ¡regions ¡of ¡essen$al ¡genes ¡ idenGfied ¡high-­‑scoring ¡moGfs ¡

  • (d) ¡scan ¡of ¡remaining ¡genome ¡for ¡

AraR ¡mo$f ¡iden$fied ¡different ¡ genes, ¡within ¡a ¡single ¡transcrip$onal ¡ unit, ¡with ¡sequences ¡similar ¡to ¡ ¡

  • a ¡sugar-­‑binding ¡protein ¡for ¡an ¡

arabinose ¡ABC ¡transporter ¡

  • a ¡permeases ¡of ¡an ¡ABC ¡

transporter ¡

  • iteraGve ¡workflow: ¡reconstruc$on-­‑> ¡

model-­‑> ¡predic$on ¡-­‑> ¡new ¡ annota$on-­‑> ¡beqer ¡model ¡-­‑> ¡… ¡

slide-21
SLIDE 21

1" 3" 5" 6" 8" 10" 17" 20" 28" 42" 58" 78" 105" 123" 139" 0" 20" 40" 60" 80" 100" 120" 140" 160" 1999" 2000" 2001" 2002" 2003" 2004" 2005" 2006" 2007" 2008" 2009" 2010" 2011" 2012" 2013"

Cumula$ve ¡number ¡of ¡published ¡genome-­‑scale ¡ metabolic ¡reconstruc$ons ¡ Year ¡

  • Metabolic ¡models ¡for ¡increasing ¡number ¡of ¡species ¡
  • We ¡envisage ¡a ¡demand ¡for ¡integrated ¡models ¡of ¡metabolism ¡and ¡

macromolecular ¡synthesis ¡for ¡all ¡of ¡these ¡species ¡

slide-22
SLIDE 22

U01 ¡Aims ¡2012-­‑2017: ¡ ¡Systems ¡Biology ¡Research ¡Group, ¡UCSD ¡

– Develop ¡soXware ¡for ¡ reconstruc$on ¡of ¡ biochemical ¡networks ¡ spanning ¡mul$ple ¡cellular ¡

  • subsystems. ¡

– Develop ¡techniques ¡for ¡ quan$ta$ve ¡predic$on ¡and ¡ valida$on ¡of ¡transcript ¡ abundance ¡in ¡an ¡integrated ¡ model ¡of ¡metabolism, ¡ macromolecular ¡synthesis ¡ and ¡regula$on ¡

  • Comparison ¡with ¡new ¡

experimental ¡data ¡ ¡

  • e.g. ¡for ¡Geobacter ¡spp. ¡

– biogeochemical ¡cycling ¡of ¡ carbon ¡and ¡metals ¡ – bioenergy ¡applica$ons. ¡

Feist, ¡A. ¡et ¡al. ¡Nat ¡Rev ¡Microbiol, ¡7(2):129–143, ¡2009. ¡ Prototyping ¡reconstruc$on ¡& ¡ valida$on ¡procedure ¡on ¡individual ¡

  • rganisms, ¡e.g. ¡E. ¡coli ¡& ¡T. ¡mari.ma ¡

Development ¡of ¡soXware ¡workflows ¡for ¡ mul$scale ¡model ¡reconstruc$on ¡and ¡systema$c ¡ valida$on ¡using ¡transcriptomic ¡data ¡

slide-23
SLIDE 23

U01 ¡Aims ¡2012-­‑2017: ¡Systems ¡ Op$miza$on ¡Laboratory, ¡Stanford. ¡

Current ¡large-­‑scale ¡ LP ¡& ¡QP ¡solvers ¡

New ¡large-­‑scale ¡ LP ¡& ¡QP ¡solvers ¡ Increasing ¡the ¡reliability, ¡ while ¡maintaining ¡ efficiency ¡of ¡numerical ¡

  • p$miza$on ¡solvers ¡
  • Development ¡of ¡quad ¡precision ¡versions ¡of ¡large-­‑scale ¡LP/QP/NLP ¡solvers ¡(SQOPT ¡, ¡SNOPT), ¡

and ¡their ¡linear ¡sparse-­‑matrix ¡ ¡algebra ¡‘engine’ ¡(LUSOL) ¡

  • re-­‑implement ¡in ¡Fortran ¡2003 ¡with ¡quad ¡precision ¡variables ¡
  • redesign ¡of ¡key ¡components, ¡e.g., ¡storage ¡alloca$on ¡
  • SoXware: ¡www.stanford.edu/group/SOL/mul$scale/soXware.html ¡
slide-24
SLIDE 24

250 500 750 1000 1250 2250 1990 1992 1994 1996 1998 2000 2002 2004 2006 2008 2009 Majewski & Domach Varma & Palsson

Year Number

reactions genes components

  • compartmentalized reconstruction (distinct periplasm)
  • extensive cell wall metabolism (phospholipids, murein, LPS)
  • reaction thermodynamics

Development

  • alternate carbon utilization
  • quinone characterization
  • elemental and charge balancing
  • fatty acid metabolism
  • expanded cellular transport systems
  • used genome as a scaffold
  • cell wall constituent biosynthesis
  • cofactor biosynthesis
  • growth-dependent biomass objective function
  • amino acid and

nucleotide biosyn.

Genomic Era

Pramanik & Keasling Edwards & Palsson Reed et al. Feist et al.

  • I: Transcription, II: mRNA degradation;
  • III: translation;
  • IV: protein maturation,
  • V: protein folding; VI: metallo-ion binding;
  • VII: protein complex formation;
  • VIII: ribosome assembly;
  • IX: RNA processing; X: rRNA modification;
  • XI: tRNA modification; XII: tRNA charging

Thiele et al. 80,000 60,000

Thiele ¡I, ¡Fleming ¡RMT, ¡Que ¡R, ¡Bordbar ¡A, ¡Diep ¡D, ¡Palsson ¡BO. ¡ ¡Mul$scale ¡Modeling ¡of ¡ Metabolism ¡and ¡Macromolecular ¡Synthesis ¡in ¡E. ¡coli ¡and ¡Its ¡Applica$on ¡to ¡the ¡Evolu$on ¡of ¡ Codon ¡Usage. ¡PLoS ¡One. ¡7(9):e45635, ¡2012. ¡

  • f ¡reac$ons ¡

Increasing ¡size ¡of ¡E. ¡coli ¡reconstruc$ons ¡

slide-25
SLIDE 25

U01 ¡Aims ¡2012-­‑2017: ¡Systems ¡ Op$miza$on ¡Laboratory, ¡Stanford. ¡

  • Development ¡of ¡hypergraph ¡network ¡flow ¡algorithms ¡for ¡op$miza$on ¡with ¡biological ¡

networks ¡

  • Standard ¡network ¡flow ¡algorithms ¡ ¡
  • Complexity ¡O(n) ¡
  • Designed ¡specifically ¡for ¡graphs, ¡whereas ¡biological ¡networks ¡are ¡hypergraphs ¡
  • Standard ¡linear ¡op$miza$on ¡algorithms ¡
  • Complexity ¡O(n^3) ¡
  • Used ¡for, ¡amongst ¡many ¡other ¡things, ¡op$miza$on ¡over ¡biochemical ¡networks ¡ ¡
  • e.g. ¡Flux ¡Balance ¡Analysis ¡
  • Open ¡research ¡ques$on: ¡Does ¡there ¡exist ¡an ¡algorithm ¡of ¡lower ¡computa$onal ¡

complexity ¡than ¡a ¡standard ¡linear ¡op$miza$on ¡solver, ¡specifically ¡for ¡biochemical ¡ hypergraph ¡flow ¡problems? ¡

slide-26
SLIDE 26

10# 100# 1000# 10000# 100000# 1000000# 1996# 1998# 2000# 2002# 2004# 2006# 2008# 2010# 2012# 2014#

Single#cell#metabolism# Signaling# Transcrip9onal#Regula9on# Macromolecular#synthesis# Mul9?cell#models#

Number ¡of ¡reac$ons ¡

Biochemical ¡reac$on ¡network ¡models ¡are ¡increasing ¡in ¡scope ¡

However, ¡the ¡currently ¡available ¡approaches ¡for ¡large ¡scale ¡ modeling ¡of ¡biochemical ¡reac$on ¡networks ¡only ¡explicitly ¡ represent ¡reac$on ¡flux, ¡not ¡molecular ¡abundance. ¡ Open ¡ques$on: ¡does ¡there ¡exist ¡a ¡numerically ¡scalable ¡ approach ¡to ¡model ¡fluxes ¡and ¡concentra$ons ¡explicitly? ¡

slide-27
SLIDE 27
slide-28
SLIDE 28
  • Modeling ¡challenge ¡
  • High ¡dimensional ¡ ¡
  • many ¡molecular ¡species ¡and ¡reac$ons ¡
  • Nonlinear ¡ ¡
  • nonlinear ¡rela$onship ¡between ¡molecular ¡species ¡abundance ¡and ¡reac$on ¡rate ¡
  • Need ¡algorithms ¡with ¡low ¡polynomial ¡$me ¡complexity, ¡guaranteed ¡convergence, ¡

cer$ficate ¡of ¡infeasibility ¡

  • mathema$cal ¡model ¡& ¡algorithm ¡formula$on ¡problem ¡ ¡
  • Mul$scale ¡
  • molecular ¡species ¡concentra$ons ¡vary ¡over ¡many ¡orders ¡of ¡magnitude ¡
  • e.g. ¡transcript ¡abundance ¡versus ¡metabolite ¡abundance ¡
  • Paucity ¡of ¡kine$c ¡parameters ¡
slide-29
SLIDE 29

Nonlinear relations between reaction rates and metabolite concentrations satisfied at

  • ptimum of a convex
  • ptimization problem

Amenable ¡to ¡solu$on ¡with ¡ polynomial ¡$me ¡algorithms ¡

slide-30
SLIDE 30
  • Constraint ¡on ¡ra$o ¡of ¡

concentra$ons, ¡not ¡ absolute ¡ concentra$on. ¡

  • Biochemical ¡reac$on ¡

direc$ons ¡are ¡an ¡ evolved ¡subset ¡of ¡ thermodynamically ¡ feasible ¡direc$ons. ¡

slide-31
SLIDE 31
slide-32
SLIDE 32

When ¡does ¡there ¡exist ¡a ¡non-­‑equilibrium ¡steady ¡state ¡concentra$on? ¡ ¡

slide-33
SLIDE 33

U01 ¡Aims ¡2012-­‑2017: ¡Systems ¡Biochemistry ¡ ¡ & ¡Molecular ¡Systems ¡Physiology ¡Groups, ¡Luxembourg. ¡

  • Scalable ¡algorithms ¡for ¡mulGscale ¡reconstrucGon ¡and ¡modeling ¡
  • SoOware ¡to ¡enable ¡high ¡fidelity ¡reconstrucGon ¡of ¡biochemical ¡networks ¡
  • e.g. ¡checking ¡for ¡consistency ¡with ¡known ¡biochemistry ¡
  • e.g. ¡sugges$ng ¡extension ¡to ¡exis$ng ¡reconstruc$on ¡to ¡account ¡for ¡known ¡

biochemical ¡func$on ¡

  • MulGscale ¡mass ¡conserved ¡elementary ¡kineGc ¡modeling ¡
  • Forward ¡problem ¡
  • given ¡kine$c ¡parameters, ¡compute ¡a ¡non-­‑equilibrium ¡steady ¡state ¡
  • Inverse ¡problem ¡
  • given ¡reac$on ¡stoichiometry, ¡experimental ¡boundary ¡condi$ons ¡

thermodynamic ¡constraints ¡and ¡net ¡reac$on ¡direc$ons ¡consistent ¡with ¡ biochemistry, ¡search ¡among ¡consistent ¡kine$c ¡parameters ¡

  • Gradient-­‑based ¡search ¡of ¡kine$c ¡parameters ¡in ¡mul$scale ¡models. ¡
  • exis$ng ¡algorithms ¡do ¡not ¡search ¡for ¡kine$c ¡parameters ¡using ¡gradient ¡

based ¡methods ¡due ¡to ¡a ¡percep$on ¡that ¡the ¡merit ¡func$on ¡for ¡such ¡a ¡ problem ¡contains ¡local ¡minima ¡

  • High ¡risk, ¡high ¡gain ¡project: ¡does ¡a ¡formula$on ¡of ¡the ¡problem ¡exist ¡

which ¡is ¡amenable ¡to ¡solu$on ¡with ¡a ¡polynomial ¡$me ¡algorithm ¡ guaranteed ¡to ¡reach ¡a ¡global ¡op$ma? ¡

slide-34
SLIDE 34

Sharing ¡models ¡

  • Network ¡reconstruc$ons ¡used ¡to ¡generate ¡

computa$onal ¡models ¡are ¡always ¡made ¡ available ¡with ¡the ¡accompanying ¡paper ¡

– Systems ¡Biology ¡Markup ¡Language ¡(SBML) ¡

  • all ¡monoscale ¡models ¡
  • for ¡mul$scale ¡models, ¡standardised ¡representa$on ¡that ¡

is ¡scalable ¡needs ¡to ¡be ¡developed. ¡

  • mul$scale ¡models ¡s$ll ¡distributed, ¡but ¡representa$on ¡

not ¡yet ¡standardised. ¡ ¡

hqp://thielelab.eu/ ¡ hqp://systemsbiology.ucsd.edu/Downloads ¡ hqp://www.stanford.edu/group/SOL/mul$scale/models.html ¡

slide-35
SLIDE 35

Open ¡source ¡soXware ¡ ¡

  • von ¡Bertalanffy ¡1.0 ¡-­‑ ¡a ¡

COBRA ¡toolbox ¡extension ¡ to ¡thermodynamically ¡ constrain ¡metabolic ¡models ¡

(Fleming ¡& ¡Thiele, ¡Bioinf, ¡2011) ¡

  • COBRA ¡Toolbox ¡v2.0 ¡-­‑ ¡

quan$ta$ve ¡predic$on ¡of ¡ cellular ¡metabolism ¡with ¡ constraint-­‑based ¡models ¡

(Schellenberger ¡et ¡al, ¡Nat ¡Protoc, ¡ 2011) ¡

  • rBioNet ¡-­‑ ¡a ¡COBRA ¡toolbox ¡extension ¡for ¡reconstruc$ng ¡high-­‑quality ¡

biochemical ¡networks ¡(Thorleifsson ¡& ¡Thiele, ¡Bioinf, ¡2011) ¡

  • COBRApy ¡-­‑ ¡ ¡COnstraints-­‑Based ¡Reconstruc$on ¡and ¡Analysis ¡for ¡Python ¡(Ebrahim ¡et ¡

al, ¡BMC ¡Syst ¡Biol, ¡2013) ¡

  • fastFVA ¡– ¡a ¡tool ¡for ¡computa$onally ¡efficient ¡flux ¡variability ¡analysis ¡(Gudmunsson ¡& ¡

Thiele, ¡BMC ¡Bioinf, ¡2010) ¡

  • robustFBA ¡-­‑ ¡Robust ¡flux ¡balance ¡analysis ¡of ¡mul$-­‑ ¡scale ¡biochemical ¡reac$on ¡

networks ¡(Sun ¡et ¡al, ¡BMC ¡Bioinf, ¡2013) ¡

See ¡hqp://www.stanford.edu/group/SOL/mul$scale/soXware.html ¡for ¡links ¡to ¡soXware ¡

slide-36
SLIDE 36

Open ¡source ¡soXware ¡con$nued: ¡ ¡

¡

  • LUSOL, ¡LUMOD ¡Rou$nes ¡for ¡dense ¡and ¡sparse ¡LU ¡factoriza$on. ¡

¡

  • PDCO ¡A ¡primal-­‑dual ¡interior ¡point ¡method ¡for ¡large-­‑scale ¡op$miza$on ¡with ¡

convex ¡objec$ve ¡and ¡linear ¡constraints. ¡ ¡

  • PNOPT ¡Proximal ¡Newton-­‑type ¡methods ¡for ¡minimizing ¡composite ¡func$ons ¡

(unconstrained ¡op$miza$on ¡of ¡the ¡sum ¡of ¡smooth ¡and ¡nonsmooth ¡func$ons). ¡

See ¡hqp://www.stanford.edu/group/SOL/mul$scale/soXware.html ¡for ¡links ¡to ¡soXware ¡

  • Need ¡help ¡with ¡cobra ¡methodology? ¡
  • openCOBRA ¡Google ¡group ¡
  • hqps://groups.google.com/forum/#!forum/cobra-­‑toolbox ¡
  • >2009 ¡
  • 430 ¡posts ¡
  • 300 ¡members ¡
  • Anyone ¡can ¡view ¡content. ¡
  • Anyone ¡can ¡apply ¡to ¡join. ¡
slide-37
SLIDE 37

Thanks ¡

  • Colleagues ¡in ¡the ¡Mul$scale ¡Systems ¡

Biology ¡Collabora$on ¡ ¡ ¡

  • Funding ¡2012-­‑2017 ¡

– Na$onal ¡Ins$tutes ¡of ¡Health ¡(NIH) ¡through ¡ the ¡Mul$scale ¡Modeling ¡Physiome ¡ Ini$a$ve, ¡grant ¡1U01GM102098-­‑01. ¡ – Department ¡of ¡Energy ¡(DOE) ¡through ¡the ¡ Scien$fic ¡Discovery ¡Through ¡Advanced ¡ Compu$ng ¡Program, ¡grant ¡DE-­‑SC0010429. ¡

  • Program ¡coordina$on ¡

– Interagency ¡Modeling ¡and ¡Analysis ¡group ¡