Mul$scale ¡Molecular ¡Systems ¡Biology: ¡ ¡ Reconstruc$on ¡and ¡Model ¡Op$miza$on ¡
- Dr. ¡Ronan ¡M.T. ¡Fleming, ¡
Mul$scale Molecular Systems Biology: Reconstruc$on and - - PowerPoint PPT Presentation
Mul$scale Molecular Systems Biology: Reconstruc$on and Model Op$miza$on Dr. Ronan M.T. Fleming, Systems Biochemistry Group, Luxembourg Centre for Systems
Variables ¡with ¡ magnitudes ¡ spread ¡over ¡ many ¡orders ¡of ¡
Chemical ¡ formula ¡known ¡ for ¡each ¡
System ¡of ¡ biochemical ¡ reac$ons ¡with ¡ defined ¡ boundary ¡ condi$ons. ¡ Biomedical, ¡ biotechnological, ¡ environmental, ¡ applica$ons. ¡ An ¡abstrac$on ¡of ¡select ¡ biochemical, ¡gene$c, ¡and ¡ genomic ¡experimental ¡ knowledge ¡about ¡a ¡ chosen ¡biochemical ¡ subsystem ¡ General ¡mathema$cal ¡ model, ¡combined ¡with ¡ par$cular ¡reconstruc$on, ¡ thus ¡crea$ng ¡a ¡ computa$onal ¡model. ¡ Numerical ¡op$miza$on ¡ problems ¡with ¡a ¡firm ¡ grounding ¡in ¡ mathema$cal ¡
– 1 ¡microbial ¡species ¡~ ¡1e3 ¡reac$ons ¡ – 1 ¡community ¡(1000 ¡species) ¡~ ¡1e6 ¡reac$ons ¡
– Metabolic ¡reac$ons ¡ – Macromolecular ¡synthesis ¡reac$ons ¡
McCloskey ¡D, ¡Palsson ¡BØ, ¡Feist ¡AM. ¡ ¡Basic ¡and ¡applied ¡uses ¡of ¡genome-‑scale ¡metabolic ¡network ¡ reconstruc$ons ¡of ¡Escherichia ¡coli. ¡Mol ¡Syst ¡Biol. ¡9:661, ¡2013. ¡
Stoichiometric ¡Matrix ¡(denoted ¡S) ¡
Thiele ¡I, ¡Jamshidi ¡N, ¡Fleming ¡RMT, ¡Palsson ¡BØ. ¡Genome-‑scale ¡reconstruc$on ¡of ¡Escherichia ¡coli's ¡ transcrip$onal ¡and ¡transla$onal ¡machinery: ¡a ¡knowledge ¡base, ¡its ¡mathema$cal ¡formula$on, ¡ and ¡its ¡func$onal ¡characteriza$on. ¡PLoS ¡computa$onal ¡biology. ¡5(3):e1000312., ¡2009. ¡
DNA Transcription Unit rRNA mRNA Protein i Chaperones Protein j Prosthetic group, metallo -ions Complex ij RNA Polymerase Transcription Factors Nucleotides Amino acids tRNA Map/Def Charged and modifed tRNA modifed rRNA
P P P P P P P P P P P P P P P PI II II III III IV IV V VII VII IX IX X VIII VIII
Gene Gene
VI VI XI XI XII XII
# transcription units 249 # genes 423 tRNA/rRNA/misc RNA 86/22/1 proteins (w/o genes) 228 (34) # subsystems 27 # reactions 13,694 # components 11,991 # references +500
Thiele ¡I, ¡Fleming ¡RMT, ¡Que ¡R, ¡Bordbar ¡A, ¡Diep ¡D, ¡Palsson ¡BO. ¡ ¡Mul$scale ¡Modeling ¡of ¡ Metabolism ¡and ¡Macromolecular ¡Synthesis ¡in ¡E. ¡coli ¡and ¡Its ¡Applica$on ¡to ¡the ¡Evolu$on ¡of ¡ Codon ¡Usage. ¡PLoS ¡One. ¡7(9):e45635, ¡2012. ¡ Metabolic ¡reac$on ¡ fluxes ¡ ¡ ~ ¡milimol/gDW/hr ¡ Macromolecular ¡ reac$on ¡fluxes ¡ ¡ ~ ¡nanomol/gDW/hr ¡ 6 ¡orders ¡of ¡ magnitude ¡ ¡
E ¡ ¡ C E ¡ E* ¡ ¡ D ¡ F
v4 ¡
¡ C ¡ D ¡ G
vS ¡ vD ¡ vu ¡
ü If ¡metabolic ¡reac.on ¡is ¡used, ¡then ¡protein ¡& ¡ mRNA ¡need ¡to ¡be ¡produced ¡ ü If ¡flux ¡through ¡metabolic ¡reac.on ¡increases, ¡ the ¡synthesis ¡rate ¡of ¡protein ¡and ¡mRNA ¡needs ¡ to ¡increase ¡accordingly ¡ Canonical ¡steady-‑state ¡modeling ¡ Coupling ¡constraints ¡ Thiele ¡I, ¡Fleming ¡RMT, ¡Bordbar ¡A, ¡Schellenberger ¡J, ¡Palsson ¡BØ. ¡Func$onal ¡characteriza$on ¡of ¡ alternate ¡op$mal ¡solu$ons ¡of ¡Escherichia ¡coli's ¡transcrip$onal ¡and ¡transla$onal ¡machinery. ¡ Biophysical ¡journal. ¡98(10):2072-‑81, ¡2010. ¡
Many ¡metabolic ¡ moieGes ¡in ¡one ¡ macromolecule ¡ ReacGon ¡rates ¡over ¡many ¡
reformulate ¡ reformulate ¡ BMC ¡Bioinforma$cs ¡2013, ¡14:240 ¡doi:10.1186/1471-‑2105-‑14-‑240 ¡ Reformula$on ¡involves ¡a ¡trade ¡off ¡between ¡ computa$onal ¡efficiency ¡and ¡reliability. ¡
BMC ¡Bioinforma$cs ¡2013, ¡14:240 ¡doi:10.1186/1471-‑2105-‑14-‑240 ¡
BMC ¡Bioinforma$cs ¡2013, ¡14:240 ¡doi:10.1186/1471-‑2105-‑14-‑240 ¡
Thiele ¡I, ¡Fleming ¡RMT, ¡Que ¡R, ¡Bordbar ¡A, ¡Diep ¡D, ¡Palsson ¡BO. ¡ ¡Mul$scale ¡Modeling ¡of ¡Metabolism ¡and ¡Macromolecular ¡ Synthesis ¡in ¡E. ¡coli ¡and ¡Its ¡Applica$on ¡to ¡the ¡Evolu$on ¡of ¡Codon ¡Usage. ¡PLoS ¡One. ¡7(9):e45635, ¡2012. ¡
genomes, ¡and ¡along ¡genes. ¡
UUU ¡ Phe ¡(2) ¡ UCU ¡ Ser ¡(5) ¡ UAU ¡ Tyr ¡(3) ¡ UGU ¡ Cys ¡(1) ¡ UUC ¡ UCC ¡ UAC ¡ UGC ¡ UUA ¡ Leu ¡(8) ¡ UCA ¡ UAA ¡ Ochre ¡ UGA ¡ Opal ¡ UUG ¡ UCG ¡ UAG ¡ Amber ¡ UGG ¡ Trp ¡(1) ¡ CUU ¡ Leu ¡(8) ¡ CCU ¡ Pro ¡(3) ¡ CAU ¡ His ¡(1) ¡ CGU ¡ Arg ¡(7) ¡ CUC ¡ CCC ¡ CAC ¡ CGC ¡ CUA ¡ CCA ¡ CAA ¡ Gln ¡(4) ¡ CGA ¡ CUG ¡ CCG ¡ CAG ¡ CGG ¡ AUU ¡ Ile ¡(5) ¡ ACU ¡ Thr ¡(4) ¡ AAU ¡ Asn ¡(4) ¡ AGU ¡ Ser ¡(5) ¡ AUC ¡ ACC ¡ AAC ¡ AGC ¡ AUA ¡ ACA ¡ AAA ¡ Lys ¡(6) ¡ AGA ¡ Arg ¡(7) ¡ AUG ¡ Met ¡(6) ¡ ACG ¡ AAG ¡ AGG ¡ GUU ¡ Val ¡(7) ¡ GCU ¡ Ala ¡(5) ¡ GAU ¡ Asp ¡(3) ¡ GGU ¡ Gly ¡(6) ¡ GUC ¡ GCC ¡ GAC ¡ GGC ¡ GUA ¡ GCA ¡ GAA ¡ Glu ¡(4) ¡ GGA ¡ GUG ¡ GCG ¡ GAG ¡ GGG ¡
U U C A G C A G
U C A G U C A G U C A G U C A G
molecules. Number of distinct tRNA molecules per amino acid are given in parenthesis. Leu = Leucine
synonymous
CUG is the dominant synonymous codon
Gene$c ¡code ¡of ¡E. ¡coli ¡(RNA ¡perspec$ve) ¡
Thiele ¡I, ¡Fleming ¡RMT, ¡Que ¡R, ¡Bordbar ¡A, ¡Diep ¡D, ¡Palsson ¡BO. ¡ ¡Mul$scale ¡Modeling ¡of ¡Metabolism ¡and ¡Macromolecular ¡ Synthesis ¡in ¡E. ¡coli ¡and ¡Its ¡Applica$on ¡to ¡the ¡Evolu$on ¡of ¡Codon ¡Usage. ¡PLoS ¡One. ¡7(9):e45635, ¡2012. ¡
Thiele ¡I, ¡Fleming ¡RMT, ¡Que ¡R, ¡Bordbar ¡A, ¡Diep ¡D, ¡Palsson ¡BO. ¡ ¡Mul$scale ¡Modeling ¡of ¡Metabolism ¡and ¡Macromolecular ¡ Synthesis ¡in ¡E. ¡coli ¡and ¡Its ¡Applica$on ¡to ¡the ¡Evolu$on ¡of ¡Codon ¡Usage. ¡PLoS ¡One. ¡7(9):e45635, ¡2012. ¡
Thiele ¡I, ¡Fleming ¡RMT, ¡Que ¡R, ¡Bordbar ¡A, ¡Diep ¡D, ¡Palsson ¡BO. ¡ ¡Mul$scale ¡Modeling ¡of ¡Metabolism ¡and ¡Macromolecular ¡ Synthesis ¡in ¡E. ¡coli ¡and ¡Its ¡Applica$on ¡to ¡the ¡Evolu$on ¡of ¡Codon ¡Usage. ¡PLoS ¡One. ¡7(9):e45635, ¡2012. ¡
00$ 0.50$ 0.75$ 1.00$ EQ5$ EQ4$ EQ3$ EQ2$ EQ1$ B10$ B9$ B8$ B7$ B6$ B5$ B4$ B3$ B2$ B1$
Lactate)
00$ 0.50$ 0.75$ 1.00$ EQ5$ EQ4$ EQ3$ EQ2$ EQ1$ B10$ B9$ B8$ B7$ B6$ B5$ B4$ B3$ B2$ B1$
Glucose,)Aerobic)
EQ EQ EQ EQ EQ B10$
Growth ¡rate ¡(rela$ve ¡to ¡wild ¡type) ¡
affect ¡ ¡
growth ¡rate ¡in ¡silico. ¡
solu$ons ¡used ¡to ¡derive ¡causal ¡molecular ¡mechanis$c ¡ hypothesis ¡connec$ng ¡codon ¡usage ¡with ¡growth ¡rate ¡
wild ¡type, ¡but ¡leucyl-‑tRNA ¡transcrip$on ¡rate ¡in ¡biased ¡strains ¡ CUG ¡(LeuP/Q/T/V/W) ¡ CUU ¡(LeuU) ¡ UUA ¡(LeuZ) ¡ CUC ¡(LeuU) ¡ CUA ¡(LeuW) ¡ UUG ¡(LeuX/Z) ¡ WT, ¡B2, ¡B9 ¡ B1 ¡ B6, ¡B7, ¡B8, ¡B10 ¡ B3 ¡ B4 ¡ B5 ¡
Increased ¡tRNA ¡demand ¡may ¡be ¡met ¡by ¡augmen$ng ¡supply ¡
able ¡to ¡read ¡CUU ¡due ¡to ¡a ¡uridine-‑5-‑oxyace$c ¡acid ¡ modifica$on. ¡
MG1655 ¡tRNAleuW ¡can ¡also ¡read ¡CUU. ¡
Cellobiose Transcription Flux [mmol mRNA gDW-1 h-1] L-Arabinose Transcription Flux [mmol mRNA gDW-1 h-1]
10-14 10-12 10-10 10-8 10-6 10-14 10-12 10-10 10-8 10-6
TM0276 TM0283 TM0284
TM1469, TM1848
In silico expression
> 8 fold change
L-Arabinose Normalized mRNA Cellobiose Normalized mRNA [Log2(Intensity Units)]
2-8 fold change
8 10 12 14 16 6 8 10 12 14 16
> 8 fold change 2-8 fold change TM1219-TM1223, TM1848 TM0276 TM0283 TM0284
In vivo expression
a b c d
TM0280/0281/0282/0283/0284/0285
GTACGTAC
2 1 bits
AraR motif
T
A
A
T
A C
TG AAA TTT CA
TG
2 1 bits
CelR motif TM0276 TM1847/1848 TM1223 TM1218/1219/1220/1221/1222
Log2 [I.U.]
16 8
L-arab transporter
with predicted AraR motif
ABC transporter
Transcription unit correction L-Arabinose Cellobiose
TM1223 TM1218/1219/1220/1221/1222
L-arab L-arab
TM1218/1219/1220/1221/1222/1223
TM0277/0278/0279
[Log2(Intensity Units)]
Iterative Workflow
Lerman ¡JA, ¡et ¡al. ¡In ¡silico ¡method ¡for ¡modelling ¡metabolism ¡and ¡gene ¡product ¡expression ¡at ¡ genome ¡scale. ¡Nat ¡Commun. ¡3:929, ¡2012. ¡
measurements ¡ ¡confirm ¡the ¡in ¡silico ¡ transcriptomics ¡predic$ons ¡for ¡ differen$al ¡expression ¡of ¡genes ¡ when ¡growing ¡on ¡L-‑Arabinose ¡or ¡ cellobiose ¡minimal ¡medium. ¡
upstream ¡regions ¡of ¡essen$al ¡genes ¡ idenGfied ¡high-‑scoring ¡moGfs ¡
AraR ¡mo$f ¡iden$fied ¡different ¡ genes, ¡within ¡a ¡single ¡transcrip$onal ¡ unit, ¡with ¡sequences ¡similar ¡to ¡ ¡
arabinose ¡ABC ¡transporter ¡
transporter ¡
model-‑> ¡predic$on ¡-‑> ¡new ¡ annota$on-‑> ¡beqer ¡model ¡-‑> ¡… ¡
1" 3" 5" 6" 8" 10" 17" 20" 28" 42" 58" 78" 105" 123" 139" 0" 20" 40" 60" 80" 100" 120" 140" 160" 1999" 2000" 2001" 2002" 2003" 2004" 2005" 2006" 2007" 2008" 2009" 2010" 2011" 2012" 2013"
Cumula$ve ¡number ¡of ¡published ¡genome-‑scale ¡ metabolic ¡reconstruc$ons ¡ Year ¡
– Develop ¡soXware ¡for ¡ reconstruc$on ¡of ¡ biochemical ¡networks ¡ spanning ¡mul$ple ¡cellular ¡
– Develop ¡techniques ¡for ¡ quan$ta$ve ¡predic$on ¡and ¡ valida$on ¡of ¡transcript ¡ abundance ¡in ¡an ¡integrated ¡ model ¡of ¡metabolism, ¡ macromolecular ¡synthesis ¡ and ¡regula$on ¡
experimental ¡data ¡ ¡
– biogeochemical ¡cycling ¡of ¡ carbon ¡and ¡metals ¡ – bioenergy ¡applica$ons. ¡
Feist, ¡A. ¡et ¡al. ¡Nat ¡Rev ¡Microbiol, ¡7(2):129–143, ¡2009. ¡ Prototyping ¡reconstruc$on ¡& ¡ valida$on ¡procedure ¡on ¡individual ¡
Development ¡of ¡soXware ¡workflows ¡for ¡ mul$scale ¡model ¡reconstruc$on ¡and ¡systema$c ¡ valida$on ¡using ¡transcriptomic ¡data ¡
Current ¡large-‑scale ¡ LP ¡& ¡QP ¡solvers ¡
New ¡large-‑scale ¡ LP ¡& ¡QP ¡solvers ¡ Increasing ¡the ¡reliability, ¡ while ¡maintaining ¡ efficiency ¡of ¡numerical ¡
and ¡their ¡linear ¡sparse-‑matrix ¡ ¡algebra ¡‘engine’ ¡(LUSOL) ¡
250 500 750 1000 1250 2250 1990 1992 1994 1996 1998 2000 2002 2004 2006 2008 2009 Majewski & Domach Varma & Palsson
Year Number
reactions genes components
Development
nucleotide biosyn.
Genomic Era
Pramanik & Keasling Edwards & Palsson Reed et al. Feist et al.
Thiele et al. 80,000 60,000
Thiele ¡I, ¡Fleming ¡RMT, ¡Que ¡R, ¡Bordbar ¡A, ¡Diep ¡D, ¡Palsson ¡BO. ¡ ¡Mul$scale ¡Modeling ¡of ¡ Metabolism ¡and ¡Macromolecular ¡Synthesis ¡in ¡E. ¡coli ¡and ¡Its ¡Applica$on ¡to ¡the ¡Evolu$on ¡of ¡ Codon ¡Usage. ¡PLoS ¡One. ¡7(9):e45635, ¡2012. ¡
networks ¡
complexity ¡than ¡a ¡standard ¡linear ¡op$miza$on ¡solver, ¡specifically ¡for ¡biochemical ¡ hypergraph ¡flow ¡problems? ¡
10# 100# 1000# 10000# 100000# 1000000# 1996# 1998# 2000# 2002# 2004# 2006# 2008# 2010# 2012# 2014#
Single#cell#metabolism# Signaling# Transcrip9onal#Regula9on# Macromolecular#synthesis# Mul9?cell#models#
Number ¡of ¡reac$ons ¡
However, ¡the ¡currently ¡available ¡approaches ¡for ¡large ¡scale ¡ modeling ¡of ¡biochemical ¡reac$on ¡networks ¡only ¡explicitly ¡ represent ¡reac$on ¡flux, ¡not ¡molecular ¡abundance. ¡ Open ¡ques$on: ¡does ¡there ¡exist ¡a ¡numerically ¡scalable ¡ approach ¡to ¡model ¡fluxes ¡and ¡concentra$ons ¡explicitly? ¡
cer$ficate ¡of ¡infeasibility ¡
Amenable ¡to ¡solu$on ¡with ¡ polynomial ¡$me ¡algorithms ¡
concentra$ons, ¡not ¡ absolute ¡ concentra$on. ¡
direc$ons ¡are ¡an ¡ evolved ¡subset ¡of ¡ thermodynamically ¡ feasible ¡direc$ons. ¡
When ¡does ¡there ¡exist ¡a ¡non-‑equilibrium ¡steady ¡state ¡concentra$on? ¡ ¡
biochemical ¡func$on ¡
thermodynamic ¡constraints ¡and ¡net ¡reac$on ¡direc$ons ¡consistent ¡with ¡ biochemistry, ¡search ¡among ¡consistent ¡kine$c ¡parameters ¡
based ¡methods ¡due ¡to ¡a ¡percep$on ¡that ¡the ¡merit ¡func$on ¡for ¡such ¡a ¡ problem ¡contains ¡local ¡minima ¡
which ¡is ¡amenable ¡to ¡solu$on ¡with ¡a ¡polynomial ¡$me ¡algorithm ¡ guaranteed ¡to ¡reach ¡a ¡global ¡op$ma? ¡
hqp://thielelab.eu/ ¡ hqp://systemsbiology.ucsd.edu/Downloads ¡ hqp://www.stanford.edu/group/SOL/mul$scale/models.html ¡
COBRA ¡toolbox ¡extension ¡ to ¡thermodynamically ¡ constrain ¡metabolic ¡models ¡
(Fleming ¡& ¡Thiele, ¡Bioinf, ¡2011) ¡
quan$ta$ve ¡predic$on ¡of ¡ cellular ¡metabolism ¡with ¡ constraint-‑based ¡models ¡
(Schellenberger ¡et ¡al, ¡Nat ¡Protoc, ¡ 2011) ¡
biochemical ¡networks ¡(Thorleifsson ¡& ¡Thiele, ¡Bioinf, ¡2011) ¡
al, ¡BMC ¡Syst ¡Biol, ¡2013) ¡
Thiele, ¡BMC ¡Bioinf, ¡2010) ¡
networks ¡(Sun ¡et ¡al, ¡BMC ¡Bioinf, ¡2013) ¡
See ¡hqp://www.stanford.edu/group/SOL/mul$scale/soXware.html ¡for ¡links ¡to ¡soXware ¡
¡
¡
convex ¡objec$ve ¡and ¡linear ¡constraints. ¡ ¡
(unconstrained ¡op$miza$on ¡of ¡the ¡sum ¡of ¡smooth ¡and ¡nonsmooth ¡func$ons). ¡
See ¡hqp://www.stanford.edu/group/SOL/mul$scale/soXware.html ¡for ¡links ¡to ¡soXware ¡