SLIDE 1
Leslie ¡REGAD ¡
MTi, ¡UMR-‑S973 ¡Inserm, ¡Univ ¡Paris ¡Diderot ¡ ¡ ¡ JOBIM, ¡Rennes, ¡03 ¡juillet ¡2012 ¡
SA-‑Mot: ¡a ¡web ¡server ¡for ¡the ¡iden5fica5on ¡of ¡ mo5fs ¡of ¡interest ¡extracted ¡from ¡protein ¡loops ¡ ¡
SLIDE 2 Protein ¡loops: ¡
- ¡link ¡between ¡regular ¡secondary ¡structures: ¡α-‑helix ¡and ¡β-‑strand ¡ ¡
- ¡involved ¡in ¡the ¡ligand ¡specificity ¡and ¡protein ¡func=on ¡ ¡
- ¡variable ¡regions ¡in ¡terms ¡of ¡structure ¡and ¡sequence ¡
Extrac=on ¡of ¡some ¡structural ¡mo=fs ¡from ¡SHORT ¡loops ¡
- ¡previous ¡studies ¡of ¡SHORT ¡loops: ¡ ¡
- ¡extrac=on ¡of ¡small ¡structural ¡mo=fs ¡from ¡short ¡
loops ¡(Hutchinson ¡et ¡al., ¡1994) ¡ ¡
- ¡short ¡loop ¡classifica=on ¡(Wojick ¡et ¡al., ¡1999, ¡
Fernandez ¡et ¡al., ¡2004) ¡ ¡
SLIDE 3 SA-‑Mot ¡Web ¡server ¡protocole ¡
Protein ¡target: ¡Topo ¡II ¡ complexed ¡with ¡ANP ¡ Loop ¡informa:ons ¡ SA-‑Mot ¡ SA-‑Mot ¡mo=f ¡ ¡database ¡ hUps://sa-‑mot.m=.univ-‑paris-‑diderot.fr ¡
- ¡Analysis ¡of ¡all ¡loops ¡of ¡given ¡protein ¡
SLIDE 4 SA-‑Mot ¡motif ¡database ¡
- Contains ¡important ¡loop ¡mo=fs ¡: ¡
– For ¡the ¡protein ¡structure ¡ – For ¡the ¡protein ¡func=on ¡
- Extrac=on ¡mo=fs ¡from ¡loops: ¡
– Based ¡on ¡ ¡
- Structural ¡alphabet ¡HMM-‑SA ¡(Camproux ¡et ¡al., ¡2004) ¡
- Structural ¡word ¡no=on ¡(Regad ¡et ¡al., ¡2010) ¡
– Without ¡superimposi=on ¡of ¡loop ¡structures ¡
SLIDE 5
- Use ¡HMM-‑SA ¡(Hidden ¡Markov ¡Model ¡– ¡Structural ¡Alphabet) ¡
– Classifica=on ¡of ¡all ¡4-‑residue ¡fragments ¡extracted ¡from ¡a ¡large ¡set ¡of ¡ protein ¡structures ¡
- Based ¡on ¡the ¡geometry ¡of ¡4-‑residue ¡fragments ¡
- Used ¡hidden ¡Markov ¡model ¡
- Camproux ¡et ¡al., ¡J ¡Mol ¡Biol, ¡2004 ¡
Presentation ¡of ¡HMM-‑SA ¡
SLIDE 6
Camproux ¡et ¡al., ¡J ¡mol ¡Biol, ¡2004 ¡
Simplification ¡of ¡a ¡protein ¡structure ¡using ¡HMM-‑SA ¡
Development ¡of ¡the ¡STRUCTURAL ¡WORD ¡no=on ¡
SLIDE 7 Extraction ¡of ¡structural ¡motif ¡HMM-‑SA ¡
- Extrac=on ¡of ¡7-‑residue ¡structural ¡mo=fs ¡using ¡HMM-‑SA ¡
– 4 ¡SL-‑words ¡= ¡7-‑residue ¡fragments ¡
Regad ¡et ¡al., ¡CSDA, ¡2008 ¡
1gpw_B ¡ Pos: ¡7-‑13 ¡VDVKNGK ¡ 1sfi_A ¡ Pos: ¡28-‑34 ¡AEYHNTQ ¡
SLIDE 8
- Recurrent ¡structural ¡words: ¡cluster ¡of ¡7-‑AA ¡fragments ¡with ¡similar ¡geometry ¡
(RMSd ¡= ¡0.85 ¡Å) ¡
- Extrac=on ¡of ¡structural ¡word ¡ ¡
rapid ¡extrac=on ¡of ¡structural ¡mo=fs ¡from ¡protein ¡loops ¡without ¡ superimposi=on ¡of ¡protein ¡structures ¡ YUOD: ¡ ¡ 183 ¡7-‑AA ¡fragments ¡ ¡ DRPI: ¡ ¡ 389 ¡7-‑AA ¡fragments ¡ ¡ PZCD ¡: ¡ ¡ 983 ¡7-‑AA ¡fragments ¡ ¡
Regad ¡et ¡al., ¡BMC ¡Bioinfo, ¡2010 ¡
Extraction ¡of ¡structural ¡motifs ¡using ¡HMM-‑SA ¡
SLIDE 9
- 4,911 ¡protein ¡structures ¡
– Non ¡redundant ¡(< ¡50% ¡of ¡iden=ty ¡sequence) ¡ – High ¡resolu=on ¡(< ¡2.5 ¡Å) ¡ – Classified ¡in ¡SCOP ¡classifica=on ¡ 90, ¡811 ¡loops ¡ ¡of ¡7 ¡to ¡35 ¡residues ¡ 25,305 ¡≠ ¡structural ¡words ¡seen ¡between ¡1 ¡to ¡1234 ¡=mes ¡ = ¡238,158 ¡7-‑residue ¡fragments ¡
Regad ¡et ¡al., ¡BMC ¡Bioinfo, ¡2010 ¡
SA-‑Mot ¡database ¡
Word ¡ extrac=on ¡ Loop ¡ extrac=on ¡
SLIDE 10
– Rare ¡words: ¡link ¡to ¡uncertain ¡region ¡ – Recurrent ¡words: ¡regular ¡structures ¡
- Weak ¡RMSD ¡
- Strong ¡AA-‑score ¡
- Over-‑representated ¡in ¡loop ¡dataset: ¡non-‑random ¡mo@fs ¡
Regular ¡structures ¡with ¡conserved ¡structures ¡and ¡amino ¡acid ¡specifici@es ¡
DRPI: ¡389 ¡7-‑AA ¡fragments ¡ ¡ PZCD: ¡983 ¡7-‑AA ¡fragments ¡ ¡ Regad ¡et ¡al., ¡BMC ¡Bioinfo, ¡2010 ¡
2-‑ ¡Different ¡type ¡of ¡SA-‑Mot ¡motifs ¡
SLIDE 11
- Loops ¡ooen ¡involved ¡in ¡protein ¡func=on ¡
- Over-‑representa=on ¡of ¡word ¡in ¡each ¡SCOP ¡superfamilies ¡ ¡
¡ ¡ ¡Extrac=on ¡of ¡specific ¡words ¡for ¡protein ¡func=on ¡
Regad ¡et ¡al., ¡BMC ¡Bioinfo, ¡2011 ¡
Link ¡between ¡structural ¡words ¡and ¡binding ¡sites ¡
SLIDE 12
3-‑ ¡Quantification ¡of ¡the ¡specificity ¡of ¡a ¡motif ¡for ¡a ¡function ¡
Superfamily ¡: ¡ 52540 ¡ 1gky ¡ 1ex7 ¡ 1ex6 ¡ Superfamily: ¡ ¡ 81301 ¡ 1no5 ¡ 1wot ¡ 2i9g ¡ …KZaaaAZILPMMNDYUODNH… …CGBQAWZILPNNTRYUODNL… …SVZWaaZIMPNXTFYUODXX… …ZCGBQLNTMXJUBQKUOZILP… …JFCGBQSJMHVQLLQKUXMMN… …VOCGBQGIHBAABBQKUQXYZ… Simplifica=on ¡of ¡protein ¡structures ¡using ¡HMM-‑SA ¡ Computa=on ¡of ¡over-‑represnta=on ¡of ¡4-‑SL ¡words ¡in ¡SCOP ¡superfamily ¡ Words ¡ Sf ¡52540 ¡ Sf ¡81301 ¡ ZILP ¡ OR ¡ OR ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡SPECIFIC ¡OF ¡2 ¡SUPERFAMILIES ¡ YUOD ¡ OR ¡ NS ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡SPECIFIC ¡OF ¡1 ¡SUPERFAMILY ¡ CGBQ ¡ NS ¡ OR ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡SPECIFIC ¡OF ¡1 ¡SUPERFAMILY ¡
SLIDE 13 Other ¡SA-‑Mot ¡motif ¡types ¡
- Words ¡specific ¡to ¡a ¡lot ¡of ¡superfamilies ¡ ¡
¡ ¡UBIQUITOUS ¡WORDS ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡important ¡for ¡protein ¡structure ¡
- Word ¡specific ¡to ¡one ¡ ¡superfamily ¡ ¡
¡CANDIDATE ¡FUNCTIONAL ¡WORDS ¡ ¡ ¡ ¡ ¡ ¡ ¡important ¡for ¡protein ¡func=on ¡
Ca2+-binding site
DODQ ¡
SAM/SAH-‑binding ¡site ¡
RUDO ¡
NAD(P)-‑binding ¡site ¡
EIJU ¡
ATP/GTP-‑binding ¡site ¡
YUOD ¡
Regad ¡et ¡al., ¡BMC ¡Bioinfo, ¡2011 ¡
SLIDE 14 SA-‑Mot ¡Input ¡
- Our ¡own ¡pdb ¡files ¡ ¡
- Pdb ¡code ¡(4 ¡characters) ¡
Regad ¡et ¡al., ¡NAR, ¡2011 ¡
SLIDE 15
SA-‑Mot ¡outputs ¡of ¡2rhmB ¡
Encoding ¡into ¡ HMM-‑SA ¡
SLIDE 16 SA-‑Mot ¡outputs ¡of ¡2rhmB ¡
Encoding ¡into ¡ HMM-‑SA ¡
SA-‑Mot ¡mo=f ¡ ¡database ¡
Word ¡ Occ ¡ OR_l ¡ score ¡ RMSd ¡ AA ¡ Score ¡ OR_sf ¡ score ¡ type ¡ HBBQ ¡ 854 ¡ 34 ¡ 0.61 ¡ 12 ¡ 34 ¡ Ubi ¡ PKCD ¡ 56 ¡ 0.4 ¡ 0.54 ¡ 2 ¡ 0.7 ¡ YUOD ¡ 183 ¡ 2.5 ¡ 0.55 ¡ 23 ¡ 120 ¡ Fct ¡
Extrac=on ¡of ¡SA-‑Mot ¡mo=fs ¡
SLIDE 17
SA-‑Mot ¡outputs ¡of ¡2rhmB ¡
SLIDE 18
SA-‑Mot ¡outputs ¡of ¡2rhmB ¡
SLIDE 19
SA-‑Mot ¡outputs ¡of ¡2rhmB ¡
SLIDE 20
SA-‑Mot ¡outputs ¡of ¡2rhmB ¡
SLIDE 21
SA-‑Mot ¡outputs ¡of ¡2rhmB ¡
SLIDE 22 Exemple: ¡search ¡of ¡important ¡regions ¡in ¡uncharacterized ¡protein ¡
- puta=ve ¡kinase ¡from ¡Chloroflexus ¡auran:acus ¡J-‑10-‑fl ¡(pdb ¡code ¡2rhm) ¡
SA-‑Mot ¡
SLIDE 23
Exemple: ¡search ¡of ¡important ¡regions ¡in ¡uncharacterized ¡protein ¡
Flexible ¡regions ¡
SLIDE 24
Exemple: ¡search ¡of ¡important ¡regions ¡in ¡uncharacterized ¡protein ¡
Candidate ¡ func=onal ¡sites ¡ Flexible ¡regions ¡ ATP-‑binding ¡site ¡
Over-‑represented ¡in ¡ATP-‑binding ¡protein ¡ Over-‑represented ¡YVTN ¡Repeat ¡like ¡ Over-‑represented ¡Trypsin ¡like ¡Serine ¡Protease ¡
SLIDE 25 Exemple: ¡search ¡of ¡important ¡regions ¡in ¡uncharacterized ¡protein ¡
- Iden=fica=on ¡of ¡structural ¡mo=fs ¡of ¡interest ¡
– For ¡protein ¡structure ¡ – For ¡protein ¡func=on ¡
- Puta=ve ¡func=onal ¡sites ¡
- ATP-‑binding ¡site ¡
¡ ¡in ¡agreement ¡with ¡kinase ¡ac=vity ¡ ¡ ¡no ¡found ¡with ¡other ¡predic=on ¡mo=f ¡server ¡
SLIDE 26 Exemple: ¡Analysis ¡of ¡binding ¡sites ¡of ¡topoisomerases ¡of ¡type ¡II ¡ ¡
DNA ¡gyrase ¡ complexed ¡with ¡ANP ¡ Topo ¡II ¡complexed ¡with ¡ANP ¡ Topo ¡VI ¡complexed ¡with ¡ ¡ADP ¡
- We ¡have ¡29 ¡structures ¡: ¡ ¡
– ≠ ¡families ¡: ¡gyrase, ¡Topo ¡VI, ¡Topo ¡IV, ¡Topo ¡II ¡ Search ¡of ¡mo=fs ¡of ¡interest ¡in ¡these ¡protein ¡structures ¡ Comparison ¡of ¡binding ¡sites ¡
SLIDE 27 Exemple: ¡Analysis ¡of ¡binding ¡sites ¡of ¡topoisomerases ¡of ¡type ¡II ¡ ¡
structural ¡mo@fs ¡ ¡Conserved ¡region ¡in ¡terms ¡of ¡
structure ¡and ¡sequence ¡ ATPase ¡domain ¡of ¡DNA ¡ topoisomerase ¡II ¡ NADP-‑binding ¡Rossman ¡fold ¡domain ¡ Immunoglobulin ¡
Rare ¡region ¡ ¡Linked ¡to ¡flexible ¡region ¡
- DNA ¡gyrase ¡of ¡E. ¡coli ¡(pdb ¡code ¡1eij) ¡
SLIDE 28 Exemple: ¡Analysis ¡of ¡binding ¡sites ¡of ¡topoisomerases ¡of ¡type ¡II ¡ ¡
- Structural ¡word ¡PSYR: ¡seen ¡in ¡20 ¡structures ¡ ¡
– Topo ¡II ¡do ¡not ¡contain ¡this ¡mo=f ¡
- Structural ¡word ¡ZQXU: ¡seen ¡in ¡4 ¡Gyrases ¡of ¡E. ¡coli ¡
- Structural ¡word ¡RNHB: ¡seen ¡only ¡in ¡1eij ¡protein ¡
SLIDE 29 Exemple: ¡Analysis ¡of ¡binding ¡sites ¡of ¡topoisomerases ¡of ¡type ¡II ¡ ¡
- Structural ¡word ¡PSYR: ¡seen ¡in ¡20 ¡structures ¡ ¡
– Topo ¡II ¡do ¡not ¡contain ¡this ¡mo=f ¡
- Structural ¡word ¡ZQXU: ¡seen ¡in ¡4 ¡Gyrases ¡of ¡E. ¡coli ¡
- Structural ¡word ¡RNHB: ¡seen ¡only ¡in ¡1eij ¡protein ¡
DNA ¡gyrase ¡complexed ¡with ¡ANP ¡ Topo ¡II ¡complexed ¡with ¡ ¡ADP ¡
Informa=on ¡about ¡the ¡SPECIFICITY ¡of ¡binding ¡
SLIDE 30 Conclusion ¡
SA ¡– ¡Mot: ¡web ¡server ¡
- ¡hUps://sa-‑mot.m=.univ-‑paris-‑diderot.fr ¡
- ¡Extrac=on ¡of ¡strutural ¡mo=fs ¡of ¡interest ¡from ¡protein ¡loops ¡without ¡
superimposi=on ¡of ¡protein ¡structures ¡
- ¡could ¡be ¡used ¡to ¡
- ¡analysis ¡of ¡loop ¡structures ¡
- ¡comparison ¡of ¡loop ¡structures ¡ ¡binding ¡site ¡
- Analysis ¡of ¡protein ¡deforma=on ¡
- ¡Perspec=ves: ¡
- ¡Search ¡of ¡degenerated ¡words ¡
- ¡Generalize ¡the ¡approach ¡to ¡regular ¡secondary ¡structures ¡
SLIDE 31 Acknowledgement ¡
- ¡AC ¡Camproux, ¡MTi, ¡Inserm ¡UMR-‑S973, ¡Univ ¡Paris ¡Diderot ¡
- ¡C. ¡Geneix, ¡MTi, ¡Inserm ¡UMR-‑S973, ¡Univ ¡Paris ¡Diderot ¡
- ¡A. ¡Saladin, ¡MTi, ¡Inserm ¡UMR-‑S973, ¡Univ ¡Paris ¡Diderot ¡
- ¡J. ¡Maupe=t, ¡MTi, ¡Inserm ¡UMR-‑S973, ¡Univ ¡Paris ¡Diderot ¡
- ¡J. ¡Mar=n, ¡IBCP, ¡CNRS, ¡UMR ¡5086, ¡ ¡Univ ¡Lyon ¡I ¡
- ¡G. ¡Nuel, ¡MAP5 ¡-‑ ¡UMR ¡CNRS ¡8145, ¡ ¡Univ ¡Paris ¡Descartes ¡
- ¡C. ¡Mayer, ¡Ins=tut ¡Pasteur, ¡ ¡Univ ¡Paris ¡Diderot ¡
Thank ¡you ¡for ¡your ¡aUen=on ¡!!!!!!!!! ¡