SA-Mot: a web server for the iden5fica5on of mo5fs of - - PowerPoint PPT Presentation

sa mot a web server for the iden5fica5on of mo5fs of
SMART_READER_LITE
LIVE PREVIEW

SA-Mot: a web server for the iden5fica5on of mo5fs of - - PowerPoint PPT Presentation

SA-Mot: a web server for the iden5fica5on of mo5fs of interest extracted from protein loops Leslie REGAD MTi, UMR-S973 Inserm, Univ Paris


slide-1
SLIDE 1

Leslie ¡REGAD ¡

MTi, ¡UMR-­‑S973 ¡Inserm, ¡Univ ¡Paris ¡Diderot ¡ ¡ ¡ JOBIM, ¡Rennes, ¡03 ¡juillet ¡2012 ¡

SA-­‑Mot: ¡a ¡web ¡server ¡for ¡the ¡iden5fica5on ¡of ¡ mo5fs ¡of ¡interest ¡extracted ¡from ¡protein ¡loops ¡ ¡

slide-2
SLIDE 2

Protein ¡loops: ¡

  • ¡link ¡between ¡regular ¡secondary ¡structures: ¡α-­‑helix ¡and ¡β-­‑strand ¡ ¡
  • ¡involved ¡in ¡the ¡ligand ¡specificity ¡and ¡protein ¡func=on ¡ ¡
  • ¡variable ¡regions ¡in ¡terms ¡of ¡structure ¡and ¡sequence ¡

Extrac=on ¡of ¡some ¡structural ¡mo=fs ¡from ¡SHORT ¡loops ¡

  • ¡previous ¡studies ¡of ¡SHORT ¡loops: ¡ ¡
  • ¡extrac=on ¡of ¡small ¡structural ¡mo=fs ¡from ¡short ¡

loops ¡(Hutchinson ¡et ¡al., ¡1994) ¡ ¡

  • ¡short ¡loop ¡classifica=on ¡(Wojick ¡et ¡al., ¡1999, ¡

Fernandez ¡et ¡al., ¡2004) ¡ ¡

slide-3
SLIDE 3

SA-­‑Mot ¡Web ¡server ¡protocole ¡

Protein ¡target: ¡Topo ¡II ¡ complexed ¡with ¡ANP ¡ Loop ¡informa:ons ¡ SA-­‑Mot ¡ SA-­‑Mot ¡mo=f ¡ ¡database ¡ hUps://sa-­‑mot.m=.univ-­‑paris-­‑diderot.fr ¡

  • ¡Analysis ¡of ¡all ¡loops ¡of ¡given ¡protein ¡
slide-4
SLIDE 4

SA-­‑Mot ¡motif ¡database ¡

  • Contains ¡important ¡loop ¡mo=fs ¡: ¡

– For ¡the ¡protein ¡structure ¡ – For ¡the ¡protein ¡func=on ¡

  • Extrac=on ¡mo=fs ¡from ¡loops: ¡

– Based ¡on ¡ ¡

  • Structural ¡alphabet ¡HMM-­‑SA ¡(Camproux ¡et ¡al., ¡2004) ¡
  • Structural ¡word ¡no=on ¡(Regad ¡et ¡al., ¡2010) ¡

– Without ¡superimposi=on ¡of ¡loop ¡structures ¡

slide-5
SLIDE 5
  • Use ¡HMM-­‑SA ¡(Hidden ¡Markov ¡Model ¡– ¡Structural ¡Alphabet) ¡

– Classifica=on ¡of ¡all ¡4-­‑residue ¡fragments ¡extracted ¡from ¡a ¡large ¡set ¡of ¡ protein ¡structures ¡

  • Based ¡on ¡the ¡geometry ¡of ¡4-­‑residue ¡fragments ¡
  • Used ¡hidden ¡Markov ¡model ¡
  • Camproux ¡et ¡al., ¡J ¡Mol ¡Biol, ¡2004 ¡

Presentation ¡of ¡HMM-­‑SA ¡

slide-6
SLIDE 6

Camproux ¡et ¡al., ¡J ¡mol ¡Biol, ¡2004 ¡

Simplification ¡of ¡a ¡protein ¡structure ¡using ¡HMM-­‑SA ¡

Development ¡of ¡the ¡STRUCTURAL ¡WORD ¡no=on ¡

slide-7
SLIDE 7

Extraction ¡of ¡structural ¡motif ¡HMM-­‑SA ¡

  • Extrac=on ¡of ¡7-­‑residue ¡structural ¡mo=fs ¡using ¡HMM-­‑SA ¡

– 4 ¡SL-­‑words ¡= ¡7-­‑residue ¡fragments ¡

Regad ¡et ¡al., ¡CSDA, ¡2008 ¡

1gpw_B ¡ Pos: ¡7-­‑13 ¡VDVKNGK ¡ 1sfi_A ¡ Pos: ¡28-­‑34 ¡AEYHNTQ ¡

slide-8
SLIDE 8
  • Recurrent ¡structural ¡words: ¡cluster ¡of ¡7-­‑AA ¡fragments ¡with ¡similar ¡geometry ¡

(RMSd ¡= ¡0.85 ¡Å) ¡

  • Extrac=on ¡of ¡structural ¡word ¡ ¡

 rapid ¡extrac=on ¡of ¡structural ¡mo=fs ¡from ¡protein ¡loops ¡without ¡ superimposi=on ¡of ¡protein ¡structures ¡ YUOD: ¡ ¡ 183 ¡7-­‑AA ¡fragments ¡ ¡ DRPI: ¡ ¡ 389 ¡7-­‑AA ¡fragments ¡ ¡ PZCD ¡: ¡ ¡ 983 ¡7-­‑AA ¡fragments ¡ ¡

Regad ¡et ¡al., ¡BMC ¡Bioinfo, ¡2010 ¡

Extraction ¡of ¡structural ¡motifs ¡using ¡HMM-­‑SA ¡

slide-9
SLIDE 9
  • 4,911 ¡protein ¡structures ¡

– Non ¡redundant ¡(< ¡50% ¡of ¡iden=ty ¡sequence) ¡ – High ¡resolu=on ¡(< ¡2.5 ¡Å) ¡ – Classified ¡in ¡SCOP ¡classifica=on ¡  90, ¡811 ¡loops ¡ ¡of ¡7 ¡to ¡35 ¡residues ¡  25,305 ¡≠ ¡structural ¡words ¡seen ¡between ¡1 ¡to ¡1234 ¡=mes ¡ = ¡238,158 ¡7-­‑residue ¡fragments ¡

Regad ¡et ¡al., ¡BMC ¡Bioinfo, ¡2010 ¡

SA-­‑Mot ¡database ¡

Word ¡ extrac=on ¡ Loop ¡ extrac=on ¡

slide-10
SLIDE 10
  • Occurrence: ¡ ¡

– Rare ¡words: ¡link ¡to ¡uncertain ¡region ¡ – Recurrent ¡words: ¡regular ¡structures ¡

  • Weak ¡RMSD ¡
  • Strong ¡AA-­‑score ¡
  • Over-­‑representated ¡in ¡loop ¡dataset: ¡non-­‑random ¡mo@fs ¡

 Regular ¡structures ¡with ¡conserved ¡structures ¡and ¡amino ¡acid ¡specifici@es ¡

DRPI: ¡389 ¡7-­‑AA ¡fragments ¡ ¡ PZCD: ¡983 ¡7-­‑AA ¡fragments ¡ ¡ Regad ¡et ¡al., ¡BMC ¡Bioinfo, ¡2010 ¡

2-­‑ ¡Different ¡type ¡of ¡SA-­‑Mot ¡motifs ¡

slide-11
SLIDE 11
  • Loops ¡ooen ¡involved ¡in ¡protein ¡func=on ¡
  • Over-­‑representa=on ¡of ¡word ¡in ¡each ¡SCOP ¡superfamilies ¡ ¡

¡ ¡ ¡Extrac=on ¡of ¡specific ¡words ¡for ¡protein ¡func=on ¡

Regad ¡et ¡al., ¡BMC ¡Bioinfo, ¡2011 ¡

Link ¡between ¡structural ¡words ¡and ¡binding ¡sites ¡

slide-12
SLIDE 12

3-­‑ ¡Quantification ¡of ¡the ¡specificity ¡of ¡a ¡motif ¡for ¡a ¡function ¡

Superfamily ¡: ¡ 52540 ¡ 1gky ¡ 1ex7 ¡ 1ex6 ¡ Superfamily: ¡ ¡ 81301 ¡ 1no5 ¡ 1wot ¡ 2i9g ¡ …KZaaaAZILPMMNDYUODNH… …CGBQAWZILPNNTRYUODNL… …SVZWaaZIMPNXTFYUODXX… …ZCGBQLNTMXJUBQKUOZILP… …JFCGBQSJMHVQLLQKUXMMN… …VOCGBQGIHBAABBQKUQXYZ… Simplifica=on ¡of ¡protein ¡structures ¡using ¡HMM-­‑SA ¡ Computa=on ¡of ¡over-­‑represnta=on ¡of ¡4-­‑SL ¡words ¡in ¡SCOP ¡superfamily ¡ Words ¡ Sf ¡52540 ¡ Sf ¡81301 ¡ ZILP ¡ OR ¡ OR ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡SPECIFIC ¡OF ¡2 ¡SUPERFAMILIES ¡ YUOD ¡ OR ¡ NS ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡SPECIFIC ¡OF ¡1 ¡SUPERFAMILY ¡ CGBQ ¡ NS ¡ OR ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡SPECIFIC ¡OF ¡1 ¡SUPERFAMILY ¡

slide-13
SLIDE 13

Other ¡SA-­‑Mot ¡motif ¡types ¡

  • Words ¡specific ¡to ¡a ¡lot ¡of ¡superfamilies ¡ ¡

¡ ¡UBIQUITOUS ¡WORDS ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡important ¡for ¡protein ¡structure ¡

  • Word ¡specific ¡to ¡one ¡ ¡superfamily ¡ ¡

¡CANDIDATE ¡FUNCTIONAL ¡WORDS ¡ ¡ ¡ ¡ ¡ ¡ ¡important ¡for ¡protein ¡func=on ¡

Ca2+-binding site

DODQ ¡

SAM/SAH-­‑binding ¡site ¡

RUDO ¡

NAD(P)-­‑binding ¡site ¡

EIJU ¡

ATP/GTP-­‑binding ¡site ¡

YUOD ¡

Regad ¡et ¡al., ¡BMC ¡Bioinfo, ¡2011 ¡

slide-14
SLIDE 14

SA-­‑Mot ¡Input ¡

  • Our ¡own ¡pdb ¡files ¡ ¡
  • Pdb ¡code ¡(4 ¡characters) ¡

Regad ¡et ¡al., ¡NAR, ¡2011 ¡

slide-15
SLIDE 15

SA-­‑Mot ¡outputs ¡of ¡2rhmB ¡

Encoding ¡into ¡ HMM-­‑SA ¡

slide-16
SLIDE 16

SA-­‑Mot ¡outputs ¡of ¡2rhmB ¡

Encoding ¡into ¡ HMM-­‑SA ¡

SA-­‑Mot ¡mo=f ¡ ¡database ¡

Word ¡ Occ ¡ OR_l ¡ score ¡ RMSd ¡ AA ¡ Score ¡ OR_sf ¡ score ¡ type ¡ HBBQ ¡ 854 ¡ 34 ¡ 0.61 ¡ 12 ¡ 34 ¡ Ubi ¡ PKCD ¡ 56 ¡ 0.4 ¡ 0.54 ¡ 2 ¡ 0.7 ¡ YUOD ¡ 183 ¡ 2.5 ¡ 0.55 ¡ 23 ¡ 120 ¡ Fct ¡

Extrac=on ¡of ¡SA-­‑Mot ¡mo=fs ¡

slide-17
SLIDE 17

SA-­‑Mot ¡outputs ¡of ¡2rhmB ¡

slide-18
SLIDE 18

SA-­‑Mot ¡outputs ¡of ¡2rhmB ¡

slide-19
SLIDE 19

SA-­‑Mot ¡outputs ¡of ¡2rhmB ¡

slide-20
SLIDE 20

SA-­‑Mot ¡outputs ¡of ¡2rhmB ¡

slide-21
SLIDE 21

SA-­‑Mot ¡outputs ¡of ¡2rhmB ¡

slide-22
SLIDE 22

Exemple: ¡search ¡of ¡important ¡regions ¡in ¡uncharacterized ¡protein ¡

  • puta=ve ¡kinase ¡from ¡Chloroflexus ¡auran:acus ¡J-­‑10-­‑fl ¡(pdb ¡code ¡2rhm) ¡

SA-­‑Mot ¡

slide-23
SLIDE 23

Exemple: ¡search ¡of ¡important ¡regions ¡in ¡uncharacterized ¡protein ¡

Flexible ¡regions ¡

slide-24
SLIDE 24

Exemple: ¡search ¡of ¡important ¡regions ¡in ¡uncharacterized ¡protein ¡

Candidate ¡ func=onal ¡sites ¡ Flexible ¡regions ¡ ATP-­‑binding ¡site ¡

Over-­‑represented ¡in ¡ATP-­‑binding ¡protein ¡ Over-­‑represented ¡YVTN ¡Repeat ¡like ¡ Over-­‑represented ¡Trypsin ¡like ¡Serine ¡Protease ¡

slide-25
SLIDE 25

Exemple: ¡search ¡of ¡important ¡regions ¡in ¡uncharacterized ¡protein ¡

  • Iden=fica=on ¡of ¡structural ¡mo=fs ¡of ¡interest ¡

– For ¡protein ¡structure ¡ – For ¡protein ¡func=on ¡

  • Puta=ve ¡func=onal ¡sites ¡
  • ATP-­‑binding ¡site ¡

¡ ¡in ¡agreement ¡with ¡kinase ¡ac=vity ¡ ¡ ¡no ¡found ¡with ¡other ¡predic=on ¡mo=f ¡server ¡

slide-26
SLIDE 26

Exemple: ¡Analysis ¡of ¡binding ¡sites ¡of ¡topoisomerases ¡of ¡type ¡II ¡ ¡

DNA ¡gyrase ¡ complexed ¡with ¡ANP ¡ Topo ¡II ¡complexed ¡with ¡ANP ¡ Topo ¡VI ¡complexed ¡with ¡ ¡ADP ¡

  • We ¡have ¡29 ¡structures ¡: ¡ ¡

– ≠ ¡families ¡: ¡gyrase, ¡Topo ¡VI, ¡Topo ¡IV, ¡Topo ¡II ¡  Search ¡of ¡mo=fs ¡of ¡interest ¡in ¡these ¡protein ¡structures ¡  Comparison ¡of ¡binding ¡sites ¡

slide-27
SLIDE 27

Exemple: ¡Analysis ¡of ¡binding ¡sites ¡of ¡topoisomerases ¡of ¡type ¡II ¡ ¡

structural ¡mo@fs ¡  ¡Conserved ¡region ¡in ¡terms ¡of ¡

structure ¡and ¡sequence ¡ ATPase ¡domain ¡of ¡DNA ¡ topoisomerase ¡II ¡ NADP-­‑binding ¡Rossman ¡fold ¡domain ¡ Immunoglobulin ¡

Rare ¡region ¡  ¡Linked ¡to ¡flexible ¡region ¡

  • DNA ¡gyrase ¡of ¡E. ¡coli ¡(pdb ¡code ¡1eij) ¡
slide-28
SLIDE 28

Exemple: ¡Analysis ¡of ¡binding ¡sites ¡of ¡topoisomerases ¡of ¡type ¡II ¡ ¡

  • Structural ¡word ¡PSYR: ¡seen ¡in ¡20 ¡structures ¡ ¡

– Topo ¡II ¡do ¡not ¡contain ¡this ¡mo=f ¡

  • Structural ¡word ¡ZQXU: ¡seen ¡in ¡4 ¡Gyrases ¡of ¡E. ¡coli ¡
  • Structural ¡word ¡RNHB: ¡seen ¡only ¡in ¡1eij ¡protein ¡
slide-29
SLIDE 29

Exemple: ¡Analysis ¡of ¡binding ¡sites ¡of ¡topoisomerases ¡of ¡type ¡II ¡ ¡

  • Structural ¡word ¡PSYR: ¡seen ¡in ¡20 ¡structures ¡ ¡

– Topo ¡II ¡do ¡not ¡contain ¡this ¡mo=f ¡

  • Structural ¡word ¡ZQXU: ¡seen ¡in ¡4 ¡Gyrases ¡of ¡E. ¡coli ¡
  • Structural ¡word ¡RNHB: ¡seen ¡only ¡in ¡1eij ¡protein ¡

DNA ¡gyrase ¡complexed ¡with ¡ANP ¡ Topo ¡II ¡complexed ¡with ¡ ¡ADP ¡

Informa=on ¡about ¡the ¡SPECIFICITY ¡of ¡binding ¡

slide-30
SLIDE 30

Conclusion ¡

SA ¡– ¡Mot: ¡web ¡server ¡

  • ¡hUps://sa-­‑mot.m=.univ-­‑paris-­‑diderot.fr ¡
  • ¡Extrac=on ¡of ¡strutural ¡mo=fs ¡of ¡interest ¡from ¡protein ¡loops ¡without ¡

superimposi=on ¡of ¡protein ¡structures ¡

  • ¡could ¡be ¡used ¡to ¡
  • ¡analysis ¡of ¡loop ¡structures ¡
  • ¡comparison ¡of ¡loop ¡structures ¡ ¡binding ¡site ¡
  • Analysis ¡of ¡protein ¡deforma=on ¡
  • ¡Perspec=ves: ¡
  • ¡Search ¡of ¡degenerated ¡words ¡
  • ¡Generalize ¡the ¡approach ¡to ¡regular ¡secondary ¡structures ¡
slide-31
SLIDE 31

Acknowledgement ¡

  • ¡AC ¡Camproux, ¡MTi, ¡Inserm ¡UMR-­‑S973, ¡Univ ¡Paris ¡Diderot ¡
  • ¡C. ¡Geneix, ¡MTi, ¡Inserm ¡UMR-­‑S973, ¡Univ ¡Paris ¡Diderot ¡
  • ¡A. ¡Saladin, ¡MTi, ¡Inserm ¡UMR-­‑S973, ¡Univ ¡Paris ¡Diderot ¡
  • ¡J. ¡Maupe=t, ¡MTi, ¡Inserm ¡UMR-­‑S973, ¡Univ ¡Paris ¡Diderot ¡
  • ¡J. ¡Mar=n, ¡IBCP, ¡CNRS, ¡UMR ¡5086, ¡ ¡Univ ¡Lyon ¡I ¡
  • ¡G. ¡Nuel, ¡MAP5 ¡-­‑ ¡UMR ¡CNRS ¡8145, ¡ ¡Univ ¡Paris ¡Descartes ¡
  • ¡C. ¡Mayer, ¡Ins=tut ¡Pasteur, ¡ ¡Univ ¡Paris ¡Diderot ¡

Thank ¡you ¡for ¡your ¡aUen=on ¡!!!!!!!!! ¡