from the desktop to the grid
play

From the Desktop to the Grid: Conversion of KNIME Workflows - PowerPoint PPT Presentation

From the Desktop to the Grid: Conversion of KNIME Workflows to gUSE Luis de la Garza, Jens Krger, Charlo6a Schrfe, Marc R>g, Stephan Aiche,


  1. From ¡the ¡Desktop ¡to ¡the ¡Grid: ¡ Conversion ¡of ¡KNIME ¡Workflows ¡to ¡gUSE ¡ Luis ¡de ¡la ¡Garza, ¡Jens ¡Krüger, ¡Charlo6a ¡Schärfe, ¡Marc ¡Rö>g, ¡ Stephan ¡Aiche, ¡Knut ¡Reinert, ¡Oliver ¡Kohlbacher ¡ Department of Applied Bioinformatics University of Tübingen

  2. What ¡are ¡we ¡researching? ¡ Hi there, pretty lady Luis ¡de ¡la ¡Garza ¡ 2

  3. Why ¡is ¡Docking ¡important? ¡ Oliver Kohlbacher, Drug Design I, 2010 Luis ¡de ¡la ¡Garza ¡ 3

  4. A ¡Docking ¡Recipe ¡ Luis ¡de ¡la ¡Garza ¡ 4

  5. EvaluaHon ¡OrientaHons ¡ y ¡ z ¡ x ¡ Luis ¡de ¡la ¡Garza ¡ 5

  6. It’s ¡begging ¡to ¡be ¡a ¡Workflow ¡ find the binding fill missing pocket hydrogen atoms generate N generate N generate N possible make sure ligand is possible possible orientation in 3D orientation orientations evaluate evaluate evaluate collect results Luis ¡de ¡la ¡Garza ¡ 6

  7. Why ¡do ¡we ¡use ¡Workflows? ¡ • Docking ¡can ¡be ¡broken ¡down ¡as ¡a ¡series ¡of ¡small ¡ tasks; ¡some ¡of ¡them ¡can ¡be ¡executed ¡in ¡parallel ¡ • We ¡need ¡access ¡to ¡resources ¡offering ¡High ¡ Performance ¡CompuOng ¡(HPC) ¡ • We ¡want ¡to ¡store ¡intermediate ¡results ¡for ¡further ¡ analysis ¡( i.e. , ¡binding ¡pocket ¡computaOon) ¡ • We ¡need ¡flexibility ¡– ¡we ¡would ¡like ¡to ¡test ¡different ¡ docking ¡algorithms ¡without ¡making ¡lots ¡of ¡changes ¡ Luis ¡de ¡la ¡Garza ¡ 7

  8. Workflows ¡everywhere ¡ • Workflows ¡have ¡applicaOons ¡in ¡other ¡areas ¡of ¡ bioinformaOcs ¡and ¡in ¡other ¡fields, ¡such ¡as: ¡ • Data ¡mining ¡ • Business ¡process ¡automaOon ¡ • Customer ¡relaOonship ¡management ¡ • Business ¡intelligence ¡ • If ¡you ¡can ¡split ¡a ¡process ¡in ¡small ¡automated ¡ tasks, ¡then ¡it ¡can ¡be ¡put ¡into ¡a ¡workflow ¡ Luis ¡de ¡la ¡Garza ¡ 8

  9. Workflow ¡Managers ¡ • Several ¡needs ¡have ¡produced ¡different ¡workflow ¡ managers ¡ Taverna ¡ Konstanz ¡InformaHon ¡Miner ¡ Luis ¡de ¡la ¡Garza ¡ 9

  10. KNIME ¡Desktop ¡ Luis ¡de ¡la ¡Garza ¡ 10

  11. A ¡more ¡elaborated ¡Workflow ¡ Workflow created during training at the KNIME User Meeting 2013, Zurich Luis ¡de ¡la ¡Garza ¡ 11

  12. KNIME ¡Desktop ¡ • Create ¡and ¡execute ¡workflows ¡on ¡your ¡desktop ¡ computer; ¡free, ¡as ¡in ¡“ free ¡beer” , ¡open ¡source, ¡ available ¡under ¡the ¡GPL ¡license ¡ ¡ • Easy-­‑to-­‑use ¡interface ¡(if ¡you ¡know ¡how ¡to ¡ click , ¡ you ¡know ¡how ¡to ¡KNIME) ¡ • Already ¡one ¡of ¡the ¡most ¡commonly ¡used ¡ workflow ¡management ¡systems ¡in ¡the ¡field ¡of ¡ ¡ ¡ ¡ ¡ e-­‑Science ¡systems ¡ Luis ¡de ¡la ¡Garza ¡ 12

  13. KNIME ¡Desktop ¡ • Lots ¡of ¡KNIME ¡ Community ¡Nodes ¡ available ¡( e.g. ¡R, ¡NGS, ¡ Schrödinger, ¡etc.) ¡ • Users ¡can ¡easily ¡extend ¡ KNIME ¡by ¡creaOng ¡new ¡ nodes ¡(Java ¡API) ¡and ¡ extensions ¡(based ¡on ¡ Eclipse) ¡ ¡ Luis ¡de ¡la ¡Garza ¡ 13

  14. KNIME ¡Cluster ¡ExecuHon ¡ • Offers ¡the ¡capability ¡to ¡run ¡ KNIME ¡Workflows ¡on ¡a ¡ cluster ¡ ¡ ¡ • Works ¡together ¡with ¡ KNIME ¡Server ¡and ¡KNIME ¡ Desktop ¡to ¡offer ¡all ¡ features ¡ • Not ¡free, ¡as ¡in ¡“ VISA ¡or ¡ MasterCard?” ¡ • Needs ¡to ¡be ¡installed ¡as ¡a ¡ cluster ¡resource ¡ Luis ¡de ¡la ¡Garza ¡ 14

  15. Choices, ¡choices... ¡ • We ¡want ¡to ¡use ¡KNIME ¡ as ¡a ¡workflow ¡editor ¡ ¡ • We ¡want ¡access ¡to ¡ compuOng ¡resources ¡ • We ¡want ¡gUSE ¡to ¡ execute ¡our ¡workflows ¡ Luis ¡de ¡la ¡Garza ¡ 15

  16. KNIME ¡-­‑ ¡External ¡Tool ¡IntegraHon ¡ • Wouldn’t ¡it ¡be ¡great ¡if ¡arbitrary ¡external ¡ command ¡line ¡tools ¡could ¡be ¡integrated ¡into ¡ KNIME? ¡ Luis ¡de ¡la ¡Garza ¡ 16

  17. KNIME ¡-­‑ ¡External ¡Tool ¡IntegraHon ¡ • KNIME ¡is ¡based ¡on ¡data ¡tables, ¡while ¡most ¡ command ¡line ¡tools ¡are ¡based ¡on ¡files ¡ • It ¡would ¡be ¡possible, ¡yet ¡Ome ¡consuming ¡and ¡ error ¡prone, ¡to ¡manually ¡generate ¡a ¡KNIME ¡node ¡ for ¡each ¡tool ¡to ¡be ¡integrated ¡ Luis ¡de ¡la ¡Garza ¡ 17

  18. Tool ¡IntegraHon ¡ • We ¡have ¡developed ¡ Tool Suite Y Tool Suite X several ¡tool ¡suites, ¡ each ¡containing ¡several ¡ tools ¡ • Each ¡tool ¡should ¡be ¡ Workflow usable ¡as ¡a ¡single ¡job ¡in ¡ a ¡workflow ¡ Luis ¡de ¡la ¡Garza ¡ 18

  19. Tool ¡IntegraHon ¡– ¡our ¡Approach ¡ • Give ¡every ¡tool ¡a ¡self-­‑describing ¡output ¡format: ¡ semanOc ¡annotaOon ¡of ¡inputs, ¡outputs ¡and ¡ parameters ¡ • Common ¡Tool ¡DescripOon ¡(CTD) ¡was ¡iniOally ¡ developed ¡by ¡the ¡Open-­‑Source ¡Framework ¡for ¡ Mass ¡Spectrometry ¡(OpenMS) ¡team ¡ Luis ¡de ¡la ¡Garza ¡ 19

  20. Common ¡Tool ¡DescripHon ¡ • Each ¡tool ¡can ¡“tell” ¡its ¡requirements ¡and ¡opOons, ¡ thus ¡allowing ¡easy ¡integraOon ¡and ¡a ¡more ¡robust ¡ approach ¡than ¡“classical” ¡tool ¡stubs ¡( e.g. , ¡ scripOng) ¡ ¡ • XML ¡Documents ¡– ¡easy ¡to ¡understand, ¡parse ¡and ¡ generate ¡ Luis ¡de ¡la ¡Garza ¡ 20

  21. Common ¡Tool ¡DescripHon ¡ <!-- pdbcutter_execution.xml --> � <tool status="internal"> � <name> PDBCutter </name> � <PARAMETERS version="1.3"> � <NODE> � <ITEM name=" i " tags=" input file " value=" input.pdb "/> � <ITEM name=" rec " tags=" output file " value=" receptor.pdb "/> � <ITEM name=" lig " tags=" output file " value=" ligand.pdb "/> � <ITEM name=" lig_chain " tags=" required " value=" A "/> � <ITEM name=" lig_name " tags=" required " value=" GNT "/> � </NODE> � </PARAMETERS> � </tool> � � # using PDBCutter with a CTD as input � $ PDBCutter –par pdbcutter_execution.xml � � # classic invocation � $ PDBCutter –i input.pdb –rec receptor.pdb –lig ligand.pdb � –lig_name GNT –lig_chain A � � Luis ¡de ¡la ¡Garza ¡ 21

  22. Generic ¡KNIME ¡Nodes ¡ • Leaning ¡on ¡CTDs, ¡external ¡ tools ¡can ¡be ¡integrated ¡ into ¡KNIME ¡ • Generic ¡KNIME ¡Nodes ¡ (GKN) ¡are ¡100% ¡ compaOble ¡with ¡other ¡ KNIME ¡nodes ¡ just ¡like ¡Lance ¡Armstrong ¡ • Any ¡tool ¡described ¡by ¡a ¡ CTD ¡can ¡be ¡used ¡in ¡KNIME ¡ Luis ¡de ¡la ¡Garza ¡ 22

  23. Generic ¡KNIME ¡Nodes ¡ • Remember ¡that ¡KNIME ¡ relies ¡on ¡data ¡tables ¡ and ¡most ¡command ¡ line ¡tools ¡rely ¡on ¡files? ¡ ¡ ¡ ¡ GKN ¡bridges ¡this ¡gap ¡ Luis ¡de ¡la ¡Garza ¡ 23

  24. Generic ¡KNIME ¡Nodes ¡ � ¡ � plugin ¡generator ¡ new_nodes.jar � install ¡as ¡KNIME ¡ plugin ¡ Luis ¡de ¡la ¡Garza ¡ 24

  25. Generic ¡KNIME ¡Nodes ¡ Computer ¡Aided ¡Drug ¡Design ¡ Suite ¡(CADDSuite) ¡ The European Molecular Biology Open Software Suite (EMBOSS) ¡ CADDSuite ¡and ¡EMBOSS ¡running ¡as ¡ extensions ¡in ¡KNIME ¡ ¡ Luis ¡de ¡la ¡Garza ¡ 25

  26. RoseVa ¡Stone ¡sHll ¡missing ¡ gUSE Workflow KNIME Workflow http://liology.files.wordpress.com/2010/01/rosetta-stone.jpeg Luis ¡de ¡la ¡Garza ¡ 26

  27. Workflow ¡Interoperability ¡ • In ¡general, ¡workflows ¡are ¡not ¡compaOble ¡across ¡ different ¡workflow ¡managers ¡ • It ¡is ¡not ¡trivial ¡to ¡convert ¡workflows ¡between ¡ workflow ¡managers ¡ ¡ Luis ¡de ¡la ¡Garza ¡ 27

Download Presentation
Download Policy: The content available on the website is offered to you 'AS IS' for your personal information and use only. It cannot be commercialized, licensed, or distributed on other websites without prior consent from the author. To download a presentation, simply click this link. If you encounter any difficulties during the download process, it's possible that the publisher has removed the file from their server.

Recommend


More recommend