1 ¡
Workflow ¡Support ¡for ¡Con/nuous ¡Data ¡Quality ¡ Control ¡in ¡a ¡FilteredPush ¡Network ¡
- J. ¡Hanken, ¡D. ¡Lowery, ¡B. ¡Ludäscher, ¡J. ¡Macklin, ¡T. ¡McPhillips ¡
- P. ¡Morris, ¡B. ¡Morris, ¡T. ¡Song ¡
Workflow Support for Con/nuous Data Quality Control in a - - PowerPoint PPT Presentation
Workflow Support for Con/nuous Data Quality Control in a FilteredPush Network J. Hanken, D. Lowery, B. Ludscher , J. Macklin, T. McPhillips P. Morris,
1 ¡
– Filtered-Push – Kurator
2 ¡
3 ¡
4 ¡
Dou, ¡Lei., ¡G. ¡Cao, ¡P.J. ¡Morris, ¡R.A. ¡Morris, ¡B. ¡Ludäscher, ¡J.A. ¡Macklin, ¡J. ¡Hanken. ¡2012. ¡Kurator: ¡A ¡Kepler ¡Package ¡for ¡ Data ¡Cura/on ¡Workflows, ¡Procedia ¡Computer ¡Science, ¡9:1614-‑1619, ¡doi:10.1016/j.procs.2012.04.177 ¡
5 ¡
hbp://xkcd.com/386/ ¡
Source: ¡Paul ¡J. ¡Morris ¡
6 ¡
7 ¡
Akka ¡cura(on ¡workflow ¡
spreadsheet ¡reports ¡ Symbiota ¡Instance ¡& ¡DB ¡ Symbiota ¡Instance ¡
Source: ¡Paul ¡J. ¡Morris ¡
Access ¡ Point ¡
Access ¡ Point ¡
Akka ¡ Kurator ¡ Workflows ¡
Source: ¡Paul ¡J. ¡Morris ¡
8 ¡
9 ¡
!
some ¡steps ¡of ¡a ¡larger ¡workflow ¡
10 ¡
– Checked ¡and ¡OK ¡
– Checked ¡and ¡fixed ¡
– Internally ¡inconsistent ¡ – cannot ¡fix ¡
– Not ¡enough ¡data: ¡
11 ¡
– sign ¡changed ¡coordinates ¡are ¡on ¡the ¡Earth's ¡surface ¡ ¡ ¡ – Coordinates ¡not ¡inside ¡country ¡ – transposed/sign ¡changed ¡coordinates ¡to ¡place ¡inside ¡country ¡ – Transposed/sign ¡changed ¡coordinates ¡are ¡near ¡georeference ¡
– Land ¡data ¡from ¡Natural ¡Earth ¡ – Country ¡boundary ¡data ¡from ¡GeoCommunity ¡ – GeoLocate ¡
12 ¡
– ContradicFng ¡dates ¡
– Lack ¡of ¡date ¡data ¡
13 ¡
14 ¡
– Nomenclature ¡ ¡
– Taxonomy ¡(current ¡names) ¡
15 ¡
– OK ¡on ¡human ¡cycles, ¡but ¡NOT ¡OK ¡on ¡machine ¡cycles ¡
– Parallelize ¡remote ¡service ¡invocaFon: ¡helps ¡ ¡ – Non-‑trivial ¡programming ¡ ¡
16 ¡
17 ¡
18 ¡
19 ¡
20 ¡
21 ¡
22 ¡
23 ¡