Complex Data Modeling for Simpler Data Access TDWG 2014, - - PowerPoint PPT Presentation
Complex Data Modeling for Simpler Data Access TDWG 2014, - - PowerPoint PPT Presentation
Complex Data Modeling for Simpler Data Access TDWG 2014, Jnkping, Sweden Ramona Walls Robert Guralnick A Canonical Example of OpportunisHc CollecHng
A ¡Canonical ¡Example ¡of ¡“OpportunisHc ¡CollecHng” ¡typical ¡in ¡biocollecHons ¡
plot sub-plot transect (within plot) individual (within plot) individual (within sub-plot)
transect depth * * * * * *sample collection point water sample at depth X aliquot * metagenome
DwC ¡
Bag ¡of ¡ terms ¡
hMp://vegbank.org/vegbank/general/faq.html#datamodel ¡ ¡
hMp://vegbank.org/vegbank/general/faq.html#datamodel ¡ ¡
? ?
Madin ¡et ¡al. ¡2007 ¡Ecol. ¡InformaHcs ¡doi: ¡10.1016/j.ecoinf.2007.05.004 ¡
OBO-‑E: ¡ O&M: ¡
Most ¡biology ¡requires ¡work ¡at ¡the ¡ intersecHon ¡of ¡disciplines ¡
MUSEUM ¡ ¡ COLLECTIONS ¡ ECOLOGY ¡ GENOMICS ¡
Material ¡enHHes, ¡informaHon ¡enHHes, ¡and ¡ processes ¡in ¡the ¡Basic ¡Formal ¡Ontology ¡
- bservaHons ¡versus ¡specimens ¡
Specimen ¡data ¡from ¡a ¡Darwin ¡Core ¡ Archive: ¡VertNet ¡
specimen ¡ collecHon ¡ ¡ process ¡ sampling ¡ ¡ process ¡ material ¡ ¡ sampling ¡ ¡ process ¡
sampling ¡process ¡logical ¡ definiBon: ¡ assay ¡and ¡(achieves_planned_ ¡
- bjecHve ¡some ¡‘biological ¡
feature ¡idenHficaHon ¡
- bjecHve’) ¡
¡ has_specified_input ¡some ¡ ‘sampling ¡feature’ ¡ has_specified_output ¡some ¡ ‘sample ¡data ¡item’ ¡ specimen ¡collecBon ¡process ¡ logical ¡definiBon: ¡ 'planned ¡process' ¡and ¡ (achieves_planned_objecHve ¡ some ¡'specimen ¡collecHon ¡
- bjecHve') ¡ ¡
¡ has_specified_input ¡some ¡ ‘material ¡enHty’ ¡ has_specified_output ¡some ¡ ‘specimen’ ¡ material ¡sampling ¡process ¡ logical ¡definiBon: ¡ 'planned ¡process' ¡and ¡ (achieves_planned_objecHve ¡ some ¡’material ¡sampling ¡
- bjecHve') ¡ ¡
¡ has_specified_input ¡some ¡ ‘material ¡sampling ¡feature’ ¡ has_specified_output ¡some ¡ ‘material ¡sample’ ¡
ROB ¡
BCO ¡Taxonomic ¡Inventory ¡Process ¡Class ¡and ¡Sub-‑classes ¡of ¡different ¡kinds ¡of ¡processes ¡
Conclusions ¡
- BCO ¡splits ¡the ¡middle ¡ground ¡between ¡the ¡
high ¡level ¡OBO-‑E ¡world ¡view ¡and ¡the ¡flat ¡way ¡
- f ¡represenHng ¡a ¡process ¡that ¡has ¡a ¡single ¡
- utput ¡to ¡allow ¡us ¡to ¡represent ¡all ¡kinds ¡of ¡
different ¡content. ¡
- BCO ¡can ¡serve ¡as ¡a ¡sandbox ¡to ¡test ¡out ¡new ¡
models ¡and ¡terms ¡for ¡describing ¡sampling ¡ processes ¡and ¡data, ¡to ¡inform ¡standards ¡like ¡
- DwC. ¡
Acknowledgments ¡
- Dozens ¡of ¡parHcipants ¡at ¡BCO ¡workshops ¡and ¡
hackathons ¡over ¡the ¡past ¡two ¡years ¡
- NSF-‑EAGER: ¡An ¡Interoperable ¡InformaHon ¡
Infrastructure ¡for ¡Biodiversity ¡Research ¡(I3BR) ¡
- NSF: ¡Research ¡CoordinaHon ¡Network ¡for ¡GSC ¡
(RCN4GSC) ¡
- VertNet ¡and ¡University ¡of ¡Kansas ¡Biodiversity ¡