data curation refine and shine
play

Data Curation: Refine and Shine Presented by: Michael - PDF document

W3 Data 2019-05-01 11:30 Data Curation: Refine and Shine Presented by: Michael Hobbs Dell EMC


  1. ¡ ¡ ¡ ¡ ¡ W3 ¡ Data ¡ 2019-­‑05-­‑01 ¡11:30 ¡ ¡ ¡ ¡ ¡ ¡ ¡ Data ¡Curation: ¡Refine ¡and ¡Shine ¡ ¡ Presented ¡by: ¡ ¡ ¡ Michael ¡Hobbs ¡ Dell ¡EMC ¡ ‘ ¡ ¡ ¡ Brought ¡to ¡you ¡by: ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ 888 -­‑-­‑-­‑ 268 -­‑-­‑-­‑ 8770 ¡ ·√·√ ¡904 -­‑-­‑-­‑ 278 -­‑-­‑-­‑ 0524 ¡-­‑ ¡info@techwell.com ¡-­‑ ¡ http://www.stareast.techwell.com ¡ ¡ ¡ ¡ ¡

  2. Michael ¡Hobbs ¡ ¡ Michael ¡Hobbs ¡is ¡a ¡15-­‑year ¡computer ¡industry ¡veteran ¡who ¡has ¡had ¡the ¡opportunity ¡to ¡ work ¡on ¡all ¡facets ¡of ¡the ¡computer. ¡From ¡CPU ¡Validation ¡to ¡Enterprise ¡Server ¡Test, ¡ Michael ¡has ¡spent ¡years ¡gathering ¡best ¡practices ¡from ¡various ¡cultures ¡and ¡companies. ¡ Through ¡this ¡diverse ¡background, ¡a ¡unique ¡perspective ¡has ¡been ¡developed. ¡Now ¡as ¡a ¡ Dell ¡EMC ¡Senior ¡Principal ¡Test ¡Engineer, ¡he ¡helps ¡define ¡and ¡implement ¡new ¡test ¡ technologies ¡including ¡analytics ¡and ¡machine ¡learning ¡to ¡allow ¡test ¡engineers ¡to ¡test. ¡

  3. 4/23/19 ¡ Data ¡Cura.on: ¡Refine ¡and ¡Shine ¡ 4/23/19 ¡ StarEast ¡2019 ¡ 1 ¡ Data ¡Cura.on: ¡Refine ¡& ¡Shine ¡ May ¡2018 ¡ Michael ¡Hobbs, ¡Sr. ¡Principal ¡Test ¡Eng. ¡ Michael_Hobbs@dell.com ¡ 1 ¡

  4. 4/23/19 ¡ Agenda ¡ • Collec.ng ¡Data ¡for ¡Business ¡Needs ¡ • Maintaining ¡Data ¡for ¡Reuse ¡and ¡Applicability ¡ • Data ¡Reten.on ¡based ¡on ¡Policy ¡ 4/23/19 ¡ StarEast ¡2019 ¡ 3 ¡ Data ¡Cura.on ¡Defined ¡ The ¡polices ¡and ¡processes ¡within ¡an ¡organiza3on, ¡for ¡controlled ¡data ¡ storage, ¡maintenance, ¡and ¡removal. ¡ ¡ 4/23/19 ¡ StarEast ¡2019 ¡ 4 ¡ 2 ¡

  5. 4/23/19 ¡ 4/23/19 ¡ StarEast ¡2019 ¡ 5 ¡ Data ¡ROI ¡ Business ¡ Case ¡ ¡ ¡ ¡ Data ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ Pain ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ Analy.cal ¡ ¡ ¡ ¡ ¡Points ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡Goals ¡ 4/23/19 ¡ StarEast ¡2019 ¡ 6 ¡ 3 ¡

  6. 4/23/19 ¡ Data ¡Mixture ¡ Logs, ¡Sensors, ¡ Proprietary ¡ ¡ Preferences, ¡Habits, ¡ Customer ¡ Test ¡Results ¡ Issues ¡ Reviews, ¡Videos, ¡ Sales, ¡Finance, ¡ Internet ¡ Weather ¡ Leads ¡ Business ¡ 4/23/19 ¡ StarEast ¡2019 ¡ 7 ¡ Dell ¡Example ¡: ¡Test ¡Planning ¡Model ¡“Jarvis” ¡ Defect ¡History ¡ Policies ¡ Automa.on ¡ DB: ¡Jira ¡ candidates ¡ Business ¡ Rules ¡ High ¡Priority ¡ Sta.s.cal ¡ Test ¡Cases ¡ Model ¡ Test ¡Failure ¡ History ¡ DB: ¡Qmetry ¡ 4/23/19 ¡ StarEast ¡2019 ¡ 8 ¡ 4 ¡

  7. 4/23/19 ¡ 5 ¡V’s ¡ Variety ¡ 1 ¡ 5 ¡ Valu 4 ¡ Veracity ¡ 2 ¡ Velocity ¡ e ¡ 3 ¡ Volume ¡ 4/23/19 ¡ StarEast ¡2019 ¡ 9 ¡ Data ¡Value ¡ 4 ¡ ¡VARIETY ¡ VERACITY ¡ 3 ¡ Internal ¡ Database=4 ¡ Partners ¡ Internal=4 ¡ Table ¡ Unstructured=1 ¡ 2 ¡ Websites ¡ Logs, ¡Audio ¡ Internet=1 ¡ 1 ¡ Internet ¡ Unstruct ¡ Total=12 ¡ ¡ h Total=1 KB ¡ c t a B 0 ¡ MB ¡ GB ¡ TB ¡ VOLUME ¡ VELOCITY ¡ Periodic=2 ¡ MB=2 ¡ Real ¡Time=4 ¡ TB=4 ¡ 4/23/19 ¡ StarEast ¡2019 ¡ 10 ¡ 5 ¡

  8. 4/23/19 ¡ Data ¡Feasibility ¡: ¡Dell ¡“Jarvis” ¡ ¡ Precision ¡Test ¡ Volume ¡ Velocity ¡ Variety ¡ Veracity ¡ Value ¡ Test ¡Failure ¡ 2 ¡ 2 ¡ 4 ¡ 4 ¡ 12 ¡ History ¡ Defect ¡History ¡ 1 ¡ 1 ¡ 3 ¡ 3 ¡ 8 ¡ 4/23/19 ¡ StarEast ¡2019 ¡ 11 ¡ Data ¡Collec.on ¡Methods ¡ Manual ¡Input Manual ¡Run ¡Scripts Processing ¡ Autonomous ¡Scripts Volume ¡ Intelligent ¡ ¡Scripts Direct ¡Input 4/23/19 ¡ StarEast ¡2019 ¡ 12 ¡ 6 ¡

  9. 4/23/19 ¡ Dell ¡Example ¡: ¡SUT ¡Configura.on ¡Model ¡“Q” ¡ Data ¡Warehouse ¡ Op.mal ¡Config ¡ Slot ¡Matrix ¡ Policies ¡ DB: ¡Excel ¡ Coverage ¡ Thermal ¡Matrix ¡ ¡ DB: ¡Power ¡Point ¡ ¡ Business ¡ Rules ¡ ¡ Commodity ¡List ¡ Best ¡Available ¡ DB: ¡Excel ¡ ¡ Sta.s.cal ¡ Configura.ons ¡ Model ¡ Storage ¡Matrix ¡ DB: ¡Excel ¡ ¡ 4/23/19 ¡ StarEast ¡2019 ¡ 13 ¡ 4/23/19 ¡ StarEast ¡2019 ¡ 14 ¡ 7 ¡

  10. 4/23/19 ¡ 1 Data Lake, Data Warehouse, Data Mart What does your business case require? ¡ Data Control 2 Is anyone allowed to search the data? Can a user copy data at will? ¡ Data Compatibility 3 Normalize the data? Audit data? ¡ 4/23/19 ¡ StarEast ¡2019 ¡ 15 ¡ Data ¡Lake ¡– ¡Data ¡Warehouse ¡– ¡Data ¡Mart ¡ hhps://www.holis.cs.io/blog/data-­‑lake-­‑vs-­‑data-­‑warehouse-­‑vs-­‑data-­‑mart/ ¡ 4/23/19 ¡ StarEast ¡2019 ¡ 16 ¡ 8 ¡

  11. 4/23/19 ¡ Database ¡Growth ¡ Social ¡ Sales ¡ Development ¡ Marke.ng ¡ Media ¡ Data ¡Lake ¡ Data ¡ Data ¡Mart ¡ Data ¡Mart ¡ Warehouse ¡ 4/23/19 ¡ StarEast ¡2019 ¡ 17 ¡ Making ¡Data ¡Accurate ¡ User ¡Input ¡for ¡Data ¡is ¡Inaccurate. ¡ How ¡do ¡you ¡input ¡Windows ¡2016 ¡ Personal ¡Data ¡Category ¡ Inaccuracy ¡ Win2016 ¡ Windows2016 ¡ *Deloihe ¡Insights ¡ W16 ¡ win16 ¡ 4/23/19 ¡ StarEast ¡2019 ¡ 18 ¡ 9 ¡

  12. 4/23/19 ¡ Data ¡Maintenance ¡ Internal ¡ Processes ¡ Third ¡Party ¡ Audit ¡Data ¡ Standards ¡ 4/23/19 ¡ StarEast ¡2019 ¡ 19 ¡ Data ¡Cura.on ¡for ¡“Jarvis” ¡ ¡ Field ¡ Input ¡ RecommendaJon ¡ Benefits ¡ Planned ¡Config ¡ID ¡ Direct ¡Input ¡ New ¡Field ¡ Tracks ¡HW ¡SW ¡ ¡ Actual ¡Config ¡ID ¡ Direct ¡Input ¡ New ¡Field ¡ Tracks ¡HW ¡SW ¡ ¡ Build ¡Fixed ¡ Free ¡Text ¡ Audit ¡ ¡ Know ¡when ¡defect ¡is ¡fixed ¡ for ¡regression ¡ Build ¡Found ¡ Free ¡Text ¡ Audit ¡ Know ¡what ¡build ¡defect ¡ was ¡found ¡ Discovery ¡ Drop ¡Down ¡ Audit ¡ Know ¡how ¡defect ¡was ¡ found ¡ Test ¡Case ¡Number ¡ Direct ¡Input ¡ No ¡change ¡ Links ¡TC ¡to ¡defect ¡ 4/23/19 ¡ StarEast ¡2019 ¡ 20 ¡ 10 ¡

  13. 4/23/19 ¡ 4/23/19 ¡ StarEast ¡2019 ¡ 21 ¡ Data ¡Reten.on ¡ Change ¡in ¡data ¡ROI. ¡ Business ¡no ¡longer ¡needs ¡the ¡data ¡ Data ¡Storage ¡is ¡cheap ¡but ¡not ¡free ¡ 4/23/19 ¡ StarEast ¡2019 ¡ 22 ¡ 11 ¡

  14. 4/23/19 ¡ Op.ons ¡ Delete ¡vs. ¡Archive ¡ Delete ¡vs ¡Archive ¡ 4/23/19 ¡ StarEast ¡2019 ¡ 23 ¡ Data ¡Movement ¡ Primary ¡ Secondary ¡ Archive ¡ Dele.on ¡ 4/23/19 ¡ StarEast ¡2019 ¡ 24 ¡ 12 ¡

  15. 4/23/19 ¡ Organiza.on ¡Data ¡ 4/23/19 ¡ StarEast ¡2019 ¡ 25 ¡ Summary ¡ ¡ ¡ ¡ CollecJng ¡ ¡ Data ¡ Data 01 ¡ 03 ¡ Rentention ¡ DAT A ¡ 02 ¡ Maintaining ¡ Data ¡ 4/23/19 ¡ StarEast ¡2019 ¡ 26 ¡ 13 ¡

  16. 4/23/19 ¡ 4/23/19 ¡ StarEast ¡2019 ¡ 27 ¡ Michael ¡Hobbs: ¡ A ¡20-­‑year ¡computer ¡industry ¡veteran ¡who ¡has ¡had ¡the ¡opportunity ¡to ¡work ¡ on ¡all ¡facets ¡of ¡the ¡computer. ¡From ¡CPU ¡Valida3on ¡to ¡Enterprise ¡Server ¡Test, ¡ Michael ¡has ¡spent ¡years ¡gathering ¡best ¡prac3ces ¡from ¡various ¡cultures ¡and ¡ companies. ¡Through ¡this ¡diverse ¡background ¡a ¡unique ¡perspec3ve ¡has ¡been ¡ developed. ¡ Now ¡as ¡a ¡Dell ¡EMC ¡Senior ¡Principal ¡Test ¡Engineer, ¡he ¡helps ¡define ¡and ¡ implement ¡new ¡test ¡technologies ¡including ¡analy3cs ¡and ¡machine ¡learning. ¡ LinkedIn: ¡ www.linkedin.com/in/michaellhobbs ¡ 4/23/19 ¡ StarEast ¡2019 ¡ 28 ¡ 14 ¡

Download Presentation
Download Policy: The content available on the website is offered to you 'AS IS' for your personal information and use only. It cannot be commercialized, licensed, or distributed on other websites without prior consent from the author. To download a presentation, simply click this link. If you encounter any difficulties during the download process, it's possible that the publisher has removed the file from their server.

Recommend


More recommend