probability and statistics
play

Probability and Statistics for Computer Science The - PowerPoint PPT Presentation

Probability and Statistics for Computer Science The eternal mystery of the world is its comprehensibility The fact that it is comprehensible


  1. Probability ¡and ¡Statistics ¡ ì ¡ for ¡Computer ¡Science ¡ ¡ “The ¡eternal ¡mystery ¡of ¡the ¡ world ¡is ¡its ¡comprehensibility … The ¡fact ¡that ¡it ¡is ¡ comprehensible ¡is ¡a ¡miracle.” ¡ – ¡Albert ¡Einstein ¡ Credit: ¡wikipedia ¡ Hongye ¡Liu, ¡Teaching ¡Assistant ¡Prof, ¡Course ¡CS361, ¡UIUC, ¡8.27.2019 ¡

  2. Contents ¡ ✺ Course ¡materials ¡and ¡course ¡staff ¡ ✺ Overview ¡of ¡CS361 ¡ ✺ Lecture ¡1 ¡-­‑ ¡Data ¡VisualizaXon ¡& ¡ Summary ¡(I) ¡ ¡

  3. Course ¡materials ¡and ¡course ¡staff ¡ ✺ Website ¡& ¡Survey ¡ ✺ Meet ¡our ¡TAs ¡and ¡GA ¡ ¡Anay, ¡Andrew, ¡Ehsan, ¡Umar ¡ ¡& ¡Emma! ¡ ¡ ✺ Cell ¡phone, ¡laptop ¡policy ¡ ¡ ¡

  4. Course ¡materials ¡and ¡course ¡staff ¡ ✺ Website ¡& ¡Survey ¡ h`ps://courses.engr.illinois.edu/cs361/ fa2019/ ¡ ¡ ¡ ¡ ¡(more ¡to ¡be ¡updated ¡such ¡as ¡office ¡hours) ¡ ¡Test ¡iClicker ¡… ¡

  5. Course ¡materials ¡and ¡course ¡staff ¡ ✺ Have ¡you ¡done ¡the ¡survey ¡on ¡the ¡course ¡ website? ¡ ¡A. ¡Yes. ¡ ¡ ¡ ¡B. ¡No. ¡

  6. Cell ¡phone ¡& ¡laptop ¡policy ¡in ¡lecture ¡ ✺ Cell ¡phone ¡is ¡expected ¡to ¡be ¡silenced ¡and ¡ put ¡away ¡unless ¡permi`ed ¡by ¡the ¡ instructor ¡ ✺ Laptop ¡is ¡allowed ¡to ¡be ¡used, ¡but ¡laptop ¡ users ¡are ¡suggested ¡to ¡sit ¡relaXvely ¡toward ¡ the ¡back ¡so ¡that ¡non-­‑users ¡won’t ¡get ¡ disturbed. ¡Its ¡usage ¡should ¡be ¡course ¡ lecture ¡related ¡such ¡as ¡taking ¡notes, ¡etc. ¡ ¡

  7. Meet ¡Our ¡Staff ¡ Instructor: ¡ Hongye ¡Liu ¡ Teaching ¡Assistants : ¡Anay ¡Pa`anaik, ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡Andrew ¡Yoo, ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡Ehsan ¡Saleh, ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡Umar ¡Farooq ¡ ¡ Graduate ¡Assistant : ¡ ¡Emma ¡Marie ¡Taylor ¡ We ¡will ¡have ¡course ¡grading ¡assistants ¡ later. ¡ ¡ ¡

  8. Overview ¡of ¡CS361 ¡ ✺ Probability ¡and ¡StaXsXcs ¡in ¡acXon ¡ ✺ What ¡does ¡this ¡course ¡teach? ¡ ¡ Textbook: ¡Forsyth, ¡D. ¡A. ¡"Probability ¡and ¡Sta@s@cs ¡for ¡Computer ¡ ¡Science," ¡Springer ¡(2018) ¡ ✺ Why ¡are ¡there ¡4 ¡secXons? ¡How ¡are ¡ they ¡related? ¡ ✺ Learning ¡Programming ¡R ¡

  9. This ¡field ¡really ¡started ¡with ¡gaming ¡ ✺ We ¡are ¡familiar ¡with ¡flipping ¡a ¡ coin ¡or ¡throwing ¡a ¡dice, ¡the ¡ result ¡is ¡uncertain! ¡ Head ¡ ¡ Which ¡side ¡ Or ¡Tail? ¡ ¡is ¡front? ¡

  10. Life ¡is ¡uncertain ¡so ¡aim ¡for ¡long-­‑ term ¡average ¡ ✺ We ¡repeat ¡a ¡lot ¡of ¡experiments ¡ and ¡see ¡if ¡there ¡is ¡regularity ¡ Head ¡ ¡ Which ¡side ¡ Or ¡Tail? ¡ ¡is ¡front? ¡

  11. Throwing ¡a ¡lot ¡of ¡“coins” ¡for ¡many ¡ times ¡in ¡one ¡touch ¡ ✺ Galton ¡board, ¡the ¡Bead ¡Machine ¡ ¡h`ps://www.youtube.com/watch? v=Kq7e6cj2nDw ¡ ¡ ¡

  12. Probability ¡and ¡Statistics ¡ Experiment ¡in ¡action ¡ ✺ Try ¡the ¡bead ¡machine ¡4 ¡Xmes, ¡the ¡ first ¡two ¡runs ¡with ¡the ¡base ¡on ¡the ¡ table, ¡the ¡next ¡2 ¡runs ¡however ¡you ¡ like ¡as ¡long ¡as ¡you ¡don’t ¡break ¡it. ¡ ✺ I ¡will ¡ask ¡you ¡some ¡simple ¡quesXons ¡ later ¡on. ¡ ¡

  13. Simulation ¡of ¡random ¡draw ¡of ¡a ¡ picture ¡on ¡computer ¡ ✺ It’s ¡the ¡same ¡as ¡ ¡ throwing ¡a ¡4-­‑sided ¡die. ¡ ¡

  14. Assign ¡logos ¡ ¡ Group1 ¡ Group3 ¡ Group2 ¡ Group4 ¡

  15. Break ¡

  16. What ¡does ¡this ¡course ¡teach? ¡ ✺ Describing ¡Datasets ¡ ¡Summary ¡& ¡visualizaXon ¡ ✺ Probability ¡ ¡ ✺ Inference ¡– ¡StaXsXcal ¡Inference ¡ ✺ Tools ¡– ¡Machine ¡Learning ¡tools ¡

  17. Describing ¡datasets ¡(Summary ¡& ¡ visualization ¡) ¡ ¡ Descrip(ve ¡& ¡Graphical ¡ ¡ SummarizaXon ¡of ¡4 ¡locaXons’ ¡annual ¡mean ¡ ¡ temperature ¡by ¡month ¡

  18. Probability ¡ ¡ ✺ Mathema@cal ¡ Romeo ¡and ¡Juliet ¡have ¡a ¡date ¡ Each ¡arrives ¡with ¡a ¡delay ¡btw ¡0 ¡and ¡1 ¡ hour. ¡The ¡first ¡to ¡arrive ¡leaves ¡arer ¡1/4 ¡ hour. ¡All ¡pairs ¡of ¡delays ¡are ¡equally ¡likely. ¡ What's ¡the ¡probability ¡that ¡they ¡will ¡ meet? ¡ ¡

  19. Inference ¡ ✺ Analy@cal ¡ Treatment ¡1 ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ Treatment ¡2 ¡ How ¡different ¡ ¡ are ¡they? ¡ J ¡Fromonot ¡et ¡al ¡ JACC ¡2016 ¡

  20. Tools ¡(Machine ¡learning) ¡ ✺ Algorithmical ¡ High-­‑dimensional ¡or ¡ ¡ complex ¡shaped ¡ Cancer ¡Cell ¡Division ¡Clusters ¡ Different ¡human ¡cells ¡ data ¡sets ¡need ¡tools! ¡ ¡ Humans ¡are ¡limited ¡in ¡ 2-­‑3D. ¡ Machine ¡learning ¡is ¡ ¡ Highly ¡desired! ¡ Oren ¡depends ¡on ¡ ¡ StaXsXcs. ¡

  21. Why ¡these ¡4 ¡sections? ¡ ✺ Summary ¡& ¡visualizaXon ¡ Graphical ¡ ✺ Probability ¡ ¡ Mathema@cal ¡ ✺ Inference ¡– ¡StaXsXcal ¡Inference ¡ Analy@cal ¡ ✺ Tools ¡– ¡Machine ¡Learning ¡tools ¡ Algorithmical ¡

  22. Why ¡these ¡4 ¡sections? ¡ ✺ The ¡common ¡thread ¡is ¡ Data. ¡ ¡ ✺ We ¡are ¡doing ¡computer ¡science ¡and ¡so ¡ are ¡like ¡ Data ¡Science ¡+ ¡ Comp. ¡Science ¡ these ¡ StaXsXcs ¡ yellow ¡ ¡ fish ¡ MathemaXcs ¡ ¡ ¡

  23. Why ¡these ¡4 ¡sections? ¡ ✺ Real ¡world ¡data ¡is ¡oren ¡high ¡ dimensional ¡and ¡complex ¡ ✺ These ¡4 ¡parts ¡of ¡knowledge ¡or ¡ techniques ¡are ¡inseparably/ organically ¡connected ¡in ¡many ¡real ¡ world ¡applicaXons. ¡

  24. Learning ¡Programming ¡R ¡ ✺ Language ¡of ¡the ¡staXsXcians ¡ ✺ Best-­‑in-­‑class ¡visualizaXon ¡tools ¡ ✺ Countless ¡expert ¡packages ¡ including ¡machine ¡learning ¡ ✺ Open-­‑source, ¡free ¡

  25. Which ¡are ¡the ¡success ¡ingredients? ¡ A. Try ¡your ¡best ¡to ¡be ¡engaged, ¡learn ¡from ¡ the ¡course ¡and ¡from ¡each ¡other, ¡ ¡ B. AcXve ¡in ¡class ¡parXcipaXon ¡ C. Do ¡as ¡much ¡pracXce ¡as ¡possible, ¡not ¡just ¡ the ¡homework. ¡ D. Read ¡the ¡textbook ¡ E. All ¡the ¡above ¡ F. Why ¡does ¡i-­‑clicker ¡have ¡only ¡5 ¡choices? ¡

  26. Which ¡are ¡the ¡success ¡ingredients? ¡ A. Try ¡your ¡best ¡to ¡be ¡engaged, ¡learn ¡from ¡ the ¡course ¡and ¡from ¡each ¡other, ¡ ¡ B. AcXve ¡in ¡class ¡parXcipaXon ¡ C. Do ¡as ¡much ¡pracXce ¡as ¡possible, ¡not ¡just ¡ the ¡homework. ¡ D. Read ¡the ¡textbook ¡ E. All ¡the ¡above ¡ F. Why ¡does ¡i-­‑clicker ¡have ¡only ¡5 ¡choices? ¡

  27. Break ¡

  28. Lecture ¡I: ¡Data ¡Visualization ¡ &Summary ¡ ✺ Datasets ¡ {x} ¡– ¡a ¡set ¡of ¡N ¡items ¡x i , ¡ i=1…N, ¡each ¡of ¡which ¡is ¡a ¡tuple ¡ ¡ Proteins ¡ Cells ¡ Each ¡row ¡ ¡is ¡a ¡tuple ¡ ¡

  29. Lecture ¡I: ¡Data ¡Visualization ¡ &Summary ¡ ✺ ConvenXon: ¡columns ¡are ¡the ¡ features ; ¡the ¡ number ¡of ¡features ¡is ¡ dimension. ¡ Proteins ¡ Cells ¡ Each ¡row ¡ ¡is ¡a ¡tuple ¡with ¡dimension ¡=5 ¡ ¡

  30. Data ¡types ¡ ✺ Categorical ¡ ✺ Ordinal ¡ ✺ ConXnuous ¡

  31. Data ¡types ¡ ✺ Categorical ¡ Smoker ¡or ¡non-­‑Smoker, ¡Female ¡or ¡Male ¡etc. ¡ ¡ ¡ ¡ ✺ Ordinal ¡ Not ¡saXsfied, ¡saXsfied, ¡very ¡saXsfied ¡ ✺ ConXnuous ¡ (any ¡real ¡number ¡within ¡a ¡range) ¡ Temperature ¡

  32. Simple ¡Visualization ¡of ¡Data ¡ ¡ ¡ ✺ General ¡principles ¡ ✺ Bar ¡chart ¡ ✺ Histogram ¡ ✺ CondiXonal ¡histogram ¡

Download Presentation
Download Policy: The content available on the website is offered to you 'AS IS' for your personal information and use only. It cannot be commercialized, licensed, or distributed on other websites without prior consent from the author. To download a presentation, simply click this link. If you encounter any difficulties during the download process, it's possible that the publisher has removed the file from their server.

Recommend


More recommend