Revolt BI

Statistické modely & R

V tomto kurzu se dozvíte vše potřebné pro řešení nejčastějších úloh datové analýzy s využitím R. Naučíte se jak během pár minut získat a zobrazit nejdůležitější informace o datasetu i jak vytvářen sofistikované modely, schopné předvídat budoucí vývoj. Dozvíte se výhody i slabé stránky jednotlivých postupů a budete vědět, který nástroj je vhodný pro řešení jednotlivých problémů.

Kurz navazuje na předchozí „Základy R“ a od nejjednodušších řešení plynule přechází k těm nejvýkonnějším algoritmům, které vyhrávají dataminingové soutěže.

 

Cíle kurzu

  • Představit a procvičit možnosti R pro datovou analýzu, porozumění datům nebo pro tvorbu modelů.
  • Osvojit si základy predikce.

 

Publikum

Analytici, kteří chtějí porozumět svým datům a být schopni predikovat základní závislosti.

  • Data Analyst
  • Data Scientists
  • Machine Learning Engineers
  • Data Engieneers

 

O kurzu

Základní statistické funkce pro prvotní porozumění datům

  • Mean, median, percentile
  • Statistické rozdělení a outliery

Univariate analysis (jedno-proměnná analýza závislosti)

  • Volba vysvětlované proměnné
  • Korelace a korelační matice
  • Významnost proměnných
  • Scatter plots

Volba modelu pro explorační a predikční analýzu

  • Jak přemýšlet nad datovým problémem
  • Jak sestavit vstupní matici pro samotný datový model

Základy regrese

  • Lineární regrese
  • Jak poznat významné proměnné
  • Statistické testy korektnosti regrese
  • Přesnost regrese
  • Úvod do logistické regrese

Bonus

  • Jak přemýšlet o časových řadách
  • Machine learning: random forest a XGBOOST

 

Kurzy připravujeme v rámci programu Datascript

Pro koho jsme už dělali?