Revolt BI

Statistické modely & R

V tomto kurzu se dozvíte vše potřebné pro řešení nejčastějších úloh datové analýzy s využitím R. Naučíte se jak během pár minut získat a zobrazit nejdůležitější informace o datasetu i jak vytvářen sofistikované modely, schopné předvídat budoucí vývoj. Dozvíte se výhody i slabé stránky jednotlivých postupů a budete vědět, který nástroj je vhodný pro řešení jednotlivých problémů.

Kurz navazuje na předchozí „Základy R“ a od nejjednodušších řešení plynule přechází k těm nejvýkonnějším algoritmům, které vyhrávají dataminingové soutěže.

 

Cíle kurzu

 • Představit a procvičit možnosti R pro datovou analýzu, porozumění datům nebo pro tvorbu modelů.
 • Osvojit si základy predikce.

 

Publikum

Analytici, kteří chtějí porozumět svým datům a být schopni predikovat základní závislosti.

 • Data Analyst
 • Data Scientists
 • Machine Learning Engineers
 • Data Engieneers

 

O kurzu

Základní statistické funkce pro prvotní porozumění datům

 • Mean, median, percentile
 • Statistické rozdělení a outliery

Univariate analysis (jedno-proměnná analýza závislosti)

 • Volba vysvětlované proměnné
 • Korelace a korelační matice
 • Významnost proměnných
 • Scatter plots

Volba modelu pro explorační a predikční analýzu

 • Jak přemýšlet nad datovým problémem
 • Jak sestavit vstupní matici pro samotný datový model

Základy regrese

 • Lineární regrese
 • Jak poznat významné proměnné
 • Statistické testy korektnosti regrese
 • Přesnost regrese
 • Úvod do logistické regrese

Bonus

 • Jak přemýšlet o časových řadách
 • Machine learning: random forest a XGBOOST

 

Kurzy připravujeme v rámci programu Datascript

Pro koho jsme už dělali?