Data Punkers tipy #1

Jsme blázni do dat. Neustále sledujeme zprávy z celého světa, které se týkají datové analytiky, vizualizací, pokroku.

Založili jsme Twitter kanál @datapunkers k jehož sledování tímto srdečně zveme (a za sdílení získáte od nás bludišťáka), kde se s vámi budeme dělit o zprávy z data světa. Pakliže ale náhodou nemáte Twitter, tak pro vás alespoň touhle cestou každý týden připravíme souhrn toho nejzajímavějšího, o čem jsme psali a zveřejníme to zde a následně i na našich sockách.

Nejbližší akce

Ve čtvrtek 22.4. dopoledne, bude pod dohledem odborníků probíhat bezplatný online workshop pro začátečníky na @tableau. Naučíte se připojit data, udělat vizuální analýzu, najít firemní data „insighty“ a vytvořit dashboard. Registrujte se!

Ve čtvrtek 29.4. večer se na @keboola, http://revolt.bi a @apify webináři dozvíte, jak můžete snadno s pomocí získat z internetu data od vaší konkurence, zpracovat je a vytvořit z nich užitečné a akční přehledy na @tableau a jak je pak dále využít. Rezervujte si místo!

Google otevřel registrace na vývojářskou konferenci Google i/o 2021, která proběhne 18.-20. května. Všechny přednášky online a free. Registrujte se.

28. června začíná 3denní online konference o nejpokročilejším a nejrychlejším programovacím jazyce pro datové vědce @JuliaLanguage, kombinujícím výhody Python a R s rychlostí C++. Registrovat se můžete zdarma na https://juliacon.org/2021/. Zajímal by vás český followup?

Data science

Děláte v #R grafy s #ggplot2 a taky si zaboha nemůžete zapamatovat jednotlivé funkce? Tahle knihovna https://github.com/brandmaier/ggx vám umožní ovládat jej pomocí příkazů jako „double the font size on the x-axis label“ – buď přímo, nebo i jen jako nápověda.

Image
Nastavování ggplot2 grafu v R přirozeným jazykem pomocí knihovny ggx

Google zvřejnil open source nástroj od Google pro vizualizaci a reprezentaci NLP modelů – Language Interpretability Tool (LIT). Vypadá dost zajímavě, jestli se ML zabýváte, určitě vyzkoušejte https://pair-code.github.io/lit/

Google otevřel pro všechny svůj nástroj pro automatizaci úkolů AppSheet Automation. Je to něco jako o dost jednodušší a omezenější Keboola, pro základní potřeby ale může postačovat.

Data sety využívané pro učení AI obsahují podle studie MIT velmi mnoho chyb. ImageNet má asi 5,8 % chybných štítků, kdy je žába označena jako kočka, houba jako lžíce a podobně. Mnoho dříve haněných modelů se po opravě dat dostalo na špici.

Data vizualizace

Analýza, jak moc jsou v jednotlivých zemích progresivní daně. Nahoře jsou ty nejvíce s nejvíce progresivním zdanění. Umístění Česka mnohé překvapí.

Pěkné využití radarových grafů pro srovnání výkonů desetibojařů na OH v jednotlivých disciplínách. Grafické podání navíc vypadá jak souhvězdí na noční obloze. Like

Results of Decathlon Rio 2016 Olympic Games

Zajímavé využití sloupcových grafů s proměnnou šířkou, kdy výška grafu ukazuje emise na osobu, šířka počet obyvatel, a tedy plocha grafu ukazuje celkové emise. Jinak ale samozřejmě 2 grafy umožní přesnější srovnání obou hodnot.

Emise světových regionů přepočtené na osobu

Co se jinam nevešlo

Google otevřel datové centrum v Polsku, které se tak stává pro Čechy fyzicky nejbližším datovým centrem (jestli i co do rychlosti záleží samozřejmě na tom, kudy vedou jak tlusté dráty).

Tableau má také svůj svůj týdenní přehled data novinek, vizualizací a událostí z Tableau komunity – DataFam.

O Data Punkers

Pro ty z vás, kdo neznají Data Punkers – jedná se o komunitu datových pankáčů, kterou jsme vytvořili spolu s Keboola a Apify. V době míru pořádáme eventy, kde si říkáme o zajímavých data tématech a hlavně se potkáváme, poklábosíme a tak. Další akce máme naplánované hned jak se situace zlepší, tak se registrujte na našem Prague Data Punkers Meetupu.

Závěrem

Jestliže se vám podobné informace líbí, sledujte náš Twitter kanál @datapunkers, nebo Facebook a LinkedIn, aby vám nic neuniklo – budeme totiž psát i o nejbližších akcích, seminářích a školeních a tam vás může každá prodleva stát místo (teda jako u stolu, ne v práci).

A jestli chcete úplnou jistotu, že se k vám informace dostanou, registrujte se k odběru newsletteru. Nebudeme spamovat, maximálně 1 měsíčně pošleme zprávu.


Chcete vaše děti (co už umí anglicky) nebo sebe-začátečníka naučit AI? Zkuste dcodeai – Statistika, Python, Data Science, Computer Vision, Natural Language Processing. Jednoduše vysvětlované, hezká grafika, gamifikace, mobilní aplikace. Moc se nám to líbí.

Dcode
M. Murray
Michelle Murray
Senior Solution Engineer
Victoria Sinfield
Solution Engineer
M. Groom
Matthew Groom
Solution Engineer
Registrace
E-mailová adresa

Vyplněním a odesláním registračního formuláře souhlasíte se zasíláním e-mailů (max. 1 měsíčně) o data novinkách a akcích a se zpracováním osobních údajů (viz podrobné informace).

Děkujeme za vyplnění formuláře.
Oops! Něco se nepovedlo, zkuste formulář vyplnit znovu.