Data Punkers tipy #3

V tomto díle našeho týdenního souhrnu zpráv týkajících se datové analytiky, vizualizací a pokroku v umělé inteligenci se dozvíte m.j., jestli byste raději neměli svůj čas věnovat chovu holubů.

Předchozí (druhý) díl je k vidění na našem webu. Sledujte náš Twitter @datapunkers, ať vám žádná zpráva neunikne.

Akce

S tím jak se blíží konec opatření a proočkování populace se chystáme pořádat další akce Data Punkers (mimochodem, jestli nejste ještě členy naší Meetup skupiny, tak se přidejte). Protože už je nás ale téměř 400 stovky, potřebujeme zjistit něco o vás - co vás zajímá, jaké jsou vaše zkušenosti a tak. Budeme tak moci dělat více menších setkání (a nebo třeba i webinářů atd.) zaměřených na vaše potřeby. Vyplňte nám prosím proto krátký dotazník, díky.


  1. Pro ty, kdo prošvihli předminulý čtvrtek hands-on webinář Virtual Tableau Test Drive, kde se mohl každý během hodinky prakticky naučit pracovat s Tableau, napojit data, vizualizovat je a hledat v nich zajímavé insighty nezoufejte. Na stránce webináře je k dispozici záznam z přednášky, klikněte na tlačítko WATCH NOW. Jestli potřebujete další školení, pomoci s integrací do firmy atd. kontaktujte nás.
  2. Minulý čtvrtek jste se na Keboola, Revolt BI a Apify webináři dozvěděli, jak můžete snadno s pomocí získat z internetu data od vaší konkurence, zpracovat je a vytvořit z nich užitečné a akční přehledy na Tableau a jak je pak dále využít. I tady je už k dispozici záznam, tak si jej pusťte. A i zde platí - v případě jakýchkoliv dotazů jsme vám k dispozici.
  3. Již tento čtvrtek, tedy 6. května 2021 začíná největší světová konference věnovaná datové analytice – Tableau Live Europe 2021. Bude logicky jen online a je zdarma. Registrujte se. My ji budeme samozřejmě celý den sledovat a přinášet vám aktuality na @datapunkers účtu.
    Loni proběhla místo ní jen o trochu menší Tableau Conferenceish, na videa z ní se můžete podívat zde.
  4. O den později, 7. května 2021 od 10:30h,  pořádá webstudio ÚZIS v pořadí již druhý webinář o zdravotnických datech. Jestli vás zajímají otevřené datové sady ve zdravotnictví, registrujte se.
  5. Jste žena/dívka a umíte dělat zajímavé vizualizace? Znáte nějakou takovou? Přihlašte se do dalšího ročníku soutěže Data Visualization Competition pořádané Women in Analytics. Na odeslání vašeho výtvoru máte čas jen do 24. května. Koukněte se na výtvory loňských vítězkyň, ať máte představu.
  6. 28. června začíná 3denní online konference o nejpokročilejším a nejrychlejším programovacím jazyce pro datové vědce Julia, kombinujícím výhody Python a R s rychlostí C++. Registrujte se zdarma. Zajímal by vás český followup?

Víte o nějakých dalších datově orientovaných akcích, které by našince mohly zajímat? Napište o nich Tomášovi.

Data novinky

Velkou novinku představili po dlouhých přípravách a testech v Apify - šikovní lidé teď mohou vyvíjet komerční aktory. Je to win-win pro všechny - vývojáři budou více motivováni zveřejňovat užitečné aktory a nenechávat si je pro sebe a běžní uživatelé si nebudou muset všechno vyvíjet sami. Více informací na jejich blogu.

ASRgenomics je nový bezplatný nástroj od který vám pomůže lépe připravit molekulární a rodokmenové datové sady pro vaše analýzy v R.

Ivan Kutil detailně popsal, jak analyzoval emoce ve vítězném oscarovém filmu Země nomádů pomocí Cloud Natural Language API od Googlu.


W3C založila novou pracovní skupinu pro strojové učení na webu, využití najde například při videokonferencí - detekce obličejů, póz, grimas, gest..., nebo např. pro superscaling sledovaných online videí. 


Australská pojišťovna Budget Direct zveřejnila zajímavé vizualizace nejprodávanějších aut v jednotlivých zemích celého světa. U mapy Evropy píše: 

Když zavřete oči a představíte si motoristickou krajinu v Evropě, pravděpodobně se nemýlíte. Český výrobce Škoda nadále dominuje cenově dostupnému automobilovému prostředí na východě, i když jeho nejnovější modely už nemají hodnocení jako "Porsche východní Evropy". Octavia je jedničkou v osmi evropských zemích včetně Česka, kde se jí loni prodalo 21 663 kusů.

Mimochodem, výše uvedená citace je bez jediného zásahu automatický překlad pomocí božího překladače DeepL využívajícího strojové učení, o kterém jsme také psali. Umí překládat z/do 24 jazyků včetně češtiny, nedělají mu problém tvary slov a veškerá konkurence mu nesahá ani po kotníky.  

Zmínili jsme i dva měsíce starý příspěvek o velkém problému mnoha Image Processing AI, neboť jej mnozí nezachytili. Zjistilo se, že spoustu dnešních nejchytřejších AI “očůráte” snadno tak, že prostě na danou věc napíšete něco jiného a neuronka takovému nápisu dá větší váhu než vzhledu samotného objektu. Je tak dost možné, že do pár moderních firem se dostanete přes kamerový zámek prostě tak, že si na tričko napíšete jméno ředitele.

Ukázali jsme dva slajdy z případovky migrace eshopu z Azure databáze na Snowflake. Ve zkratce - 1000x vyšší výkon (co trvalo 83 minut nyní trvá 5 sekund), snížení nákladů (o 40 % méně) a režijních nákladů (3 FTE -> 1 FTE). Rychlejší vývojový cyklus. Lepší zákaznická zkušenost (sdílení dat, přímý přístup k nástrojům BI). Máme velmi podobné zkušenosti, když jsme prováděli migrace některých našich zákazníků, např. z řetězce Internet Mall. Kdyby vás to zajímalo pro váš business, ozvěte se.

Představte si dva nezávisle řízené AI roboty využívající zpětnovazebné učení, které jsou oddělené překážkami, a jejichž společným cílem je setkání. Jak se mají pohybovat, aby se setkaly, aniž by spolu jakkoliv komunikovay? Tomu se věnuje článek na Google AI.

Chcete se naučit a nebo vaše děti programovat od základů, zejména v Pythonu, ale i třeba SQL, a to ve vaší mateřštině (tedy jestli jste také čechoslováci)? Máte rádi spíš videa než čtení? Michal Hučko má skvělý seriál na YouTube.

Ondřej Hlaváček ukazuje, jak v Keboola zrychlili deploy infrastruktury z práce na týden pro celý tým na skript, co běží pár hodin. Prozradí, co se u toho o naučili a kam směřují dál.

AI má vyzyvatele – holuby. Lidský patolog má prý průměrně úspěšnost při detekci rakoviny v histopatologických vzorcích 65 %, AI po letech ladění a stovkách milionech dolarů investic dosahuje aktuálně 95 %. Stejných 95 % ovšem dosahuje i holub po 14 dnech výcviku, se 4 holuby “hodnotícími” stejný vzorek se dostanete dokonce na 99 %. Vědecký článek je sice 6 let starý, ale i tak myslím dost zajímavý, vzhledem k obdobným úlohám, které se v této oblasti řeší. Výborně popisuje celou metodologii a můžete se tak inspirovat.


V průběhu celého měsíce dubna tak účastníci zveřejňovali své výtvory pod  hashem #30DayChartChallenge, často i s kódy (typicky v R) a nebo Tableau public dashboardy. 

Jestli se tedy chcete přiučit tvorbě dashboardů, tak doporučuji zobrazit si tento hash na Twitteru, účastníci tam nyní často ukazují souhrn všechny svých výtvorů, často i s nějakým dalším komentářem, a nebudete tak muset tak hodně listovat. A na příští rok se chystá pokračování, takže pilujte svůj dataviz um.

A to je pro tento týden všechno - začněte sledovat @datapunkers Twitter, sdílejte jej svým přátelům, lajkujte na sockách..., čím víc vás tu bude, tím víc budeme moci věnovat času pro vás připravovat informace, psát články, natáčet videa atd. A přidejte se také do naší Meetup skupiny, již brzy vás snad budeme moci pozvat na nějakou další akci.


Chcete vaše děti (co už umí anglicky) nebo sebe-začátečníka naučit AI? Zkuste dcodeai – Statistika, Python, Data Science, Computer Vision, Natural Language Processing. Jednoduše vysvětlované, hezká grafika, gamifikace, mobilní aplikace. Moc se nám to líbí.

Dcode
M. Murray
Michelle Murray
Senior Solution Engineer
Victoria Sinfield
Solution Engineer
M. Groom
Matthew Groom
Solution Engineer
Registrace
E-mailová adresa

Vyplněním a odesláním registračního formuláře souhlasíte se zasíláním e-mailů (max. 1 měsíčně) o data novinkách a akcích a se zpracováním osobních údajů (viz podrobné informace).

Děkujeme za vyplnění formuláře.
Oops! Něco se nepovedlo, zkuste formulář vyplnit znovu.