Slovník pojmů

ze světa dat a technologií

Pomůžeme vám zorientovat se ve významu nejpoužívanějších
termínů v segmentu dat a technologií.

Víme, že určité odborné výrazy nejsou jen tak.
Připravili jsme si pro vás slovník, který vám pomůže všechny
výrazy hravě rozlousknout.

A
Analytická Transformace
Analýza dat (Data Analysis)

Použití statistických metod, strojového učení a jiných analytických nástrojů k odhalení vzorů, trendů a informací ve datech.

Automatizace

Používání automatizovaných nástrojů a procesů k zefektivnění datové

B
BI

Business Intelligence (BI) je soubor metod a nástrojů používaných k analyzování a transformaci dat do užitečných informací, které podporují obchodní rozhodování. Cílem BI je poskytnout podrobné znalosti o interních a externích faktorech, které ovlivňují podnikání. To zahrnuje sběr dat z různých zdrojů, jejich integraci, analýzu a prezentaci ve formě reportů, dashboardů a vizualizací, aby byly informace snadno přístupné a srozumitelné pro manažery a další zúčastněné strany.

Big Data
Big Query
Big Table
C
Co je Business Intelligence

Jsou dovednosti, znalosti, technologie, aplikace, kvalita, rizika, bezpečnostní otázky a postupy používané v podnikání pro získání lepšího pochopení chování na trhu a obchodních souvislostech. Za tímto účelem provádí sběr, integraci, analýzu, interpretaci a prezentaci obchodních informací. Mohou zahrnovat samotné shromážděné informace nebo explicitní znalosti získané z informací.

Č
Čištění dat (Data Cleaning)

Proces odstranění chybějících, nesprávných nebo nekonzistentních dat, aby byla zajištěna přesnost a spolehlivost analýz.

D
Dashboard

Dashboard je soubor sestav. Přístrojová deska v kontextu obchodní a datové analytiky označuje vizuální zobrazení klíčových ukazatelů výkonnosti (KPI), metrik a datových bodů konsolidovaných a zobrazených v jediném, snadno čitelném rozhraní. Poskytuje přehled o výkonnosti organizace v reálném čase nebo o konkrétních aspektech obchodního procesu.

Data Quality Management

Natavení a sledování integračních procesů a kontrola kvality dat, aby se zajistila přesnost a spolehlivost integrovaných dat.

Data Transformace

Čištění, transformace a standardizace dat tak, aby byla připravena k integraci do centrálního úložiště. Tato fáze může zahrnovat odstranění duplicit, normalizaci formátů, převedení hodnot a další úpravy.

Data science

je multidisciplinární obor, který využívá metody, procesy, algoritmy a systémy k extrakci a analýze strukturovaných a nebo neupravených dat. Cílem datové vědy je získat pochopení a informace z dat a využít je k rozhodování a řešení komplexních problémů.

Data science je často využívána v oblastech jako obchod, věda, zdravotnictví, finance, marketing a mnoho dalších. Odborníci na data science jsou známí jako datoví vědci a mají široké dovednosti v programování, statistice, matematice, strojovém učení a oboru, ve kterém pracují.

Datová integrace

Datová integrace je proces spojování a sjednocování dat z různých zdrojů do jednotného celku, který je často nazýván datový sklad nebo datové jezero. Cílem datové integrace je vytvořit jednotné a konzistentní datové prostředí, které umožní organizacím snadněji a efektivněji pracovat s daty, analyzovat je a vytvářet informovaná rozhodnutí.

Dimenze (datová)

V kontextu Business Intelligence (BI) a analýzy dat se dimenze vztahuje na kategorický nebo kvalitativní aspekt, atribut nebo charakteristiku, podle které lze data třídit, organizovat nebo seskupovat pro účely analýzy a reportování. Dimenze obvykle obsahují textová nebo kategorická data a používají se k označování, kategorizaci nebo klasifikaci kvantitativních měr (známých také jako míry nebo metriky) v souboru dat. Nabízejí způsob, jak strukturovat a analyzovat data podle různých aspektů nebo hledisek.

Donut Chart

Donut chart, neboli koblížkový graf je typ pie chartu (koláčového grafu), který má uprostřed otvor. Svým tvarem tak připomíná tipický donut. Koblihové grafy zobrazují kategorie ve formě oblouků namísto výsečí. Výhodou tohoto grafu je, že výseč pomáhá divákům vyhnout se zmatkům kolem parametru oblasti.

dbt (Data Build Tool)

Co je dbt?

dbt neboli data build tool, je open-source nástroj s rozhraním příkazového řádku, který pomáhá organizacím vytvářet, testovat a udržovat jejich datovou infrastrukturu. Je to něco jako Looker PDTs, ale mnohem víc než to. Má podobnosti s Airflow, ale je vytvořen pro úplně jiného uživatele. dbt je svou vlastní jedinečnou věcí.

Nástroj dbt umožňuje uživatelům definovat své datové modely pomocí jazyka SQL a následně tyto modely využívá k vygenerování optimalizovaného kódu SQL, který lze spustit proti datovému skladu nebo jinému systému pro ukládání dat. To uživatelům umožňuje vybudovat udržovatelnou a škálovatelnou datovou infrastrukturu, kterou lze v průběhu času snadno aktualizovat a rozšiřovat.

Kromě generování kódu SQL poskytuje dbt také řadu funkcí, které usnadňují práci s daty. Mezi tyto funkce patří možnost spravovat dependencies mezi datovými modely, spouštět testy k zajištění integrity dat a sledovat vývojovou linii, aby bylo možné pochopit, jak se data v průběhu času proměňovala.

dbt a no-vendor lock: dbt dobře zapadá do moderního BI stacku a spolupracuje s produkty jako Snowflake, Keboola, BigQuery, Looker, Fivetran, Redshift a Mode. Díky dbt kódu (uloženém v Git repozitářích) je možné vyvinutý kód kdykoliv přesunout na jinou platformu.

Víc o využití dbt naleznete na našich webových stránkách zde.

E
Excel

Najpoužívanejší analytický nástroj na svete. A místo, kam všichni manageři chtějí stáhnout data z Tableau.

Extrahování (data)

Extrahování (Extracting): Proces sběru dat z různých zdrojů, jako jsou databáze, soubory, webové služby nebo externí systémy. Data jsou často extrahována ve formě „surových“ dat.

F
Fakt (v datech)

Fakt obvykle v Business Intelligence představuje kvantifikovatelná a číselná data, která zachycují měřitelné aspekty podnikového procesu nebo události. Je to základní jednotka informace v datovém skladu nebo data martu a obvykle se skládá z číselných hodnot. Fakta jsou obvykle spojena s konkrétními transakcemi, událostmi nebo událostmi a poskytují kontext pro analýzu. Jedná se o obdobu měření v tableau.

G
Gooddata
H
Hit rate
Rychlost, s jakou se produkt začne prodávat po prvním naskladnění nebo prvním vystavení v kamenném obchodě nebo internetovém obchodě.

 

K
Keboola
M
Machine Learning (ML)

Větev datové vědy, která se zaměřuje na vytváření modelů a algoritmů, které umožňují počítačům „učit se“ z dat a provádět predikce nebo klasifikace bez explicitního programování.

Metrika (datová)

Metrika je specifické měření používané ke sledování, kvantifikaci nebo hodnocení konkrétního aspektu obchodní výkonnosti nebo aktivity. Představuje klíčový ukazatel výkonnosti (KPI), který pomáhá vyhodnotit úspěch nebo neúspěch procesu, projektu nebo cíle. Metriky mohou zahrnovat číselné hodnoty, jako jsou tržby z prodeje, náklady na akvizici zákazníků, míra odchodu zákazníků, míra konverze atd. Metrika je obchodně definovaný výpočet zobrazený na řídicím panelu v rámci sestavy.

O
Obrátka zásob

Obrat zásob, je měřítkem toho, kolikrát musí společnost nahradit zásoby, které prodala v určitém časovém rozmezí, a to buď ročně, čtvrtletně, nebo měsíčně.

Ukazatel obratu zásob zjišťuje, jak rychle prodáváte a jak často doplňujete zásoby. Tento ukazatel je rozhodující pro obchodníky, kteří prodávají zboží podléhající rychlé zkáze nebo citlivé na čas, jako jsou potraviny, rychlá móda, automobily a periodika. Nadbytek zásob navíc může vést k mrtvým zásobám, zejména když se mění roční období a zákazníci již nekupují zastaralé zboží.

Úspěšné retailové firmy sledují skladové zásoby zboží v dashboardoch jako tento.

Obrátka zásob

Obrat zásob, je měřítkem toho, kolikrát musí společnost nahradit zásoby, které prodala v určitém časovém rozmezí, a to buď ročně, čtvrtletně, nebo měsíčně. Ukazatel obratu zásob zjišťuje, jak rychle prodáváte a jak často doplňujete zásoby. Tento ukazatel je rozhodující pro obchodníky, kteří prodávají zboží podléhající rychlé zkáze nebo citlivé na čas, jako jsou potraviny, rychlá móda, automobily a periodika. Nadbytek zásob navíc může vést k mrtvým zásobám, zejména když se mění roční období a zákazníci již nekupují zastaralé zboží

Odvozená metrika

Odvozená metrika v Business Intelligence představuje vlastní nebo vypočtenou metriku, která je odvozena z existujících metrik nebo opatření již přítomných v sestavě / řídicím panelu. Je vytvořena použitím matematických operací (jako je sčítání, odčítání, násobení, dělení), agregací, transformací nebo kombinací na jednu nebo více existujících metrik.

P
Pie Chart
Power BI

Software pro obchodní analýzu od společnosti Microsoft, který poskytuje nástroje pro agregaci, analýzu, vizualizaci a sdílení dat. Umožňuje uživatelům vytvářet interaktivní sestavy a dashboardy, které zlepšují přehled o klíčových ukazatelích výkonnosti (KPI) a usnadňují rozhodování na základě dat. Power BI podporuje širokou škálu datových zdrojů a je dostupný jako cloudová služba i desktopová aplikace.

Přenos (Loading)

Přenos (Loading): Přenášení transformovaných dat do centrálního datového úložiště, jako jsou datové skladní nebo datová jezera. Tato fáze může být prováděna v reálném čase nebo v dávkovém režimu.

R
Report / Insight

Report je kombinací metrik, dimenzí and filtrů. Report v BI je strukturovaný dokument, který obsahuje a prezentuje data, derived z mnoha metriky nebo datasetů. Tyto reporty organizují informace ve způsobu, jakým učiní komprehensive pohled na výkonnost, trendy, a vzory s organizací. Reporty mohou zahrnovat různé oblasti suché, jako finanční výkonnost, prodejní analýzy, marketing effectiveness, operational efficiency, etc. Tyto zahrnují řadu metriky a jsou generovány pravidelně nebo on-demand. Jeden report (z data perspektivy) může být approximated by jeden pivot table used v Excel.

S
Stock to sales ratio

 

Poměr zásob k tržbám, známý také jako Stock to Sales ratio, měří hodnotu vašich zásob vůči hodnotě tržeb za určité období (zvyčejně měsíc).

Stock to sales ratio = průměrná hodnota zásob / čistá hodnota tržeb. Průměrná hodnota zásob = (stav zásob k počátku měsíce + konečný stav zásob) / 2 Čisté tržby = hrubé tržby – výnosy z prodeje

Tento klíčový ukazatel řízení zásob pomáhá maloobchodníkům pochopit, jakým tempem likvidují zásoby a jakou část svého kapitálu v průměru investovali do zásob.

T
Tableau

Tableau je nejpoužívanější a nejpokročilejší analytický Business Intelligence nástroj pro snadné zpracování a rychlou
a přehlednou vizualizaci dat celé vaší firmy.

 

Galerie příkladových reportů.

Tableau Cloud

 

Tableau Cloud, dříve známý jako Tableau Online, je plně hostované řešení SaaS, které umožňuje organizacím přistupovat k datům a analyzovat je prostřednictvím webového prohlížeče, aniž by potřebovaly lokální infrastrukturu.

Podívejte se na Tableau zblízka.

Tableau Online

Dřívější název pro Tableau Cloud. Viz Tableau Cloud.

Tableau Public

Tableau Public je bezplatná platforma pro zkoumání, vytváření a veřejné sdílení vizualizací dat online. Tableau Public je největší úložiště datových vizualizací na světě, ze kterého se můžete učit a díky kterému je rozvoj datových dovedností snadnější.

Jak vyzerá Tableau Public? Podívejte se na galérii nejlepších business dashboardů zde.

Tableau Server

Tableau Server je možnost lokálního nasazení Tableau, která organizacím umožňuje hostovat a spravovat prostředí pro tvorbu Tableau reportů v rámci vlastní infrastruktury.

Proč mít Tableau jako viualizační tool?

U
Unified Star Schema

Přečtěte si o Unified Star Schema přímo od jeho autora Francesca Puppiniho zde.

V
Vizualizace dat (Data Visualization)

Prezentace dat prostřednictvím grafů, grafikonů a dalších vizuálních prvků, aby bylo snadněji porozumět výsledkům analýz.