Otec datového skladu Bill Inmon: Vizionář data-driven rozhodování a demokratizace přístupu k datům.

Bill Inmon je autorem prvního článku, první knihy, pořadatelem první konference a přednášejícím prvního kurzu o data warehousingu. Titul “otec datového skladu” a místo v historii business intelligence si tedy zaslouží hned několikrát. Kromě toho do výpočetní techniky přelomu tisíciletí přinesl i myšlenku rozhodování založeného na datech a toho, že rozhodovat na základě dat by měli mít možnost všichni. V listopadu přijíždí na pozvání Revolt BI do Prahy. 

Revolt BI
13. října 2023

Krátká historie datových skladů

V počátcích výpočetní techniky byla data obvykle ukládána v provozních systémech, navržených pro podporu každodenních obchodních operací. Provozní systémy byly optimalizovány pro rychlost a propustnost transakcí, ale nebyly příliš vhodné pro analytické dotazy. 

Tyto rané provozní systémy položily základy moderního výpočetnictví a správy dat. S časem vedla potřeba sofistikovanějších analytických schopností k vývoji specializovaných databází a řešení pro skladování dat, která by mohla zvládnout složité dotazy a podporovat obchodní inteligenci a analýzu dat.

V 80. letech 20. století začaly společnosti budovat datové sklady, aby podpořily své potřeby business intelligence – tedy získávání informací z dat. Datové sklady jsou navrženy pro analytické dotazy a obvykle obsahují historická data, která byla vyčištěna a transformována. Právě v 80. letech přišel Bill Inmon s koncepcí datového skladu.

Bill Inmon o datovém skladu: sbírka dat pro podporu rozhodování

Magazín Computerworld v roce 2007 zařadil Billa Inmona mezi deseti osobností, které nejvíce ovlivnily prvních 40 let počítačového průmyslu. Bill Inmon je považován za otce datových skladů, protože byl jedním z prvních, kteří tento pojem definovali a popularizovali. Ve své knize „Building the Data Warehouse“ z roku 1992 Inmon popsal datový sklad jako „předmětově orientovanou, integrovanou, časově proměnnou a nevolatilní sbírku dat, která je používána pro podporu rozhodování„. 

Datový sklad v pojetí Billa Inmona má tyto výhody:

  • Funguje jako sjednocený zdroj pravdy pro celý podnik, kde jsou všechna data integrována.
  • Má velmi nízkou redundanci dat. To znamená méně možností problémů při aktualizaci dat, což usnadňuje proces datového skladu založený na ETL a snižuje citlivost na selhání.
  • Zjednodušuje podnikové procesy, protože logický model reprezentuje podrobné podnikové objekty.
  • Tento přístup nabízí větší flexibilitu, protože je snazší aktualizovat datový sklad v případě změny požadavků podniku nebo zdrojových dat.
  • Dokáže zpracovat různé požadavky na podnikové reportování na úrovni celého podniku.

Inmonova práce pomohla definovat datové sklady jako klíčovou součást systémů business intelligence (BI). Datové sklady poskytují centrální úložiště pro data z různých zdrojů, což usnadňuje jejich analýzu a vytváření reportů. Inmonův koncept datového skladu, nejdříve identifikuje hlavní oblasti a entity, se kterými podnik pracuje, jako jsou zákazníci, produkty, dodavatelé a podobně. Druhým přístupem k datovým skladům je Kimballův datový model, který navrhuje architektury datového skladu zdola nahoru, při které jsou nejprve vytvořeny data marty na základě požadavků podniku. 

Inmonův přínos v oblasti datových skladů ale nekončí u zavedení pojmu. Pomáhal definovat koncept datového skladu a vyvinul mnoho osvědčených postupů, které se dnes používají. Inmonova práce měla zásadní dopad na způsob, jakým podniky používají data k rozhodování.

  • Definoval koncept datového skladu a jeho klíčové charakteristiky.
  • Definoval termín „government information factory“ (vládní informační továrna) a „data warehousing 2.0“. 
  • Vyvinul metodiku pro budování a správu datových skladů.
  • Vyvinul technologii textual disambiguation.
  • Rozsáhle psal o datových skladech, včetně desítek knih, článků a blogových příspěvků.
  • Přednášel a pořádal workshopy o datových skladech po celém světě.

Inmonova práce pomohla udělat z datových skladů mainstreamovou technologii. Jeho přínosy usnadnily podnikům implementaci datových skladů a využití poznatků, které data mohou poskytnout. První implementace datových skladů byly složité a nákladné a především je využívaly velké podniky. Na začátku 90. let firmy začaly rozumět potenciálu datových skladů pro podporu rozhodování a business intelligence. Do roku 1995 se trh s řešeními pro datové sklady rozrostl na více než 2 miliardy dolarů. (Pro porování: podle společnosti Gartner dosáhl v roce 2022 obratu 15,9 miliardy dolarů a v roce 2023 dosáhne 17,4 miliardy dolarů.)

Business intelligence pro všechny

Inmon je také vizionářem v oblasti BI. Věří, že BI by měla být založena na datových skladech a že by měla být přístupná všem zaměstnancům, nikoli jen analytikům. Inmonova vize BI je založena na následujících principech:

  • Data jsou základem BI. Bez kvalitních dat není možné provádět užitečné analýzy.
  • BI by měla být přístupná všem. Analýza dat by neměla být výsadou analytiků.
  • BI by měla být založena na faktech. Analýzy by měly být založeny na datech, nikoliv na domněnkách.

Bill Inmon naživo na Datapunkers!

Bill Inmon bude hostem Revolt BI na setkání Datapunkers, které se bude konat 13. listopadu v 18.00 v pražském Kině Přítomnost. Na této události “Fathers of modern data warehouse” společně vystoupí s Francesco Puppinim, autorem datové bible, Unified Star Schema. Vstupenky si můžete koupit zde.

Přečtěte si některý z našich dalších článků