Carvago

Získání a kategorizace 4,5 milionu auto inzerátů z celé Evropy každý den díky Revolt.BI.
depositphotos.com

Česká společnost Carvago provozuje velmi úspěšné online tržiště ojetých vozů z celé Evropy. Již dnes nabízí okolo 1 milionu vozů zákazníkům z Česka, Slovenska a Německa. V nejbližší době se dočkají i další evropské země. 

Výzva

Aby těchto cílů v Carvago dosáhli, potřebují každý den najít v celé Evropě nabízené ojeté vozy a zařadit je do své nabídky.

Aby jejich zákazníci mohli kdykoliv najít tu nejvýhodnější nabídku pro vůz, který hledají, je třeba neustále doplňovat databázi o nově nabízené vozy na všech portálech v Evropě. Jejich prodejci přitom často nedostatečně vyplní data o nabízeném autě nebo umístí inzerát zároveň na několik portálů.

Bylo potřeba nejen získat nové inzeráty, ale zároveň odstranit duplicity, opravit chybné informace a klasifikovat všechny nabídky na základě vyčerpávajícího katalogu modelů aut, včetně klíčových parametrů jako motorizace, typ převodovky, náhon apod.

Analýza

Hlavní požadavky na řešení byly následující

  1. Připravit katalog obsahující modely pokrývající 95+ % evropského trhu osobních automobilů včetně klíčových parametrů jako motorizace, typ převodovky, náhon apod.
  2. Katalog by se měl automaticky aktualizovat podle externích zdrojů (např. mobile.de, cars-data.com)
  3. Vytvořit databázi s aktuální nabídkou vozů na evropském trhu
  4. Sebrané inzeráty deduplikovat, přesně přiřadit a klasifikovat na základě katalogu

Analyzovali jsme detailně existující zdroje informací o vozech a inzerátech a identifikovali jsme:

  • 3 000+ různých modelů vozů
  • 250+ značek aut
  • 85 hlavních parametrů vozů
  • 14 hlavních serverů s rozdílnou strukturou dat
  • 4,5 milionu inzerátů přidaných či aktualizovaných každý den
  • Vesměs žádná klasifikace u inzerátů, nejčastěji vše jen ve formě textů či fotografií vozu
Zajímavost: 10 modelů vozů pokryje 37 % trhu.

Řešení

Řešení od Revolt.BI pro Carvago zahrnuje několik součástí

  1. Tvorba datového skladu pro katalog i inzeráty
  2. Získávání dat
  3. Analýza dat
  4. Business analytika

Jako datový sklad a DevOps platformu jsme zvolili Keboola s datovým úložištěm na Snowflake. Rozhodl výborný výpočetní výkon, integrace všech potřebných služeb, diagnostika všech procesů a mnoho dalších výhod řešení Keboola.

Pro automatickou analýzu fotografií (image recognition) používáme deep learning – konvoluční neurální síť (CNN),  která je schopna díky sadě algoritmů a technologií  identifikovat  objekty a mnoho dalších typů prvků v obraze a jejich analýzou vyvodit závěry, a to při nízkých nákladech. Naše řešení je schopné i opravit chybné informace – např. dle fotografie vozu rozpozná, že se jedná o kombík, i když inzerát uvádí, že se jedná o VAN nebo MPV. Dokonce jsme schopni z fotografie interiéru automaticky rozpoznat i typ klimatizace!

Zajímavost: Pro kvalitní natrénování neurální sítě u jednoho modelu je potřeba 2000 fotografií.

Business analytiku řešíme pomocí Tableau, žádný jiný vizualizační nástroj by nezvládl tak snadno a tak rozličné pohledy na mnoho aspektů fungování Carvago nejen pro samotnou společnost, ale i pro jejich business partnery.

Výsledek

Díky spolupráci s Revolt.BI získalo Carvago unikátní a vždy aktuální data o evropských ojetých vozech, včetně relevantních parametrů a ceny daného vozu, jakož i analytické nástroje pro jejich obchodní využití.

Business analytika od Revolt.BI umožňuje obchodnímu oddělení Carvago i jeho zákazníkům činit datově podložená rozhodnutí, např. cílení nabídky na prodejce podle jejich silných segmentů nebo detailní porovnání nabízených vozů napříč inzertními servery.

Katalog

  • 3 000+ modelů, 250+ značek
  • Kompletní záznamy o klíčových parametrech
  • Automatická kontrola a doplnění neznámých parametrů jako typ karoserie, počet dveří, objem motoru, typ převodovky apod.
  • Možná ruční kontrola a změna položek katalogu

Získávání dat

  • 4,5 milionu inzerátů denně
  • 130 inzertních serverů
  • Deduplikace
  • Zajištěná automatická konzistence dat
  • Možnost manuální kontroly a korekce
  • Párování na položky v katalogu
  • Denní aktualizace, vybraná data, např. aukce, lze aktualizovat i v reálném čase

Analytické nástroje

  • Diagnostika průběhu extrakce dat
  • Nástroj pro rychlé odhalení chyb, podezřelých a nekvalitních inzerátů
  • Kompletní přehled o stavu evropského trhu přes regiony, modely, stáří vozů, cenové hladiny a jiné parametry
  • Identifikace atraktivní nabídky vozů (komplexní posouzení modelu, stáří, vybavenosti), které lze se ziskem prodat, např. v jiných regionech
  • Nástroj pro správné stanovení ceny na základě modelu, stáří, stavu a výbavy


CZ flagUK flag