Carvago

ZÍSKÁNÍ A KATEGORIZACE 4,5 MILIONU AUTO INZERÁTŮ Z CELÉ EVROPY KAŽDÝ DEN DÍKY REVOLT.BI.

Zdroj: depositphotos.com

Česká společnost Carvago provozuje velmi úspěšné online tržiště ojetých vozů z celé Evropy. Již dnes nabízí okolo 1 milionu vozů zákazníkům z Česka, Slovenska a Německa. V nejbližší době se dočkají i další evropské země. 

Výzva

Aby těchto cílů v Carvago dosáhli, potřebují každý den najít v celé Evropě nabízené ojeté vozy a zařadit je do své nabídky.

Aby jejich zákazníci mohli kdykoliv najít tu nejvýhodnější nabídku pro vůz, který hledají, je třeba neustále doplňovat databázi o nově nabízené vozy na všech portálech v Evropě. Jejich prodejci přitom často nedostatečně vyplní data o nabízeném autě nebo umístí inzerát zároveň na několik portálů.

Bylo potřeba nejen získat nové inzeráty, ale zároveň odstranit duplicity, opravit chybné informace a klasifikovat všechny nabídky na základě vyčerpávajícího katalogu modelů aut, včetně klíčových parametrů jako motorizace, typ převodovky, náhon apod.

Analýza

Hlavní požadavky na řešení byly následující:

  • Připravit katalog obsahující modely pokrývající 95+ % evropského trhu osobních automobilů včetně klíčových parametrů jako motorizace, typ převodovky, náhon apod.
  • Katalog by se měl automaticky aktualizovat podle externích zdrojů (např. mobile.de, cars-data.com)
  • Vytvořit databázi s aktuální nabídkou vozů na evropském trhu
  • Sebrané inzeráty deduplikovat, přesně přiřadit a klasifikovat na základě katalogu

Analyzovali jsme detailně existující zdroje informací o vozech a inzerátech a identifikovali jsme:

  • 3 000+ různých modelů vozů
  • 250+ značek aut
  • 85 hlavních parametrů vozů
  • 14 hlavních serverů s rozdílnou strukturou dat
  • 4,5 milionu inzerátů přidaných či aktualizovaných každý den
  • Vesměs žádná klasifikace u inzerátů, nejčastěji vše jen ve formě textů či fotografií vozu

Zajímavost: 10 modelů vozů pokryje 37 % trhu.

Řešení

Řešení od Revolt.BI pro Carvago zahrnuje několik součástí:

  • Tvorba datového skladu pro katalog i inzeráty
  • Získávání dat
  • Analýza dat
  • Business analytika

Jako datový sklad a DevOps platformu jsme zvolili Keboola s datovým úložištěm na Snowflake. Rozhodl výborný výpočetní výkon, integrace všech potřebných služeb, diagnostika všech procesů a mnoho dalších výhod řešení Keboola.

Pro automatickou analýzu fotografií (image recognition) používáme deep learning – konvoluční neurální síť (CNN), která je schopna díky sadě algoritmů a technologií identifikovat  objekty a mnoho dalších typů prvků v obraze a jejich analýzou vyvodit závěry, a to při nízkých nákladech. Naše řešení je schopné i opravit chybné informace – např. dle fotografie vozu rozpozná, že se jedná o kombík, i když inzerát uvádí, že se jedná o VAN nebo MPV. Dokonce jsme schopni z fotografie interiéru automaticky rozpoznat i typ klimatizace!

Zajímavost: Pro kvalitní natrénování neurální sítě u jednoho modelu je potřeba 2000 fotografií.

Business analytiku řešíme pomocí Tableau, žádný jiný vizualizační nástroj by nezvládl tak snadno a tak rozličné pohledy na mnoho aspektů fungování Carvago nejen pro samotnou společnost, ale i pro jejich business partnery.

Zajímavost: Pro kvalitní natrénování neurální sítě u jednoho modelu je potřeba 2000 fotografií.

Výsledek

Díky spolupráci s Revolt.BI získalo Carvago unikátní a vždy aktuální data o evropských ojetých vozech, včetně relevantních parametrů a ceny daného vozu, jakož i analytické nástroje pro jejich obchodní využití.

Business analytika od Revolt.BI umožňuje obchodnímu oddělení Carvago i jeho zákazníkům činit datově podložená rozhodnutí, např. cílení nabídky na prodejce podle jejich silných segmentů nebo detailní porovnání nabízených vozů napříč inzertními servery.

Katalog
  • 3 000+ modelů, 250+ značek
  • Kompletní záznamy o klíčových parametrech
  • Automatická kontrola a doplnění neznámých parametrů jako typ karoserie, počet dveří, objem motoru, typ převodovky apod.
  • Možná ruční kontrola a změna položek katalogu
Získávání dat
  • 4,5 milionu inzerátů denně
  • 130 inzertních serverů
  • Deduplikace
  • Zajištěná automatická konzistence dat
  • Možnost manuální kontroly a korekce
  • Párování na položky v katalogu
  • Denní aktualizace, vybraná data, např. aukce, lze aktualizovat i v reálném čase
Analytické nástroje
  • Diagnostika průběhu extrakce dat
  • Nástroj pro rychlé odhalení chyb, podezřelých a nekvalitních inzerátů
  • Kompletní přehled o stavu evropského trhu přes regiony, modely, stáří vozů, cenové hladiny a jiné parametry
  • Identifikace atraktivní nabídky vozů (komplexní posouzení modelu, stáří, vybavenosti), které lze se ziskem prodat, např. v jiných regionech
  • Nástroj pro správné stanovení ceny na základě modelu, stáří, stavu a výbavy