Carvago

Získání a kategorizace 4,5 milionů auto inzerátů z celé Evropy každý den díky Revolt.BI.

Česká společnost Carvago je provozuje velmi úspěšné online tržiště ojetých vozů z celé Evropy. Již dnes nabízí okolo 1 milionů vozů zákazníkům z Česka, Slovenska a Německa, v nejbližší době se dočkají i další Evropské země. 

Výzva

Aby těchto cílů v Carvago dosáhli, potřebují každý den najít v celé Evropě nabízené ojeté vozy a zařadit je do své nabídky.

Aby jejich zákazníci mohli kdykoliv najít tu nejvýhodnější nabídku pro vůz, který hledají, je třeba neustále doplňovat databázi o nově nabízené vozy na všech portálech v Evropě. Jejich prodejci přitom často nedostatečně vyplní data o nabízeném autě, a nebo umístí inzerát zároveň na několik portálů.

Bylo potřeba nejen získat nové inzeráty, ale zároveň odstranit duplicity, opravit chybné informace a klasifikovat všechny nabídky na na základě vyčerpávajícího katalogu modelů aut, vč. klíčových parametrů jako motorizace, typ převodovky, náhon apod.

Analýza

Hlavní požadavky na řešení byly následující

  1. Připravit katalog obsahující modely pokrývající 95+ % evropského trhu osobních automobilů vč. klíčových parametrů jako motorizace, typ převodovky, náhon apod.
  2. Katalog automaticky se aktualizovat podle externích zdrojů (např. mobile.de, cars-data.com,)
  3. Vytvořit databázi s aktuální nabídkou vozů na evropském trhu.
  4. Sebrané inzeráty deduplikovat, přesně přiřadit a klasifikovat na základě katalogu.

Analyzovali jsme detailně existující zdroje informací o vozech a inzerátech a identifikovali jsme 

  • 3000+ různých modelů vozů
  • 250+ značek aut
  • 85 hlavních parametrů vozů
  • 14 hlavních serverů s rozdílnou strukturou dat
  • 4,5 milionu inzerátů přidaných či aktualizovaných každý den
  • vesměs žádná klasifikace u inzerátů, nejčastěji vše jen ve formě textů či fotek vozu
Zajímavost: 10 modelů vozů pokryje 37 % trhu.

Řešení

Řešení od Revolt.BI pro Carvago zahrnuje několik součástí

  1. tvorbu datového skladu pro katalog i inzeráty
  2. získávání dat
  3. analýza dat
  4. business analytika

Jako datový sklad a DevOps platformu jsme zvolili Keboola s datovým úložištěm na Snowflake. Rozhodly výborný výpočetní výkon, integrace všech potřebných služeb, diagnostika všech procesů a mnoho dalších výhod Kebooly.

Pro automatickou analýzu fotografií (image recognition) používáme deep learning – konvoluční neurální síť (CNN),  která je schopna díky sadě algoritmů a technologií  identifikovat  objekty a mnoho dalších typů prvků v obraze a jejich analýzou vyvodit závěry, a to při nízkých nákladech. Naše řešení je schopno i opravit chybné informace – např. dle fotografie vozu rozpozná, že se jedná o kombík, i když inzerat uvádí, že sa jedná o VAN nebo MPV. Dokonce jsme schopni z fotografie interiéru automaticky rozpoznat i typ klimatizace!

Zajímavost: Pro kvalitní natrénování neurální sítě u jednoho modelu je potřeba 2000 fotografií.

Business analytiku řešíme pomocí Tableau, žádný jiný vizualizační nástroj by nezvládl tak snadno tak rozličné pohledy na mnoho aspektů fungování Carvago nejen pro samotnou společnost, ale i pro jejich business partnery.

Výsledek

Díky spolupráci s Revolt.BI získalo Carvago unikátní a vždy aktuální data o evropských ojetých vozech, včetně relevantních parametrů a ceny daného vozu, jakož i analytické nástroje pro jejich obchodní využití.

Business analytika od Revolt.BI možňuje obchodnímu odělení Carvago i jeho zákazníkům dělat datově podložená rozhodnutí, např. cílení nabídky na prodejce podle jejich silných segmentů nebo detailní porovnání nabízených vozů napříč inzertními servery.

Katalog

  • 3000+ modelů 250+ značek
  • kompletními záznamy o klíčových parametrech.
  • automatickou kontrolu a doplnění neznámých parametrů jako typ karoserie, počet dveří, objem motoru, typ převodovky apod.
  • možná ruční kontrola a změna položek katalogu

Získávání dat

  • 4,5 milionů inzerátů denně
  • 130 inzerních serverů
  • deduplikace
  • zajištěná automatická konzistence dat
  • možnost manuální kontroly a korekce
  • párování na položky v katalogu
  • denní aktualizace, vybraná data, např. aukce, lze aktualizovat i v reálném čase

Analytické nástroje

  • diagnostika průběhu extrakce dat
  • nástroj pro rychlé odhalení chyb, podezřelých a nekvalitních inzerátů
  • kompletní přehled o stavu evropského trhu přes regiony, modely, stáří vozů, cenové hladiny a jiné parametry
  • identifikace atraktivní nabídky vozů (komplexní posouzení modelu, stáří, vybavenosti), které lze se ziskem prodat, např. v jiných regionech
  • nástroj pro správné stanovení ceny na základě modelu, stáří, stavu a výbavy


CZ flagUK flag