
Uber odhalil plán, jak využít svou obrovskou flotilu aut k systematickému sběru dat. Nejde o navigaci, ale o trénink AI pro autonomní řízení, které se stále potýká s řešením okrajových a nečekaných situací.
Technologický ředitel Uberu, Praveen Neppalli Naga, potvrdil směr, o kterém se v kuloárech mluvilo. Projekt AV Labs se rozšiřuje a jeho cílem je přeměnit miliony vozidel partnerů na distribuovanou senzorovou síť.
Cíl je jasný. Získat masivní objem dat z reálného světa. Nejde přitom o data, která sbírá běžná aplikace. Mluvíme o osazení aut lidary, radary a kamerami, které budou nepřetržitě skenovat okolí.
Proč? Protože autonomní systémy narážejí na svůj limit. Tím jsou takzvané „long-tail“ scénáře. Představte si to jako statisticky vzácné, ale kritické události. Dítě, které vběhne do silnice za kutálejícím se míčem, nebo nečekaně otevřené dveře zaparkovaného auta.
Právě na tyto situace nemají AI modely dostatek trénovacích dat. Simulátory jsou fajn, ale realita je nepředvídatelná. Uber chce tento problém řešit hrubou silou: sběrem petabajtů dat z milionů kilometrů, které jejich řidiči denně najedou.
Technicky to funguje tak, že software od partnerských AV firem poběží v takzvaném „shadow mode“. To znamená, že auto řídí člověk, ale AI na pozadí vyhodnocuje situaci a její rozhodnutí se porovnávají s reálnou akcí řidiče.
Jakmile dojde k diskrepanci – tedy když se AI rozhodne jinak než člověk – je tento záznam označen a odeslán k analýze. Inženýři tak dostanou přesně ty kritické momenty, které potřebují k ladění a přetrénování modelů.
Uber v podstatě vytváří datový trh. Nabízí přístup k surovým i anotovaným datům z reálného provozu, což je pro menší firmy vyvíjející autonomní technologie zlatý důl. Získat takový objem dat vlastní flotilou je extrémně nákladné.
Zůstává samozřejmě otázka soukromí a technické implementace v takovém měřítku. Ale jako technický koncept je to logický krok, jak se pokusit prolomit bariéru, na kterou autonomní řízení naráží už roky.