
Trénink velkých AI modelů na videích z internetu naráží na své limity. Chybí jim kontext a přesná data o fyzice. Startup Origin Lab na to jde jinak a nabízí **licencovaná data přímo z herních enginů**, což může být pro trénink prostorového vnímání AI naprostý game-changer.
Současné „world models“ se učí primárně z obrovského množství videí. Problém je, že video je ploché. Je to jen sekvence pixelů. AI se z něj sice naučí rozpoznat, že 'auto jede po silnici', ale absolutně netuší, co je to 'auto', 'silnice' nebo 'jet'.
Je to jako snažit se naučit mechaniku motoru jen sledováním Top Gearu. Vidíte výsledek, ale chybí vám veškerá vnitřní logika, fyzikální zákony a data o komponentech. AI modelům chybí to nejdůležitější – ground truth. Přesná data o tom, co se ve scéně skutečně děje.
Origin Lab přichází s myšlenkou, která je z inženýrského hlediska geniálně přímočará. Místo pasivního sledování videa chtějí AI dát k dispozici kompletní telemetrii z herních enginů jako Unreal nebo Unity. To je zásadní rozdíl.
Telemetrie není jen obraz, který vidí hráč. Jsou to syrová, strukturovaná data. Pozice každého objektu jako vektor, jeho rychlost, hmotnost, jaké síly na něj působí, stav kolizních modelů, a dokonce i vstupy od hráče. Všechno. S časovým razítkem.
AI tak může konečně začít chápat kauzalitu. Vidí nejen, že se postava pohnula, ale dostane k tomu i data: 'vstup od hráče: stisk klávesy W' -> 'aplikovaná síla na model postavy' -> 'výsledná změna pozice v souřadnicovém systému'. Učí se tak přímo fyzikální pravidla daného světa.
Tyto datasety jsou navíc multimodální. Propojují obrazová data (co by viděl hráč) s fyzikálními a stavovými daty. Pro reinforcement learning je to doslova zlatý důl. Agent se může učit v dokonale kontrolovaném prostředí, kde má přístup k absolutní pravdě o každém svém kroku.
Samozřejmě to má i háček. A ne malý. Herní fyzika není reálná fyzika. Je to vždy jen aproximace, často zjednodušená kvůli výkonu a hratelnosti. Model natrénovaný výhradně na datech z her může selhat na nuancích reálného světa, kde neplatí optimalizované rovnice z enginu.
Přesto je to fascinující směr. Místo nekonečného čištění a labelování chaotických dat z webu se tu nabízí cesta čistých, strukturovaných a právně nezávadných datových sad. Je to posun od datového sběračství k datovému inženýrství. A to je pro budoucnost robustních AI systémů naprosto klíčové.