
Velké jazykové modely jsou mistry slova, ale v reálném světě jsou slepé a neohrabané. Startup Human Archive chce tuto bariéru prolomit sběrem masivních datasetů lidského chování, které mají naučit roboty skutečně jednat, nejen mluvit.
Problém současné AI je, že žije v abstraktním světě textů a obrázků. Nechápe fyzikální omezení. Neví, jakou silou uchopit vajíčko, aby neprasklo. Právě tento deficit se Human Archive snaží vyřešit. Jejich přístup je radikálně odlišný od pouhého škrábání dat z internetu.
Jádrem projektu je sběr takzvaných multimodálních dat. Představte si to jako učení se vařit. Nestačí vám jen číst recept (text). Potřebujete vidět, jak šéfkuchař krájí zeleninu (vize), a cítit, jak se hněte těsto (hmat). Human Archive se snaží zachytit všechny tyto smysly najednou.
Technologický stack je fascinující. Operátoři v Indii nosí na míru vyrobený hardware. Nejde jen o kameru na hlavě, která snímá pohled z první osoby (egocentric video). Klíčové jsou další senzory, které data doplňují a synchronizují.
Součástí jsou haptické rukavice snímající dotyk a sílu, IMU jednotky (Inertial Measurement Units) sledující pohyb těla a kamerové náramky. IMU je v podstatě vnitřní ucho robota, které mu říká, jak se tělo pohybuje v prostoru. Stejná technologie, jakou máte v mobilu pro otáčení obrazovky.
Další klíčovou komponentou je RGB-D kamera. Běžná RGB kamera vidí svět placatě. Ta s přídomkem „D“ (Depth) přidává informaci o hloubce. Je to jako by robot měl sonar netopýra. Nevidí jen barvy, ale i vzdálenost objektů, což je zásadní pro navigaci a manipulaci.
Cílem je vytvořit datasety pro takzvané imitační učení (imitation learning). Myšlenka je jednoduchá: robot se naučí složitou úlohu, jako je prostírání stolu, pouhým pozorováním tisíců opakování od člověka. Bez jediného řádku ručně psaného kódu pro každý pohyb.
Zní to skvěle, ale tady přichází na řadu inženýrská skepse. Jak zajistit, že data sbíraná v indických domácnostech budou použitelná pro robota v evropské kuchyni? Rozdílné nástroje, jiné uspořádání, odlišné zvyklosti. To je problém, který se nedá vyřešit jen hrubou silou a terabajty dat.
Human Archive tak nepředstavuje jen další datovou firmu. Je to pokus o vytvoření mostu mezi digitálním mozkem AI a fyzickým světem. Nejde o to nasbírat více dat, ale nasbírat úplně nový typ dat. Takový, který má konečně dát robotům ruce a nohy.