Váš život, jejich data. Startup nahrává lidi, aby naučil roboty žít.

Mysleli jste si, že sdílení fotek na sítě je vrchol? Omyl. Startup Human Archive platí lidem v Indii za to, aby si na hlavu nasadili kameru a nechali nahrávat svůj den. Cíl? Vytvořit masivní knihovnu lidské zkušenosti, na které se budou učit roboti.

Všichni jsme to viděli. Roboti, co dělají salta. Roboti, co skládají kostky. Působivé. Ale zkuste je pustit ven z laboratoře a nechte je uvařit kafe ve vaší kuchyni. Skončí to katastrofou. Proč? Protože jim chybí to, čemu ajťáci vznešeně říkají „world model“. Chybí jim naprosto základní, intuitivní chápání reality. Fyziky. Kontextu. Toho, že když do něčeho strčíte, spadne to.

Nová ropa? Lidská zkušenost.

Tohle je ten velký bottleneck celého odvětví embodied AI. Můžete mít nejrychlejší NPU čipy na světě, ale bez správných dat jsou vám k ničemu. A ukazuje se, že data, která potřebujete, abyste naučili stroj existovat ve fyzickém světě, se jen tak neválí na internetu. Musíte si je vyrobit.

A tady přichází Human Archive. S nápadem, který je tak přímočarý, až je to geniální. A taky trochu děsivé. Místo aby se snažili simulovat realitu v počítači, jdou a nahrávají ji. V syrové podobě.

Nasaď helmu a jdi pracovat

Princip je jednoduchý. Startup vyzbrojí gig workery v Indii sadou senzorů. Představte si helmu s kamerami, hmatové rukavice, pohybové senzory na těle. A pak je prostě nechají dělat jejich práci. Žít jejich životy. Každý pohyb, každý dotyk, každý pohled z první osoby je pečlivě zaznamenán. Vzniká tak bezprecedentní multimodální datový proud – egocentrické video, stereo hloubka, data z IMU senzorů, síla stisku. Všechno.

Nejsme u nějakého garážového projektu. Bavíme se o firmě z Y Combinatoru, která už má nasazeno přes 1000 těchto setů a vybrala přes 8 milionů dolarů. Jejich dataset HA-Multi si už prý koupily „frontier research teams“. Přeloženo: ty největší AI laby, které se snaží postavit příští generaci umělé inteligence.

Je to vlastně jen logický další krok. Nejdřív jsme z internetu vytěžili veškerý text a obrázky, abychom natrénovali jazykové modely. Když data došla, začalo se mluvit o syntetických datech. Human Archive ale ukazuje jinou cestu. Proč data syntetizovat, když si je můžete nechat levně nahrát? Komodifikace lidské zkušenosti v přímém přenosu.

Co bude dál?

Otevírá to samozřejmě spoustu otázek. O soukromí, o etice, o tom, co se stane s lidmi, kteří poskytují svá data, aby pomohli vytvořit systémy, které je jednou možná nahradí. Human Archive se prezentuje jako firma, co buduje infrastrukturu pro „embodied intelligence“. Architekturu pro roboty, kteří budou schopni se učit a adaptovat v našem světě.

Fascinuje mě ta surová, pragmatická logika Silicon Valley. Máme problém s daty? Fajn, najdeme nejlevnější a nejškálovatelnější zdroj lidské aktivity na planetě a zapojíme ho do našeho datového pipeline. Problém vyřešen.

Budoucnost AI se zjevně nebude psát jen elegantním kódem v Pythonu. Bude postavena na miliardách hodin nahrané reality. Reality, kterou někdo musel prožít. S kamerou na hlavě.