NSA a Anthropic: AI model Mythos pro automatizované hackování

Zprávy o tom, že Anthropic pomáhá NSA nasadit specializovaný AI model pro ofenzivní kyberoperace, nejsou jen dalším buzzwordem. Jde o fundamentální posun, kde se teoretická schopnost AI mění v nástroj pro aktivní útok. Technická realita je ale složitější než marketingové proklamace.

Ofenzivní AI není chatbot

Informace, že inženýři z Anthropic sedí přímo v NSA a pomáhají implementovat model Mythos, je třeba brát vážně. Neřešíme tady generování obrázků. Cílem je automatizovaná analýza kódu, hledání zranitelností a v ideálním případě i generování funkčních exploitů.

Zapomeňte na obecné LLM. Mythos musí být trénovaný na specifickém, vysoce technickém korpusu dat. Mluvíme o milionech řádků kódu z open-source projektů, o databázích známých zranitelností (CVE), ale dost možná i o neveřejných datech z minulých operací. Kvalita a diverzita těchto dat je naprosto klíčová.

Analogie: Architekt a demoliční expert

Chápat, v čem je to těžké, pomůže jednoduchá analogie. Najít zranitelnost je jako když architekt v cizím plánu budovy najde statickou chybu – třeba špatně navržený nosník. Je to složité, ale je to analytická práce. Napsat funkční exploit je ale práce demoličního experta.

Ten musí vymyslet, jak a kam přesně umístit nálož, aby se kvůli tomu jednomu vadnému nosníku kontrolovaně zřítila celá struktura. A to bez toho, aby poškodil okolí. Přesně to dělá exploit – zneužívá jednu malou chybu k převzetí kontroly nad celým systémem. A to je o řád komplexnější problém.

Kopilot, ne autonomní hacker

Zprávy mluví o „autonomním generování“. Z inženýrského pohledu je to vysoce nepravděpodobné. Realističtější scénář je, že Mythos funguje jako extrémně výkonný kopilot pro elitní operátory. Pomáhá jim prohledávat gigantické codebase rychlostí, která je pro člověka nemyslitelná.

Model může navrhnout hypotézu: „Tato funkce v kombinaci s tímto vstupem by mohla vést k buffer overflow.“ Může dokonce vygenerovat kostru kódu pro proof-of-concept. Finální doladění, přizpůsobení pro konkrétní architekturu a obejití moderních bezpečnostních mechanismů (jako ASLR nebo DEP) ale stále zůstává na člověku.

Technické limity a rizika

Největší výzvou je spolehlivost. Halucinace, která je u chatbotů jen otravná, je zde fatální. Model, který si vymyslí neexistující zranitelnost, plýtvá časem operátorů. Model, který vygeneruje nestabilní exploit, může shodit cílový systém nebo zanechat stopy.

Ověřování výstupů takového systému je samo o sobě netriviální disciplína. Každý vygenerovaný kód musí projít extrémně přísným testováním v sandboxovaném prostředí. Nasazení AI do ofenzivních operací není o stisknutí tlačítka, ale o vybudování celého ekosystému pro validaci, testování a bezpečné použití jejích výstupů.