Claude se učí biologii: Anthropic pohlcuje experty za 400 milionů dolarů

Claude se učí biologii: Anthropic pohlcuje experty za 400 milionů dolarů

Akvizice malého startupu Coefficient Bio není jen další velká firemní transakce. Pro Anthropic je to skokový nákup know-how, který má z jejich jazykového modelu Claude udělat nástroj pro modelování komplexních biologických systémů.

Anthropic, firma stojící za LLM Claude, právě investovala zhruba 400 milionů dolarů do akvizice startupu Coefficient Bio. Nejde o nákup produktu nebo zákazníků. Jde o čistý „acquihire“ – nákup týmu a jeho specifických znalostí.

Ten tým má sotva deset lidí. Jádro tvoří bývalí výzkumníci z Genentech, experti na výpočetní biologii. Jejich hodnota nespočívá v psaní běžného kódu. Jejich specializací je překlad chaotických, nestrukturovaných biologických dat do jazyka, kterému může rozumět AI.

Trénovat LLM na textech z internetu je jedna věc. Ale naučit ho chápat interakce proteinů nebo molekulární struktury je úplně jiná disciplína. Je to jako dát stroji hromadu součástek bez manuálu a chtít, aby postavil funkční motor. Tým z Coefficient Bio je ten, kdo píše ten manuál.

Technicky to znamená, že se Anthropic nesnaží jen „přiučit“ Claude pár medicínských termínů. Cílem je pravděpodobně vybudovat specializovanou vrstvu nebo dokonce samostatný foundation model pro biologii. To si vyžádá vše od vlastní tokenizace pro molekuly až po upravené mechanismy pozornosti (attention), které zvládnou analyzovat extrémně dlouhé a komplexní sekvence.

Úkolem takového modelu nebude jen odpovídat na dotazy. Očekává se, že bude provádět inferenci nad novými, neviděnými daty. Tedy predikovat, jak se bude chovat nově navržená molekula léčiva. Z jazykového modelu se tak stává prediktivní vědecký nástroj.

Ta obrovská cena za tak malý tým jen podtrhuje, jak vzácná a cenná je expertíza na pomezí hlubokého učení a tvrdých věd. Pro Anthropic je zjevně rychlejší a levnější koupit hotový mozek, než se ho snažit roky budovat od nuly.