Vykuchaná AI: Podívejte se, čím Google a další krmí své hudební modely

Vykuchaná AI: Podívejte se, čím Google a další krmí své hudební modely

The Atlantic udělal něco, co se mělo stát už dávno. Zveřejnil prohledávatelnou databázi hudby, na které se trénují generativní AI. Konečně se tak můžeme podívat pod kapotu a zjistit, z jakých „ingrediencí“ se tenhle hype vlastně vaří.

Černá skříňka dostala okno

Konečně. Reportér Alex Reisner z The Atlantic se prohrabal čtyřmi obřími datovými sadami a udělal z nich webovou aplikaci. Dvě z nich jsou monstrózní, mluvíme o 12 a 9 milionech skladeb. Další dvě jsou menší, ale pořád jde o statisíce tracků.

Co je to datová sada? Představte si to jako knihovnu pro AI. Než se model naučí generovat hudbu, musí naposlouchat obrovské množství existující hudby, aby pochopil struktury, melodie a rytmy. Tato databáze je v podstatě soupis knih v té knihovně.

Nejde jen o Suno, ale i o Google

Na povrchu to vypadá jako problém startupů typu Suno. Ale kdepak. Přímo Google a Stability AI v akademických publikacích potvrdili, že s těmito daty pracovali. To dává celé věci úplně jiný rozměr.

Nejde o garážové projekty. Jde o základní výzkum a vývoj u firem, které definují celý obor. A teď víme, že jejich modely nestály na nějakých syntetických, čistých datech. Stály na reálné hudbě, včetně té z Free Music Archive a dalších zdrojů s nejasnou licencí pro takové použití.

Technická transparentnost, ne právní bitva

Není to jen o autorských právech. Pro nás techniky je to fascinující vhled. Dostupnost těchto dat nám umožňuje analyzovat potenciální bias v modelech. Je v datech nadreprezentovaný určitý žánr? Určitá harmonická struktura? To všechno přímo ovlivňuje výstup.

Když víme, že model byl trénován hlavně na datech z FMA, která jsou plná experimentální elektroniky, nemůžeme se divit, že bude mít problém vygenerovat přesvědčivý bluegrass. Tohle není magie, je to statistika postavená na datech, která do systému nasypete. A teď konečně vidíme, co v tom pytli je.