
The Atlantic udělal něco, co se mělo stát už dávno. Zveřejnil prohledávatelnou databázi hudby, na které se trénují generativní AI. Konečně se tak můžeme podívat pod kapotu a zjistit, z jakých „ingrediencí“ se tenhle hype vlastně vaří.
Konečně. Reportér Alex Reisner z The Atlantic se prohrabal čtyřmi obřími datovými sadami a udělal z nich webovou aplikaci. Dvě z nich jsou monstrózní, mluvíme o 12 a 9 milionech skladeb. Další dvě jsou menší, ale pořád jde o statisíce tracků.
Co je to datová sada? Představte si to jako knihovnu pro AI. Než se model naučí generovat hudbu, musí naposlouchat obrovské množství existující hudby, aby pochopil struktury, melodie a rytmy. Tato databáze je v podstatě soupis knih v té knihovně.
Na povrchu to vypadá jako problém startupů typu Suno. Ale kdepak. Přímo Google a Stability AI v akademických publikacích potvrdili, že s těmito daty pracovali. To dává celé věci úplně jiný rozměr.
Nejde o garážové projekty. Jde o základní výzkum a vývoj u firem, které definují celý obor. A teď víme, že jejich modely nestály na nějakých syntetických, čistých datech. Stály na reálné hudbě, včetně té z Free Music Archive a dalších zdrojů s nejasnou licencí pro takové použití.
Není to jen o autorských právech. Pro nás techniky je to fascinující vhled. Dostupnost těchto dat nám umožňuje analyzovat potenciální bias v modelech. Je v datech nadreprezentovaný určitý žánr? Určitá harmonická struktura? To všechno přímo ovlivňuje výstup.
Když víme, že model byl trénován hlavně na datech z FMA, která jsou plná experimentální elektroniky, nemůžeme se divit, že bude mít problém vygenerovat přesvědčivý bluegrass. Tohle není magie, je to statistika postavená na datech, která do systému nasypete. A teď konečně vidíme, co v tom pytli je.