Co znamená RAG (Retrieval-Augmented Generation)?

RAG, neboli "generování rozšířené o vyhledávání", je pokročilá technika, která řeší jeden z největších problémů velkých jazykových modelů (LLM) – jejich tendenci k halucinacím a neznalosti aktuálních či privátních dat. V praxi RAG propojuje LLM s externí, ověřenou znalostní bází (například interní firemní dokumentací, databází produktů nebo právními předpisy).

Princip je elegantní. Když uživatel položí dotaz, systém ho nejprve nepředá přímo jazykovému modelu. Místo toho provede "vyhledávací" krok (Retrieval): prohledá připojenou databázi a najde v ní nejrelevantnější úryvky informací související s dotazem. Teprve potom tyto konkrétní, faktické úryvky spolu s původním dotazem předá jazykovému modelu, který dostane jediný úkol: "Na základě těchto poskytnutých informací zformuluj odpověď" (Generation).

Tímto přístupem se dramaticky snižuje riziko, že si AI začne vymýšlet. Je donucena pracovat s konkrétními, ověřenými fakty, nikoliv jen se statistickými vzorci ze svých obrovských trénovacích dat. RAG tak umožňuje vytvářet mnohem spolehlivější a užitečnější AI nástroje, jako jsou firemní chatboti, kteří odpovídají pouze na základě interních směrnic, nebo asistenti, kteří mají přístup k nejnovějším technickým manuálům, o kterých model při svém tréninku nikdy neslyšel.