Что такое RAG и зачем он бизнесу
Как работает RAG
RAG (Retrieval-Augmented Generation) — это подход, который позволяет языковой модели отвечать на вопросы, опираясь на ваши документы, а не только на свои обучающие данные.
Шаг 1: Индексация
Документы загружаются в векторную базу данных (мы используем Qdrant). Каждый документ разбивается на фрагменты и превращается в векторное представление с помощью эмбеддинг-модели (BGE-M3).
Шаг 2: Поиск
Когда пользователь задаёт вопрос, он тоже превращается в вектор. Система находит наиболее похожие фрагменты документов в векторной базе.
Шаг 3: Генерация
Найденные фрагменты подаются в языковую модель (DeepSeek или другая LLM) как контекст. Модель генерирует ответ, основываясь на ваших данных.
Почему не просто ChatGPT
ChatGPT не знает ваших внутренних документов. Он может галлюцинировать — придумывать факты. RAG решает обе проблемы: модель отвечает только по вашим данным и даёт ссылки на источники.
Кому нужен RAG
- Компании с большой базой знаний (документация, регламенты, FAQ)
- Службы поддержки — автоматические ответы на частые вопросы
- HR-отделы — ответы сотрудников о политиках компании
- Юридические отделы — поиск по договорам и нормативам