RAG

Что такое RAG и зачем он бизнесу

Евгений К. 18 Марта 2026

Как работает RAG

RAG (Retrieval-Augmented Generation) — это подход, который позволяет языковой модели отвечать на вопросы, опираясь на ваши документы, а не только на свои обучающие данные.

Шаг 1: Индексация

Документы загружаются в векторную базу данных (мы используем Qdrant). Каждый документ разбивается на фрагменты и превращается в векторное представление с помощью эмбеддинг-модели (BGE-M3).

Шаг 2: Поиск

Когда пользователь задаёт вопрос, он тоже превращается в вектор. Система находит наиболее похожие фрагменты документов в векторной базе.

Шаг 3: Генерация

Найденные фрагменты подаются в языковую модель (DeepSeek или другая LLM) как контекст. Модель генерирует ответ, основываясь на ваших данных.

Почему не просто ChatGPT

ChatGPT не знает ваших внутренних документов. Он может галлюцинировать — придумывать факты. RAG решает обе проблемы: модель отвечает только по вашим данным и даёт ссылки на источники.

Кому нужен RAG

Компании с большой базой знаний (документация, регламенты, FAQ)
Службы поддержки — автоматические ответы на частые вопросы
HR-отделы — ответы сотрудников о политиках компании
Юридические отделы — поиск по договорам и нормативам