Главная / Блог

Блог

RAGи часто проигрывают точному поиску цитат

Почему агентам часто полезнее полнотекстовый поиск и читаемая база знаний, чем один только семантический RAG.

RAGи часто проигрывают точному поиску цитат

RAGи почти всегда плохо работают. Лучше, когда агент ищет конкретную цитату, а не «смысл».

Когда агент достаёт ответ из базы знаний, у него, образно, два инструмента.
а) Векторный поиск (RAG) — груда книг на полу: все рядом, в одной куче, ищешь «на ощупь» по семантической близости.
б) Полнотекстовый поиск — шкаф с ярлыками: открываешь нужную полку и читаешь точную цитату.

Лучший способ организовать такой шкаф — obsidian-like хранилище. Например: https://github.com/kepano/kepano-obsidian

Сначала, в условиях когда все вокруг тащились от RAGов казалось, что это изобретаю велосипед. Но в марте Брис Черный из Anthropic объяснил: ранние Claude Code тоже строили на векторной базе, но обычный grep «уделал её в тестах». В апреле Karpathy назвал такую архитектуру LLM Wiki: вместо RAG поиска — обычный wiki, который агент читает.

Если базу всё-таки нужно строить серьёзно — гибрид «полнотекстовый + векторный» поднимает точность с 65–78% до 91% (LLM при этом сама пишет поисковые запросы). Это рабочая архитектура 2026 года.

Главное: «умный» поиск не всегда лучше простого. Иногда надо дать агенту просто прочитать документы.

newsletter.pragmaticengineer.com/p/building-claude-code-with-boris-cherny

#агенты #инструменты

Этот пост впервые вышел в Telegram-канале @zvasilchannel 16 мая 2026. На сайте — для архива и поиска.
Открыть в Telegram →

КОНТАКТЫ

Обсудим ИИ-трансформацию вашей компании.

Отвечаю в Telegram. Быстро поймём, где ИИ может дать эффект, какой формат подойдёт руководителю или команде и с чего начать без лишней сложности.

Менторская консультация

60 000 ₽

  • Диагностика процессов и задач под ИИ
  • Выбор первых внедрений с понятным эффектом
  • Подбор инструментов: Искработ, модели, сервисы и автоматизации
  • План действий на 30 / 60 / 90 дней
Записаться