RAGи часто проигрывают точному поиску цитат

RAGи почти всегда плохо работают. Лучше, когда агент ищет конкретную цитату, а не «смысл».

Когда агент достаёт ответ из базы знаний, у него, образно, два инструмента.
а) Векторный поиск (RAG) — груда книг на полу: все рядом, в одной куче, ищешь «на ощупь» по семантической близости.
б) Полнотекстовый поиск — шкаф с ярлыками: открываешь нужную полку и читаешь точную цитату.

Лучший способ организовать такой шкаф — obsidian-like хранилище. Например: https://github.com/kepano/kepano-obsidian

Сначала, в условиях когда все вокруг тащились от RAGов казалось, что это изобретаю велосипед. Но в марте Брис Черный из Anthropic объяснил: ранние Claude Code тоже строили на векторной базе, но обычный grep «уделал её в тестах». В апреле Karpathy назвал такую архитектуру LLM Wiki: вместо RAG поиска — обычный wiki, который агент читает.

Если базу всё-таки нужно строить серьёзно — гибрид «полнотекстовый + векторный» поднимает точность с 65–78% до 91% (LLM при этом сама пишет поисковые запросы). Это рабочая архитектура 2026 года.

Главное: «умный» поиск не всегда лучше простого. Иногда надо дать агенту просто прочитать документы.

newsletter.pragmaticengineer.com/p/building-claude-code-with-boris-cherny

#агенты #инструменты

Обсудим ИИ-трансформацию вашей компании.