
Как Uber скинул тысячи счетов на LLM
— и чему это учит
Задача: поставщики присылают PDF-счета на почту. Нужно вручную извлекать поля: кто, сколько, за что. Uber автоматизировал это через LLM.
Архитектура:
— PDF в картинку, OCR для распознавания текста
— LLM извлекает нужные поля из текста
— Сотрудник проверяет результат (human-in-the-loop)
Результаты: точность ~90%, ручная обработка сократилась вдвое, время обработки — на 70%.
Что интересно:
- дообученный опенсорс проиграл промптингу.
- проект окупается только как платформа. AI-команда не должна делать один проект по автоматизации счетов. Должна быть платформа: как писать промпты, оценивать качество, собирать датасеты, деплоить и мониторить. Тогда она масштабируется на все документы компании.
- уже от меня. Я бы и OCR убрал, vision модели сейчас выигрывают у классических OCR в качестве распознавания информации на документах
Хороший пример внедрения LLM.