Одобрение кредита на десятки миллионов рублей, перевод денег на счёт, закрытие сделки — и ни один живой человек не прочитал ни одного документа. В Сбербанке розничные кредиты одобряются алгоритмом автономно, со 100% охватом. Это уже не эксперимент, а повседневная работа.
80% расходов — на чтение бумаг
Классическая банковская экономика работает по принципу Парето наоборот: на обслуживание 20% самых сложных процессов (обработка документов) уходит до 80% операционных расходов. Целая армия бэк-офиса читает договоры, сверяет цифры в паспорте с базой, переносит данные из одной таблицы в другую. Медленно, дорого и с неизбежными ошибками.
IDP вместо OCR: разница между студентом и юристом
Банки оцифровывают документы десятилетиями. Традиционный OCR переводит пиксели в символы: видит закорючку, понимает — буква «А». Но для алгоритма это набор знаков без смысла. Он не знает, что цифра означает процентную ставку или срок кредита.
Технология IDP (интеллектуальная обработка документов) работает иначе. Подключается NLP: модель анализирует пространственное расположение текста на листе и контекст. Если слово «сумма» стоит рядом с абзацем об ответственности сторон, это лимит по неустойке, а не сумма основного долга. Система извлекает сущности (даты, имена, скрытые условия) даже из нестандартных контрактов в свободной форме.
Сбербанк вместе со СколТехом улучшил точность нейросетей под банковскую специфику. В масштабах макроэкономики рост точности распознавания на 1% — это снижение числа дефолтов, а значит миллиарды рублей экономии.
Скоринг по паспорту: пример банков Таджикистана
Олив Банк и Эсхата научили модели скоринга выдавать микрокредиты по одному паспорту. Без справок о доходах и выписок. ИИ компенсирует нехватку прямых данных анализом косвенных: данные операторов связи, история транзакций, поведенческие паттерны. Агрегирует в единый профиль и принимает решение.
В ВТБ пошли дальше: цифровой помощник андеррайтера собирает данные из открытых и закрытых источников и кладёт на стол готовое структурированное резюме. Раньше специалист тратил на это часы.
Почему банки разворачивают серверы у себя
Серверное оборудование с мощными GPU стоит десятки миллионов, а в условиях санкций — ещё и доставляется с трудом. Зачем?
Регуляторика. ФЗ-115 (противодействие отмыванию доходов), требования ЦБ по защите критической инфраструктуры, кодекс этики в сфере ИИ от ЦБ РФ (июль 2025). Передача персональных данных клиентов или банковской тайны в публичные облачные API — прямое нарушение закона и путь к отзыву лицензии. ЦБ не позволит отдать скоринг граждан в «чёрный ящик», который крутится неизвестно где.
Единственный путь — локальное развёртывание: открытые языковые модели на серверах внутри физически изолированного контура. Модель дообучается на исторических данных банка, ни один байт не покидает периметр.
Экономика. По исследованию из базы arXiv, порог окупаемости — 50 млн токенов в месяц. Это примерно 35–40 млн слов, или обработка пары тысяч сложных кредитных досье. Федеральный банк с тысячами отделений генерирует такой объём за одно утро. При такой нагрузке локальное железо для небольших моделей окупается за несколько месяцев, для крупных — за 2–5 лет.
KYC и антифрод: 95% ложных срабатываний
Традиционные системы мониторинга работают на жёстких правилах. ИП зарегистрировался неделю назад и перевёл миллион на счёт физлица — блокировка. Логично, но из-за такой топорной логики доля ложных срабатываний (false positives) в старых системах достигает 90–95%. Служба безопасности разбирает каждую транзакцию вручную: звонки клиентам, запросы документов. Парализуется бэк-офис, раздражается добросовестный бизнес.
Графовые нейронные сети анализируют транзакцию не изолированно. Они видят всю топологию платежей на несколько уровней вглубь: деньги дробятся на 50 счетов, проходят через цепочку фирм-однодневок и оседают на крипто-кошельке. Система выявляет скрытую аффилированность и истинных бенефициаров — то, что человек в Excel-таблице не заметит.
В Сбере работают более 100 ИИ-моделей только в сфере кибербезопасности. Один из проектов: ИИ-ассистенты, которые распознают звонки телефонных мошенников и «заболтывают» их — притворяются доверчивым собеседником, тратя время злоумышленника. Стратегия ломает экономику мошенничества, сжигая самый ценный ресурс — время.
Банк Точка: предсказание блокировки счёта
Точка перевернула подход к комплайнсу. Локальная модель анализирует операции клиента и предсказывает, что ФНС заблокирует счёт — до того, как это случится. Банк присылает уведомление: «Ваша активность выглядит рискованно для налоговой. Вот что исправить в отчётности прямо сейчас».
Жёсткий орган контроля внутри банка превращается в налогового консультанта. ИИ-ассистент Точки выполняет 57 бизнес-сценариев: платежи, депозиты, переводы. Клиент пишет в свободной форме «Переведи остатки с текущего счёта на депозит на три месяца» — модель распознаёт намерение, извлекает параметры (сумму, срок) и через внутренние API формирует поручение. Клиенту остаётся нажать «Подтвердить».
Кибер-суфлёр ВТБ: RAG в контакт-центре
Банковские продукты меняются ежедневно: тарифы, условия, акции. Оператор колл-центра физически не может держать всё в голове. Проект ВТБ «Кибер-суфлёр» использует RAG (retrieval-augmented generation) и локальную LLM.
Как работает: клиент задаёт вопрос — система переводит запрос в векторы, ищет актуальную информацию в выверенной базе знаний банка, вытаскивает нужный документ (например, свежий тариф) и загружает в контекстное окно модели. Модель формирует ответ строго на основе этого документа — галлюцинации исключены архитектурно.
Оператор видит на экране готовую подсказку. Время консультации сократилось на 35%, точность ответов на старте — 85% (цель — 95%). AI-контроллёр расшифровывает 100% звонков в текст и оценивает по чеклисту: решена ли проблема, соблюдён ли тон. Производительность контроля качества выросла на 90%.
Сентимент-анализ в реальном времени: система отслеживает скорость печати в чате, лексику, капслок, при звонке — интонацию и паузы. Если фиксируется негатив, обращение повышается в приоритете и переводится на живого сотрудника.
Цифры: ROI локального ИИ в банках
| Банк | Метрика | Результат |
|---|---|---|
| Сбербанк | Возврат на 1 ₽ инвестиций в ИИ | 6,70 ₽ (цель — 8 ₽) |
| ВТБ | Стоимость риска | 0,9% (эталонный уровень) |
| ВТБ | Ускорение консультаций | 35% |
| ВТБ | Рост контроля качества | 90% |
| Точка | Бизнес-сценарии ИИ-ассистента | 57 |
Метафинансы: битва алгоритмов
Когда технологии открытого банкинга (Open API) станут повсеместными, а локальный ИИ выйдет за периметр одного банка, появятся независимые ИИ-агрегаторы — личные финансовые советники в смартфоне. Агрегатор видит все счета, карты и кредиты пользователя в десятках банков. Банк А поднял ставку по депозиту на 0,1% — агрегатор за миллисекунды переводит свободные средства туда.
Банкам придётся конкурировать за благосклонность алгоритмов, которые невозможно обмануть рекламным баннером или кэшбэком на кофе. Сможет ли классическая финансовая система адаптироваться к миру, где лояльность к бренду ничего не значит для строчки кода, — вопрос ближайшего десятилетия.
Какую конфигурацию выбрать для банка
| Задача | Конфигурация Чудо 3 | Цена с предустановкой |
|---|---|---|
| RAG для контакт-центра, модели 14B | 1× RTX 5080 | от 385 442 ₽ |
| Скоринг, антифрод, модели 30–70B | 2× RTX 5090 | от 1 357 305 ₽ |
| IDP, параллельная обработка тысяч документов | ЛЕВИАФАН | от 3 500 000 ₽ |
Данные не покидают периметр — архитектурно, на уровне железа. Все конфигурации поставляются с предустановленной нейросетью, веб-интерфейсом и базой знаний.
Нужна помощь с внедрением и настройкой RAG под документы банка — есть пакет полного внедрения за 450 000 ₽.
Все 16 конфигураций → · Тарифы и калькулятор → · Связаться →