16.03.2026, 12:30:00

Стоит ли делать ИИ-агента для поддержки самим в 2026?

Стоит ли делать ИИ-агента для поддержки самим в 2026?

Делать самим или взять готовое?

Вопрос, который мучает сегодня почти всех, кто думает об ИИ и ИИ-агентах в поддержке.

Ещё вчера мы твердили заученный универсальный рецепт — фокусируйся только на ключевой ценности, всё остальное выноси на аутсорс. Но за пару лет мир изменился: новые модельки действительно умнее предыдущих, вайб-кодинг перестал быть дорогой игрушкой и начал давать реальную ценность, джуны в панике, а SaaS хоронит каждый второй.

Дак поменялось ли что-то в одном из самых холиварных вопросов всех времён в 2026 году? Стоит ли тратить силы и время на собственных агентов?

Попробуем разобраться и начнём с треда, который недавно попался мне на глаза: • Davis from Youform & OneUp © @mynameis_davis - Mar 10.png

Неужели компания Replit, которая создаёт целую инфраструктуру под ИИ-агентов, не может быстро собрать собственного ИИ-агента или даже целую платформу для поддержки пользователей?

К обсуждению подключился основатель и CEO сервиса Plain – ИИ-поддержка для B2B-компаний – и привёл очень интересную аргументацию — способность что-то накодить не всегда является 1:1 тем, что даёт ценность бизнесу, а ценность для бизнеса заключается в том, что вы берете его проблему или проблемы на себя.

Ценность для бизнеса заключается в том, что вы берёте часть его проблем на себя

5 неочевидных, сразу пришедших на ум проблем, о которых вы возможно не задумываетесь:

  1. Аутлук отображает письмо не так как другие клиенты. Поддержка корректного отображения ваших писем во всех почтовых клиентов теперь ваша проблема.
  2. Хотите понять медианное время фоллоу-апов по тикетам, которые сломали ваш SLA? Хранение и обработка событий, парсинг, расчёт метрики и графики теперь ваша проблема.
  3. ИИ придумал ответ? Галлюцинации, эвалы и гардрейлы теперь ваша проблема.
  4. Хотите, чтобы ИИ обучался по хорошим И плохим ответам. Создание пайплайна данных для обучения теперь ваша проблема.
  5. Клиент 10 раз открывает один и тот же тикет в разных каналах: на сайте, в почте и Максе? Дедупликация и объединение таких пикетов теперь ваша проблема.
 Вайб-кодинг крутой, но вопрос не в том, сможете ли вы закодить решение, вопрос — задумываетесь ли вы обо всех описанных проблемах в самом начале, «чувствуете» ли вы их и как планируете их решать.

Аналогичная ситуация с ИИ-агентами в 2026 — рынок даёт кучу возможностей для быстрого старта, но что дальше?

Начнём с самого простого, но не самого очевидного — вайб-кодинг, ИИ-кодинг, курсоры и клод коды важны, но кто владеет вашим продуктом, кто определяет требования, кто принимает работу, кто определяет приоритеты и говорит что правильно, а что гарантированное не нужно и вторично? ИИ может помочь вам автоматизировать написание кода, но вряд ли поможет с сутью вещей, тем более сделанных на заказ для вас и под вас, а найти фулл-стеков с опытом управления продуктом дорого стоит.

Вопрос 1 — у вас есть проектная команда для собственного решения?

Идём дальше — вы быстро собрали базовую версию ИИ-агента со всеми любимым РАГом и он даже что-то отвечает. Та-да!!! Но почти сразу же вы стали присматриваться к ответам и всё больше и больше погружаться в кроличью нору бесконечных деталей, которые важны. Здесь я предполагаю, что вы — это продакт оунер и предыдущая проблема решена, а программист, кстати, в это время ждёт и может быть даже нервничает, а может уже переключился или не знает переключаться ему или нет на другую задачу. Но пока мы созерцаем и размышляем, вопрос не решится сам по себе — что делать с «вот тут не так и тут не очень» ответами?

Вопрос 2 — у вас есть готовые пайплайны и инструменты оценки и улучшения качества ответов?

Агент работает и уже отвечает с приемлемым качеством, и мы даже не будем обсуждать, как вы этого добились и при чём здесь скорость света, но вдруг он перестаёт отвечать, непонятно по какой причине. Может быть кончились деньги на балансе провайдера LLM? А может быть мы упёрлись в диск при очередном сохранении эмбеддинга, а может быть поменялся контракт АПИ-вызова провайдера модели и температура теперь не поддерживается для ризонинг моделей?

Вопрос 3 — у вас есть человек, который контролирует надежность и отказоустойчивость сервиса для ваших клиентов?

До сих пор мы не касались технических деталей и непосредственной разработки. Вызов принят. Итак, у вас большая БЗ: сайты, инструкции, нормативные документы, заметки в ворде и эксель, стихийные маркдаун-выгрузки. Вы готовы загружать и поддерживать все форматы? Перефразируя основателя Плейна, теперь это ваша проблема. Окей, загрузили, но продакт оунер, который предположим есть, и саппорты жалуются, что агент использует устаревшую информацию — очевидно, нам нужны обновления базы. Обновлять регулярно? Вручную? Весь источник или постранично? Это создаст нагрузку на сервера? Обновлять вообще всё или пересчитывать контрольные суммы и обновлять только изменившиеся и новые статьи? Эмбеддинги не вырастут? По ним вообще нужен индекс?

Вопрос 4 — у вас есть человек c живым опытом продвинутого RAG?

Ок, данные обновляются, пайплайн построен, в процессе вам пришлось следить за серверами и возможно даже вынести очередь обновлений на отдельную машину, чтобы не проседать по I/O и не запускать по цепочке деградацию других сервисов, но ваш ИИ-агент всё ещё только отвечает, пусть даже и неплохо. Оунер спрашивает, а почему он не может даже посмотреть историю переписки с клиентом или сделать резюме диалога и сложить его в тикет? Чат джипити ведь делает (хоть и триллиардная компания) и вы уходите в новую итерацию по тул-коллингу — вызов функций и инструментов. Теперь нужно найти не только фреймворк или платформу (нет, мы всё пишем самостоятельно), но и обращать внимание на модели, к которым добавляются дополнительные требования по вызову функций. Но я могу подключить MCP, и всё готово? Может, но теперь ваш агент должен уметь в OAuth, только если вы не планируете дать ему полный доступ на все операции, и ваше контекстное окно внезапно сократилось на половину, и теперь агент теряет важную информацию при ответе. Также нужно решить, хардкодить ли все функции или их можно и нужно будет добавлять

Вопрос 5 — назовите топ-5 моделей для тул-колинга и размер их контекстных окон?

Мы уже близко, очень близко! Агент отвечает, источники индексируются, оунер утопает во внутренней документации и требованиях и уже забыл про саппорт, мейнтейнеры и девопсы пару раз не спали в месяц, но функции вызываются и данные синхронизируются, и тут… «Как вы обрабатываете ПД?» — внезапно спросит один из ваших клиентов. Позволю себе ответить за вас — регулярные выражения, либо вы можете себе позволить 1 ТБ оперативы для неквантизованного дипсика, но что будет, если у вас не он-прем, а ПД уйдут не в обезличенном виде? Ведь мы работаем с неструктурированными данными, морфологией, склонениями. Погодите, а как тогда вызывать функции, которые требуют И номер заказа И номер телефона, который является ПД? Писать собственный агентский фреймворк, который умеет передавать данные в LLM, не передавая ПД в LLM?

Вопрос 6 — вы умеете обезличивать ПД с учётом морфологии, вызывать функции через ЛЛМ без трансграничной передачи и фиксировать все действия в аудит логе с указанием конкретных методов обезличивания с трассировкой до исходного диалога?

Ок, разобрались даже с обезличиванием и теперь наш агент умеет всё: правильно отвечает, вызывает апишки, не падает, но это всё ещё… чат в браузере? Телеграм бот? Как его подключить к хелпдеску? Чтобы он не был просто классной игрушкой, но глубоко врезался в ваши процессы и усиливал их. Архитектуру придётся переписывать заново или ваше решение готово к новым требованиям?

Вопрос 7 — вы уже общались с вашими сотрудниками, которые реально будут работать с ИИ-агентом в вашем хелпдеске или они слышат о вашей новой инициативе впервые? Ваша архитектура поддерживает новые требования или надо всё переписывать с нуля?

Теперь вы готовы. Сроки и затраты считать не будем, потому что всё индивидуально, но важно понимать, что мы прошли только фазу разработки. Вашим продуктом ещё не пользовалась команда. Вы не платили за сопровождение во всех смыслах этого слова. Вы ещё не учитывали требования и «хотелки» ваших внутренних заказчиков, не дообучали бота, не показывали отчёты, аналитику и расчёты вашим руководителям и вы… не привлекали бюджет на следующий год.

Погодите, какой следующий год? Разве мы не закончили разработку? Сколько ещё нужно времени? Сделайте смету и план. Не уверен, но это вполне реальный сценарий разговора с вашим руководителем.

А плюсы есть?

Да, разработка под себя отлично себя показывает и оправдана в следующих случаях:

  1. Поддержка клиентов и управлением клиентским опытом — ключевая экспертиза в вашей компании, от которой напрямую зависит успех вашего бизнеса. В этом случае концепция персонального софта окупится сторицей пусть и не в первый, но в ближайшие годы точно.

  2. Повышенные требования к безопасности и регуляциям. Речь именно о повышенных требованиях, а не общих рекомендациях или базе по к безопасности, которую многие современные платформы гарантируют.

  3. Осознанный выбор после глубокого исследования и анализа всех вариантов, с пониманием всех сложностей и подводных камней и готовности платить входную пошлину и терпеливо ждать возврата инвестиций.

Выбор за вами! 128932.jpg

Похожие статьи