AI, который делает что-то полезное — а не чат-бот в цилиндре.
Вам не нужна ещё одна подписка на ChatGPT. Вам нужен AI, который занимается конкретными вещами, съедающими вашу неделю — составление смет, ответ на один и тот же вопрос клиента в 40-й раз за сегодня, саммари истории клиента перед тем, как вы возьмёте трубку. Встроен в инструменты, которыми вы уже пользуетесь, опирается на ваши данные, стоит так, чтобы математика сходилась. От $500.
AI действительно стоит того для вашего бизнеса?
Честный разговор, без увёрток.
AI скорее всего окупит себя, если…
- Вы делаете одну и ту же задачу снова и снова — составляете сметы, отвечаете на один и тот же вопрос, сортируете счета — и это съедает часы каждую неделю.
- У вас куча данных (заказы, тикеты, письма, PDF, заметки со звонков), которую никто не успевает читать, но ответы зарыты именно там.
- Ваша команда отвечает на одни и те же 10 вопросов клиентов каждый день, а ваш сайт мог бы ответить на них, если бы знал как.
- Вы хотите брать больше работы, не нанимая ещё одного человека для сопровождающей админ-рутины.
- Вы сами играли с ChatGPT и подумали "должен быть способ подключить это к моему реальному бизнесу, а не к отдельной вкладке в браузере".
Лучше подождать, если…
- Настоящая проблема в том, что у вас ещё нет данных. AI, опирающийся ни на что, — это машина галлюцинаций — сначала почините данные, потом поговорим.
- Вы хотите "какой-то AI", но не можете указать на конкретную задачу, которую он будет делать. Вернитесь с одной реальной задачей на столе, и мы сделаем один хороший ответ на неё.
- Ваша команда уже решила процесс в таблице, и он работает нормально. Сэкономьте деньги — я скажу вам об этом на звонке.
- Вы гонитесь за AI, потому что это модно. Клиентам всё равно, что под капотом — им важно, берёте ли вы трубку.
Если вы не уверены, на какой стороне вы находитесь, именно для этого и нужен бесплатный звонок.
Что каждая AI-функция, которую я делаю, получает по умолчанию.
Не доплаты. Так я держу AI честным.
- Опирается на ваши реальные данные
- Стоимость отслеживается с первого дня
- Ответы меньше чем за 3 секунды
- Вы видите, что он делает
- План Б на случай поломки
- Одобрение человека для рискованных операций
- Вы владеете промптами и данными
Как я на самом деле делаю AI-функции.
Выбор под задачу. Встроен там, где уже идёт работа. Измерен до того, как получить повышение.
Правильный инструмент под задачу
Claude для задач с тяжёлым рассуждением, OpenAI для быстрой классификации и извлечения, меньшие и дешёвые модели для высокообъёмной рутины. Смешиваются и комбинируются, без брака с одним вендором — так что когда в следующем месяце выходит модель получше, вы обновляетесь изменением конфига, а не переписыванием.
Читает ваши материалы перед тем, как отвечать
AI подтягивает из ваших документов, PDF, заказов, прошлых писем клиентов — всего, что релевантно — и цитирует источники. В этом и есть большая часть разницы между "полезно" и "стыдно". Никаких выдуманных цен, выдуманных политик или выдуманных фамилий.
Тестируется до запуска
Прежде чем что-то пойдёт в прод, я прогоняю это по 30–100 реальным примерам из вашего бизнеса и оцениваю. Точность, стоимость за ответ, как часто он отказывается. Если цифры не проходят планку, мы настраиваем или останавливаем — вы не платите за продакшен-код, не прошедший тест.
Встроен там, где вы уже работаете
AI появляется внутри вашего сайта, приложения, черновиков писем, вашего потока Power Automate — а не как ещё одна вкладка, которую надо помнить. Лучшая AI-функция — та, в которую никому не нужно логиниться.
Я выпускаю AI каждый день — свой и клиентский.
Я пишу продакшен-код с Claude ежедневно, запускаю многошаговые AI-воркфлоу внутри собственного приложения Rec Soccer и заменил около $40K/год вендорской отчётности на предыдущем месте работы AI-ассистируемой автоматизацией. Я не продаю то, о чём прочитал — я продаю то, что уже работает на моих собственных машинах.
AI-модели, питающие вашу сборку.
Я не женат на одном вендоре. Я выбираю модель, которая выигрывает на вашей задаче — по точности, стоимости и скорости — и заменяю, когда выходит лучшая. Использование биллится на ваш аккаунт, не мой, так что вы никогда не платите наценку за токены.
Claude
AnthropicМой дефолт для рассуждения, работы с длинным контекстом, аккуратного письма и использования инструментов. Claude Sonnet для большинства задач, Opus для трудных.
GPT
OpenAIДешёвая, быстрая классификация и структурированное извлечение. Мой выбор, когда нужно "прочитать это письмо и вытащить номер счёта" в масштабе.
Gemini
GoogleОгромные окна контекста и сильная мультимодальность — чтение целых PDF, длинных транскриптов встреч или целых кодовых баз за один заход. Хорошо работает с данными Google Workspace.
Llama
MetaОткрытые модели для случаев, когда нужно запускать самим — на собственных серверах, в регулируемых отраслях или чтобы держать данные полностью вне сторонних API.
ElevenLabs
ГолосЛучший голос, который я слышал — клонированные голоса, многоязычие, разговорные агенты. Где AI должен звучать как человек — это оно.
Sora + Nano Banana
OpenAI · GoogleВидео от Sora, изображения от Nano Banana (Gemini 2.5 Flash Image от Google). Для маркетинговых материалов, демо-роликов, рекламных креативов, мокапов продуктов и постов в соцсетях — когда в бюджете нет съёмочной группы или дизайнера.
sora.com deepmind.googleПлюс специализированные сервисы, когда они того стоят — Whisper и Deepgram для распознавания речи, Azure OpenAI или Amazon Bedrock для регулируемых или корпоративных контрактов, Hugging Face для длинного хвоста открытых моделей. Что бы ни выиграло на вашей задаче.
Три способа начать. Выберите форму, которая подходит.
Каждый пакет опирается на ваши данные, оценивается до запуска и остаётся вашим. Диапазоны типичные — после discovery-звонка я присылаю фиксированную одностраничную смету.
Spark
- Сроки
- 1–2 недели
- Объём
- Одна функция
- Языки
- Английский
- Discovery по реальной задаче — что внутри, что хорошо, что сломано
- Модель + промпт подобраны и настроены на 30+ реальных примерах
- Структурированный вывод (JSON schema), чтобы нижележащие инструменты могли его использовать
- Подключено к существующей почте, CRM, таблице или воркфлоу
Stack
- Сроки
- 3–5 недель
- Объём
- Многошаговый воркфлоу
- Языки
- Английский + 1
- Всё из Spark
- RAG-пайплайн по вашим документам, PDF, таблицам, Notion или выгрузке Slack
- Vector store + стратегия чанкинга, настроенная под ваш контент
- Цитаты источников на каждом ответе — никаких ответов "поверьте мне"
Suite
- Сроки
- 6–12 недель
- Объём
- Мульти-функциональное, встроенное в приложение
- Языки
- 2–12 языков
- Всё из Stack
- Использование инструментов — AI, вызывающий ваши API, CRM, календарь, ERP или кастомные эндпоинты
- Многошаговые циклы агента с повторами, фолбэками и шлюзами одобрения человеком
- Мультимодальность там, где она окупается — голос (STT/TTS), изображения, PDF
Дополнения, когда они того стоят.
Добавьте их к любому пакету или позже, по мере роста сценария.
RAG-корпус / vector store
$800–$2.5KЗагрузка, чанкинг, эмбеддинги и индексация ваших документов — плюс задача повторной загрузки для случаев, когда контент меняется. Firestore vector, Pinecone или pgvector.
Голос (STT + TTS)
$1K–$3KWhisper или Deepgram для распознавания речи, ElevenLabs или голоса OpenAI для ответов. Телефон, браузер или внутри приложения.
Vision / распознавание изображений
$800–$2KЧитать чеки, удостоверения, формы, скриншоты, фото продуктов. Извлекать структурированные данные или отвечать на вопросы о том, что на картинке.
Eval-харнесс
$600–$1.5KТестовый набор, рубрика оценок и однокомандный ранер, чтобы вы видели влияние каждого изменения промпта или модели до деплоя.
UI для версионирования промптов
$1K–$2.5KНебольшая админ-панель, где вы можете редактировать промпты, запускать A/B тесты вариантов и откатываться — без передеплоя приложения.
Месячный AI-абонемент
$300–$1K / месНастройка промптов, мониторинг стоимости, апгрейды моделей при выходе новых и расследования "почему оно так сделало" — на связи.
Как на самом деле идёт AI-проект.
Никаких демо с волшебной палочкой. Звонок, ограниченный пилот, реальное измерение, потом продакшен — или честная остановка.
20-минутный discovery-звонок
Я спрашиваю, какую задачу вы пытаетесь решить, кто её делает сегодня, как выглядит "хорошо" и где живут данные. Если AI — не тот инструмент, я скажу — иногда ответ это поток Power Automate или SQL-представление.
Ограниченный пилот
В течение 48 часов вы получаете фиксированную смету — одна функция, одна модель, одна метрика успеха. Мы строим на 30–100 реальных примерах из ваших данных, а не на выдуманных.
Измеряем evals
До того как что-то пойдёт в прод, мы это оцениваем. Точность, стоимость за вызов, p95-латентность, rate отказов. Если цифры не проходят планку, настраиваем, меняем модели или останавливаемся — вы не платите за продакшен-код, не прошедший тест.
Запускаем и итерируем
Живёт в вашем приложении, мониторится в реальном времени, с логами, которые вы видите. Большинство клиентов оставляют меня на небольшом абонементе для настройки промптов и катания апгрейдов моделей; некоторые нет. Оба варианта в порядке.
Что обычно спрашивают.
Меньше, чем в демо, которые вы видели, но никогда не ноль — именно поэтому каждая сборка опирается на ваши данные с retrieval, валидируется структурированными выводами и измеряется на реальных примерах до запуска. Для задач с высокими ставками я добавляю шаг одобрения человеком. Честный ответ такой: AI ошибается, и инженерия — в том, чтобы ловить это раньше пользователя.
Ваш, биллится прямо на ваш аккаунт OpenAI / Anthropic. Я не перепродаю токены и не беру наценку с использования. Вы видите точно, сколько стоит каждый вызов, и если мы когда-нибудь разойдёмся, ключи (и расходы) остаются с вами.
Для функции Spark часто $5–$50/мес в API-вызовах. Для ассистента Stack с RAG обычно $30–$300/мес в зависимости от трафика. С включённым prompt caching повторные запросы могут стать на 50–80% дешевле. Я показываю вам дашборд с первого дня, чтобы не было сюрпризов.
OpenAI и Anthropic оба контрактно не обучаются на API-трафике по умолчанию. Ваши данные живут в ваших аккаунтах (Firestore, Pinecone, S3 — что бы вы ни использовали), AI-вызовы происходят на серверной стороне из вашей инфраструктуры, и ничего не логируется в сторонний SaaS, если вы об этом не попросите. Для регулируемой работы я также могу использовать Azure OpenAI или Bedrock для дополнительного контрактного покрытия.
Всё, под задачу. Claude (Sonnet/Opus) — мой дефолт для рассуждения, аккуратного письма и использования инструментов. OpenAI GPT отлично подходит для дешёвой, быстрой классификации и структурированного извлечения на объёме. Google Gemini выигрывает, когда контекст огромен — целые PDF, длинные транскрипты встреч, целые кодовые базы — или когда данные уже лежат в Google Workspace. Meta Llama — выбор, когда нужно запускать модель на собственных серверах, в регулируемой отрасли или держать данные полностью вне стороннего API. Для голоса я полагаюсь на ElevenLabs; для видео и изображений — Sora и Nano Banana (Gemini 2.5 Flash Image от Google). Та же кодовая база, замена одним изменением конфига — так что когда выходит следующая модель, вы обновляетесь без переписывания.
Расскажите о задаче, которую вы устали делать. Я скажу, является ли AI правильным решением.
Первые звонки длятся около 20 минут. Вы уйдёте с более чётким планом — ограниченным пилотом, рекомендацией или честным "это проблема таблицы, а не AI". Все три варианта случаются.