What if the AI gets something wrong?

Fair worry — and the honest answer is, sometimes it will. Less often than the wild AI demos you've probably seen, but never zero. Every AI feature we ship is grounded in your real information so it's answering from facts instead of guessing. For high-stakes tasks (quotes that go to customers, contracts, money) we add a step where a person reviews before anything goes out. The skill is catching mistakes before your customer ever sees them.

Who pays for the AI usage — me or you?

You do, but it's billed directly to your OpenAI or Anthropic account, not ours. We don't resell AI usage or take a markup on what the AI costs to run. You see exactly what every interaction costs in your own dashboard, and if we ever part ways the account and any unused credit stays with you.

What does this actually cost to run per month?

For a small AI feature like a chatbot, usually $5–$50 per month in AI usage. For a bigger AI assistant reading through your documents, typically $30–$300 per month depending on how much your team or customers use it. We turn on a behind-the-scenes trick called prompt caching by default that drops the cost of repeat questions by 50–80%. You get a usage dashboard from day one so nothing surprises you.

What about the privacy of my data?

Big concern, totally understandable. Short version: your data stays yours. The two main AI providers we use (OpenAI and Anthropic) have contracts saying they don't use your data to train their models when accessed through their business APIs. Your data lives in your accounts, not a third-party AI service. For regulated industries (healthcare, finance, legal), we can also use Azure OpenAI or Amazon Bedrock for extra contractual coverage that satisfies HIPAA and similar requirements.

Claude, GPT, Gemini, Llama — which do you actually use?

All of the major ones — the answer really is whichever is best for the specific job. Claude (from Anthropic) is our default for careful writing, reasoning, and using business tools. GPT (from OpenAI) is great for fast, cheap classification work at high volume. Gemini (from Google) wins when there's a huge amount of context to process or when your business already lives in Google Workspace. Llama (from Meta) is the right pick when you need to run the AI on your own servers, especially in regulated industries. We write everything so the AI provider can be swapped with a single configuration change — when the next better model comes out, you upgrade without a rewrite.

AI для вашего бизнеса

AI, который реально экономит вам время — а не очередной инструмент, который надо изучать.

Вам не нужна ещё одна подписка на ChatGPT. Вам нужен AI, который занимается конкретными вещами, съедающими вашу неделю — составление смет, ответ на один и тот же вопрос клиента в 40-й раз за сегодня, саммари истории клиента перед тем, как вы возьмёте трубку. Встроен в инструменты, которыми вы уже пользуетесь, опирается на ваши данные, стоит так, чтобы математика сходилась. От $500.

Записаться на бесплатный звонок Смотреть пакеты

Никакого демо-театра — только то, что окупает себя.

Это для вас?

AI действительно стоит того для вашего бизнеса?

Честный разговор, без увёрток.

AI скорее всего окупит себя, если…

Вы делаете одну и ту же задачу снова и снова — составляете сметы, отвечаете на один и тот же вопрос, сортируете счета — и это съедает часы каждую неделю.
У вас куча данных (заказы, тикеты, письма, PDF, заметки со звонков), которую никто не успевает читать, но ответы зарыты именно там.
Ваша команда отвечает на одни и те же 10 вопросов клиентов каждый день, а ваш сайт мог бы ответить на них, если бы знал как.
Вы хотите брать больше работы, не нанимая ещё одного человека для сопровождающей админ-рутины.
Вы сами играли с ChatGPT и подумали "должен быть способ подключить это к моему реальному бизнесу, а не к отдельной вкладке в браузере".

Лучше подождать, если…

Настоящее узкое место в том, что у вас пока нет данных. AI без вашей реальной информации за спиной обычно начинает выдумывать — поэтому первый шаг лучше потратить на то, чтобы свести данные в одно место. С удовольствием поможем с этой частью, если будет полезно, а к AI вернёмся позже.
Вы хотите "какой-то AI", но пока не можете указать на конкретную задачу, которую он мог бы делать. Это совершенно нормально — AI сейчас повсюду. Решение простое: подумайте об одной конкретной повторяющейся вещи у вас на тарелке (составить смету, ответить на один и тот же вопрос, разобрать бумаги) и принесите её на звонок. Мы сделаем один хороший ответ на одну реальную задачу.
У вашей команды процесс уже решён в таблице, и он действительно работает. Сэкономьте свои деньги — если на звонке мы увидим именно это, мы так и скажем.
Вы рассматриваете AI в основном потому, что это сейчас в тренде. Это совершенно понятно, но стоит сделать паузу: клиентам обычно важно, берёте ли вы трубку, а не что работает за кулисами. Если мы найдём конкретную реальную проблему, которую AI решит, — отлично. Если нет — это тоже нормальный ответ.

Не уверены? Запишитесь на звонок →

Если вы не уверены, на какой стороне вы находитесь, именно для этого и нужен бесплатный звонок.

В каждой сборке

Что каждая AI-фича, которую мы строим, получает по умолчанию.

Не апсейлы. Как мы держим AI честным.

Опирается на ваши реальные данные
Стоимость отслеживается с первого дня
Ответы меньше чем за 3 секунды
Вы видите, что он делает
План Б на случай поломки
Одобрение человека для рискованных операций
Вы владеете промптами и данными

Подход

Как мы реально строим AI-фичи.

Выбор под задачу. Встроен там, где уже идёт работа. Измерен до того, как получить повышение.

Правильный инструмент под задачу

Claude для задач с тяжёлым рассуждением, OpenAI для быстрой классификации и извлечения, меньшие и дешёвые модели для высокообъёмной рутины. Смешиваются и комбинируются, без брака с одним вендором — так что когда в следующем месяце выходит модель получше, вы обновляетесь изменением конфига, а не переписыванием.

Читает ваши материалы перед тем, как отвечать

Прежде чем что-то идёт в продакшн, прогоняем против 30–100 реальных примеров из вашего бизнеса и оцениваем. Точность, стоимость на ответ, частота отказов. Если цифры не проходят планку, тюним или сворачиваем — вы не платите за продакшн-код, который проваливает тест.

Тестируется до запуска

Прежде чем что-то пойдёт в прод, я прогоняю это по 30–100 реальным примерам из вашего бизнеса и оцениваю. Точность, стоимость за ответ, как часто он отказывается. Если цифры не проходят планку, мы настраиваем или останавливаем — вы не платите за продакшен-код, не прошедший тест.

Встроен там, где вы уже работаете

AI появляется внутри вашего сайта, приложения, черновиков писем, вашего потока Power Automate — а не как ещё одна вкладка, которую надо помнить. Лучшая AI-функция — та, в которую никому не нужно логиниться.

Поставляем AI каждый день — свой и клиентский.

Пишем продакшн-код с Claude каждый день, гоняем многошаговые AI-workflow внутри собственного приложения Rec Soccer, и заменили около $40K/год отчётности от вендоров на предыдущей роли AI-ассистированной автоматизацией. Attuned Ventures не продаёт что-то, о чём прочитали — мы продаём то, что уже работает на наших машинах.

Модели, с которыми работаем

AI-модели, питающие вашу сборку.

Не привязаны к одному вендору. Берём модель, которая выигрывает на вашей задаче — точность, стоимость, скорость — и меняем, когда выходит лучшая. Использование биллится на ваш аккаунт, не на наш, поэтому вы никогда не платите markup на токенах.

Claude

Anthropic

Мой дефолт для рассуждения, работы с длинным контекстом, аккуратного письма и использования инструментов. Claude Sonnet для большинства задач, Opus для трудных.

GPT

OpenAI

Дешёвая, быстрая классификация и структурированное извлечение. Мой выбор, когда нужно "прочитать это письмо и вытащить номер счёта" в масштабе.

Gemini

Google

Огромные окна контекста и сильная мультимодальность — чтение целых PDF, длинных транскриптов встреч или целых кодовых баз за один заход. Хорошо работает с данными Google Workspace.

Llama

ElevenLabs

Голос

Лучший голос, который я слышал — клонированные голоса, многоязычие, разговорные агенты. Где AI должен звучать как человек — это оно.

Sora + Nano Banana

OpenAI · Google

Видео от Sora, изображения от Nano Banana (Gemini 2.5 Flash Image от Google). Для маркетинговых материалов, демо-роликов, рекламных креативов, мокапов продуктов и постов в соцсетях — когда в бюджете нет съёмочной группы или дизайнера.

sora.com deepmind.google

Плюс специализированные сервисы, когда они того стоят — Whisper и Deepgram для распознавания речи, Azure OpenAI или Amazon Bedrock для регулируемых или корпоративных контрактов, Hugging Face для длинного хвоста открытых моделей. Что бы ни выиграло на вашей задаче.

Пакеты

Три способа начать. Выберите форму, которая подходит.

Каждый пакет привязан к вашим данным, оценён до запуска, и принадлежит вам. Диапазоны типичны — после discovery-звонка отправляем фиксированную одностраничную смету.

Spark

Типичный диапазон $500–$2K

Сроки: 1–2 недели
Объём: Одна функция
Языки: Английский

Discovery по реальной задаче — что внутри, что хорошо, что сломано
Модель + промпт подобраны и настроены на 30+ реальных примерах
Структурированный вывод (JSON schema), чтобы нижележащие инструменты могли его использовать
Подключено к существующей почте, CRM, таблице или воркфлоу

Начать проект Spark

Stack

Типичный диапазон $2K–$8K

Сроки: 3–5 недель
Объём: Многошаговый воркфлоу
Языки: Английский + 1

Всё из Spark
RAG-пайплайн по вашим документам, PDF, таблицам, Notion или выгрузке Slack
Vector store + стратегия чанкинга, настроенная под ваш контент
Цитаты источников на каждом ответе — никаких ответов "поверьте мне"

Начать проект Stack

Suite

Типичный диапазон $8K–$15K+

Сроки: 6–12 недель
Объём: Мульти-функциональное, встроенное в приложение
Языки: 2–12 языков

Всё из Stack
Использование инструментов — AI, вызывающий ваши API, CRM, календарь, ERP или кастомные эндпоинты
Многошаговые циклы агента с повторами, фолбэками и шлюзами одобрения человеком
Мультимодальность там, где она окупается — голос (STT/TTS), изображения, PDF

Начать проект Suite

Дополнения

Дополнения, когда они того стоят.

Добавьте их к любому пакету или позже, по мере роста сценария.

RAG-корпус / vector store

$800–$2.5K

Загрузка, чанкинг, эмбеддинги и индексация ваших документов — плюс задача повторной загрузки для случаев, когда контент меняется. Firestore vector, Pinecone или pgvector.

Голос (STT + TTS)

$1K–$3K

Whisper или Deepgram для распознавания речи, ElevenLabs или голоса OpenAI для ответов. Телефон, браузер или внутри приложения.

Vision / распознавание изображений

$800–$2K

Читать чеки, удостоверения, формы, скриншоты, фото продуктов. Извлекать структурированные данные или отвечать на вопросы о том, что на картинке.

Eval-харнесс

$600–$1.5K

Тестовый набор, рубрика оценок и однокомандный ранер, чтобы вы видели влияние каждого изменения промпта или модели до деплоя.

UI для версионирования промптов

$1K–$2.5K

Небольшая админ-панель, где вы можете редактировать промпты, запускать A/B тесты вариантов и откатываться — без передеплоя приложения.

Месячный AI-абонемент

$300–$1K / мес

Настройка промптов, мониторинг стоимости, апгрейды моделей при выходе новых и расследования "почему оно так сделало" — на связи.

Процесс

Как на самом деле идёт AI-проект.

Никаких демо с волшебной палочкой. Звонок, ограниченный пилот, реальное измерение, потом продакшен — или честная остановка.

20-минутный discovery-звонок

Спрашиваем, какую задачу вы пытаетесь решить, кто делает её сегодня, как выглядит "хорошо" и где живут данные. Если AI — не тот инструмент, скажем; иногда ответ — flow в Power Automate или SQL view.

Ограниченный пилот

В течение 48 часов вы получаете фиксированную смету — одна функция, одна модель, одна метрика успеха. Мы строим на 30–100 реальных примерах из ваших данных, а не на выдуманных.

Измеряем evals

До того как что-то пойдёт в прод, мы это оцениваем. Точность, стоимость за вызов, p95-латентность, rate отказов. Если цифры не проходят планку, настраиваем, меняем модели или останавливаемся — вы не платите за продакшен-код, не прошедший тест.

Запускаем и итерируем

Живёт в вашем приложении, мониторится в реальном времени, с логами, которые вы видите. Большинство клиентов держит нас на небольшом retainer'е для тюнинга промптов и обновлений модели; некоторые нет. Оба варианта норм.

FAQ

Что обычно спрашивают.

Развернуть все Свернуть все

А если AI что-то напутает?

Меньше, чем в демо, которые вы видели, но никогда не ноль — именно поэтому каждая сборка опирается на ваши данные с retrieval, валидируется структурированными выходами и измеряется на реальных примерах до релиза. Для задач высокого риска добавляем шаг подтверждения человеком. Честный ответ: AI ошибается, и инженерия в том, чтобы поймать это раньше пользователя.

Кто платит за использование AI — я или вы?

Ваши, биллинг напрямую на ваш OpenAI / Anthropic-аккаунт. Не перепродаём токены и не берём наценку на использование. Видите ровно, сколько стоит каждый вызов, и если когда-нибудь разойдёмся, ключи (и расходы) остаются с вами.

Сколько это реально стоит в месяц в эксплуатации?

Для Spark-фичи — обычно $5–$50/мес в API-вызовах. Для Stack-ассистента с RAG — обычно $30–$300/мес в зависимости от трафика. С включённым prompt caching повторные запросы могут падать на 50–80%. Показываем dashboard с первого дня, чтобы не было сюрпризов.

А как насчёт приватности моих данных?

OpenAI и Anthropic оба контрактно не тренируются на API-трафике по умолчанию. Ваши данные живут в ваших аккаунтах (Firestore, Pinecone, S3 — что используете), вызовы AI идут server-side из вашей инфраструктуры, и ничего не логгируется в сторонний SaaS, если только сами не попросите. Для регулируемой работы можем использовать Azure OpenAI или Bedrock для дополнительного контрактного покрытия.

Claude, GPT, Gemini, Llama — что вы на самом деле используете?

Все основные — ответ на самом деле "какая лучше всего подходит конкретной задаче". У каждого из четырёх крупных AI-провайдеров свои сильные стороны: Claude (от Anthropic) — наш дефолт для аккуратного письма, рассуждения и использования бизнес-инструментов. GPT (от OpenAI) отлично подходит для быстрой и дешёвой классификации на больших объёмах. Gemini (от Google) выигрывает, когда нужно обработать огромное количество контекста — целые PDF, длинные транскрипты встреч — или когда ваш бизнес уже живёт в Google Workspace. Llama (от Meta) — правильный выбор, когда AI нужно запускать на ваших собственных серверах, особенно в регулируемых отраслях, где данные не могут уходить за пределы вашего периметра. Хорошая новость для вас: мы пишем всё так, что AI-провайдера можно поменять одним изменением конфигурации. Когда выйдет следующая, более качественная модель, вы обновляетесь без переписывания.

Для технических специалистов: для голоса мы используем ElevenLabs; для генерации изображений — Gemini 2.5 Flash Image от Google ("Nano Banana") и Sora от OpenAI для видео. Всё ходит через один и тот же слой абстракции.

Давайте поговорим

Расскажите задачу, от которой устали. Скажем, AI ли — правильное решение.

Первые звонки длятся около 20 минут — просто реальный разговор о задаче, которая съедает ваше время. Вы уйдёте с чётким следующим шагом: ограниченным пилотом, рекомендацией или иногда честным "это проблема таблицы, а не AI". Что бы из этого ни подошло — именно это вы и услышите.

— Quinton

Записаться на бесплатный звонок hello@attunedventures.com