What if the AI gets something wrong?

Fair worry — and the honest answer is, sometimes it will. Less often than the wild AI demos you've probably seen, but never zero. Every AI feature we ship is grounded in your real information so it's answering from facts instead of guessing. For high-stakes tasks (quotes that go to customers, contracts, money) we add a step where a person reviews before anything goes out. The skill is catching mistakes before your customer ever sees them.

Who pays for the AI usage — me or you?

You do, but it's billed directly to your OpenAI or Anthropic account, not ours. We don't resell AI usage or take a markup on what the AI costs to run. You see exactly what every interaction costs in your own dashboard, and if we ever part ways the account and any unused credit stays with you.

What does this actually cost to run per month?

For a small AI feature like a chatbot, usually $5–$50 per month in AI usage. For a bigger AI assistant reading through your documents, typically $30–$300 per month depending on how much your team or customers use it. We turn on a behind-the-scenes trick called prompt caching by default that drops the cost of repeat questions by 50–80%. You get a usage dashboard from day one so nothing surprises you.

What about the privacy of my data?

Big concern, totally understandable. Short version: your data stays yours. The two main AI providers we use (OpenAI and Anthropic) have contracts saying they don't use your data to train their models when accessed through their business APIs. Your data lives in your accounts, not a third-party AI service. For regulated industries (healthcare, finance, legal), we can also use Azure OpenAI or Amazon Bedrock for extra contractual coverage that satisfies HIPAA and similar requirements.

Claude, GPT, Gemini, Llama — which do you actually use?

All of the major ones — the answer really is whichever is best for the specific job. Claude (from Anthropic) is our default for careful writing, reasoning, and using business tools. GPT (from OpenAI) is great for fast, cheap classification work at high volume. Gemini (from Google) wins when there's a huge amount of context to process or when your business already lives in Google Workspace. Llama (from Meta) is the right pick when you need to run the AI on your own servers, especially in regulated industries. We write everything so the AI provider can be swapped with a single configuration change — when the next better model comes out, you upgrade without a rewrite.

IA pro seu negócio

IA que de fato te economiza tempo — não só mais uma ferramenta para você ter que aprender.

Você não precisa de mais uma assinatura do ChatGPT. Precisa de IA que cuida do que tá comendo sua semana — escrever orçamento, responder a mesma pergunta do cliente pela quadragésima vez hoje, resumir o histórico do cliente antes de atender o telefone. Embutida nas ferramentas que você já usa, fundamentada nos seus dados, com preço onde a conta fecha. A partir de $500.

Agende uma conversa gratuita Ver pacotes

Sem teatro de demo — só algo que ganha o lugar dele.

É pra você?

IA vale a pena mesmo pro seu negócio?

Falando sério, de cara.

IA provavelmente ganha o lugar dela se…

Você tá fazendo a mesma tarefa de novo e de novo — escrevendo orçamento, respondendo a mesma pergunta, organizando nota — e tá comendo horas toda semana.
Tem uma pilha de dados (pedidos, tickets, e-mails, PDFs, anotações de ligação) que ninguém tem tempo de ler, mas tem resposta enterrada ali.
Seu time recebe as mesmas 10 perguntas de cliente todo dia, e seu site poderia responder se soubesse como.
Quer pegar mais trabalho sem contratar mais gente pra cuidar da papelada que vem junto.
Já brincou com ChatGPT e pensou "tem que ter um jeito de ligar isso no meu negócio de verdade, não numa aba separada do navegador".

Provavelmente espera se…

O verdadeiro gargalo é que você ainda não tem os dados. IA sem suas informações reais por trás tende a inventar coisas — então o melhor primeiro passo é colocar seus dados em um lugar só. Feliz em ajudar com essa parte se for útil, e a gente revisita IA depois.
Você quer "uma IA" mas ainda não consegue apontar uma tarefa específica que ela cuidaria. Totalmente comum — IA está em todo lugar agora. A solução é fácil: pensa em uma coisa específica e repetitiva no seu prato (escrever orçamento, responder a mesma pergunta, organizar papelada) e traz isso pra conversa. A gente constrói uma resposta boa para um problema real.
Seu time já resolveu o processo numa planilha e funciona de verdade. Guarda seu dinheiro — se for isso que a gente achar na conversa, é isso que a gente vai te dizer.
Você está considerando IA principalmente porque tá na moda agora. Totalmente compreensível, mas vale uma pausa: clientes geralmente se importam se você atende o telefone, não com o que está rodando nos bastidores. Se a gente conseguir achar um problema real específico que IA resolveria, ótimo. Se não, isso também é uma resposta válida.

Na dúvida? Agenda a conversa →

Se não sabe pra que lado você cai, é pra isso mesmo que serve a conversa gratuita.

Em todo projeto

O que cada feature de IA que construímos recebe por padrão.

Não são upsells. Como mantemos a IA honesta.

Fundamentada nos seus dados reais
Custo monitorado desde o dia um
Resposta em menos de 3 segundos
Você consegue ver o que ela tá fazendo
Plano B quando quebra
Aprovação humana pras coisas arriscadas
Os prompts e dados são seus

Abordagem

Como construímos features de IA de verdade.

Escolhida por tarefa. Embutida onde o trabalho já acontece. Medida antes de ganhar promoção.

Ferramenta certa pra tarefa

Claude pra coisas que pedem raciocínio pesado, OpenAI pra classificação e extração rápidas, modelos menores e mais baratos pra trabalho braçal de alto volume. Misturado e combinado, não casado com um fornecedor — então quando sair um modelo melhor mês que vem, você atualiza com uma mudança de config, não uma reescrita.

Lê as suas coisas antes de responder

Antes de qualquer coisa entrar em produção, rodamos contra 30–100 exemplos reais do seu negócio e pontuamos. Precisão, custo por resposta, quão frequentemente recusa. Se os números não passam da régua, ajustamos ou cancelamos — você não paga por código de produção que falha no teste.

Testada antes de entrar no ar

Antes de qualquer coisa ir ao ar, eu rodo contra 30–100 exemplos reais do seu negócio e dou nota. Precisão, custo por resposta, com que frequência ela recusa. Se os números não passam da linha, a gente afina ou desiste — você não paga por código de produção que não passa no teste.

Embutida onde você já trabalha

A IA aparece dentro do seu site, seu app, seu rascunho de e-mail, seu fluxo do Power Automate — não como mais uma aba pra lembrar. A melhor função de IA é aquela em que ninguém precisa fazer login.

Entregamos IA todo dia — nossa e dos clientes.

Escrevemos código de produção com Claude diariamente, rodamos workflows de IA multi-etapas dentro do nosso próprio app Rec Soccer, e substituímos cerca de $40K/ano em relatórios de fornecedores num cargo anterior com automação assistida por IA. A Attuned Ventures não vende algo que a gente leu — vendemos o que já roda nas nossas próprias máquinas.

Modelos com que construímos

Os modelos de IA que dão força ao seu build.

Não somos casados com um fornecedor. Escolhemos o modelo que ganha na sua tarefa — precisão, custo e velocidade — e trocamos quando aparece um melhor. O uso é faturado na sua conta, não na nossa, então você nunca paga markup em tokens.

Claude

Anthropic

Meu padrão pra raciocínio, trabalho de contexto longo, escrita cuidadosa e uso de ferramenta. Claude Sonnet pra maioria das tarefas, Opus pras difíceis.

GPT

OpenAI

Classificação barata e rápida e extração estruturada. Meu favorito quando você precisa de "lê esse e-mail e tira o número da nota" em escala.

Gemini

Google

Janelas de contexto enormes e multimodal forte — ler PDF inteiro, transcrição longa de reunião ou um codebase inteiro de uma vez. Se dá bem com dados do Google Workspace.

Llama

ElevenLabs

Voz

A melhor voz que eu já ouvi — vozes clonadas, multilíngue, agentes conversacionais. Quando a IA precisa soar como gente, é isso.

Sora + Nano Banana

OpenAI · Google

Vídeo com Sora, imagens com Nano Banana (Gemini 2.5 Flash Image da Google). Pra material de marketing, reels de demo, criativo de anúncio, mockup de produto e posts de rede social — quando você não tem equipe de câmera nem designer no orçamento.

sora.com deepmind.google

Mais serviços especializados quando eles merecem — Whisper e Deepgram pra fala-para-texto, Azure OpenAI ou Amazon Bedrock pra contratos regulados ou corporativos, Hugging Face pra cauda longa de modelos abertos. O que ganhar na sua tarefa.

Pacotes

Três formas de começar. Escolhe o formato que encaixa.

Cada pacote é ancorado nos seus dados, avaliado antes do lançamento, e seu. As faixas são típicas — mandamos um orçamento fixo de uma página depois de uma conversa de descoberta.

Spark

Faixa típica $500–$2K

Prazo: 1–2 semanas
Escopo: Função única
Idiomas: Inglês

Descoberta em cima da tarefa real — o que entra, o que tá bom, o que tá quebrado
Modelo + prompt escolhidos e afinados contra 30+ exemplos reais
Saída estruturada (schema JSON) pras ferramentas de baixo usarem
Ligada na sua caixa de entrada, CRM, planilha ou fluxo existente

Começa um projeto Spark

Stack

Faixa típica $2K–$8K

Prazo: 3–5 semanas
Escopo: Fluxo multi-passo
Idiomas: Inglês + 1

Tudo do Spark
Pipeline RAG nos seus docs, PDFs, planilhas, Notion ou export do Slack
Vector store + estratégia de chunking afinada pro seu conteúdo
Citação de fonte em toda resposta — sem resposta tipo "confia em mim"

Começa um projeto Stack

Suite

Faixa típica $8K–$15K+

Prazo: 6–12 semanas
Escopo: Multi-função, embutida no app
Idiomas: 2–12 idiomas

Tudo do Stack
Uso de ferramenta — IA chamando suas APIs, CRM, calendário, ERP ou endpoints personalizados
Loops de agente multi-passo com retry, fallback e portão de aprovação humana
Multimodal onde ganha o lugar — voz (STT/TTS), imagens, PDFs

Começa um projeto Suite

Adicionais

Extras, quando eles merecem.

Encaixa em qualquer pacote, ou adiciona depois conforme o caso de uso cresce.

Corpus RAG / vector store

$800–$2.5K

Ingestão, chunking, embedding e indexação dos seus docs — mais um job de re-ingestão pra quando o conteúdo mudar. Vector no Firestore, Pinecone ou pgvector.

Voz (STT + TTS)

$1K–$3K

Whisper ou Deepgram pra fala-para-texto, vozes do ElevenLabs ou OpenAI pras respostas. Telefone, navegador, ou dentro do app.

Visão / compreensão de imagem

$800–$2K

Ler recibo, documento, formulário, captura de tela, foto de produto. Extrai dados estruturados ou responde perguntas sobre o que tá na imagem.

Eval harness

$600–$1.5K

Um conjunto de teste, rubrica de nota, e um runner de um comando pra você ver o impacto de toda mudança de prompt ou modelo antes de subir.

UI de versionamento de prompt

$1K–$2.5K

Um painel admin pequeno onde você pode editar prompts, fazer teste A/B em variantes e reverter — sem redeployar o app.

Retainer mensal de IA

$300–$1K / mês

Afinação de prompt, monitoramento de custo, upgrade de modelo quando saem novos, e investigação de "por que ela fez isso" — de plantão.

Processo

Como um projeto de IA funciona de verdade.

Sem demo de varinha mágica. Uma conversa, um piloto com escopo, medição de verdade, depois produção — ou uma parada honesta.

Conversa de descoberta de 20 minutos

Perguntamos qual tarefa você quer resolver, quem faz hoje, como é "bom" e onde os dados moram. Se IA não é a ferramenta certa, a gente fala — às vezes um fluxo Power Automate ou uma view SQL é a resposta.

Piloto com escopo

Em 48 horas você recebe um orçamento fechado — uma função, um modelo, uma métrica de sucesso. A gente constrói contra 30–100 exemplos reais dos seus dados, não inventados.

Medir com evals

Antes de qualquer coisa ir ao ar a gente dá nota. Precisão, custo por chamada, latência p95, taxa de recusa. Se os números não passam da linha, a gente afina, troca de modelo ou desiste — você não paga por código de produção que não passa no teste.

Entra no ar e itera

Vive no seu app, monitorada em tempo real, com logs que você pode ver. A maioria dos clientes nos mantém num pequeno retainer para ajustar prompts e acompanhar upgrades de modelo; alguns não. Ambas servem.

Perguntas frequentes

O que geralmente perguntam.

Expandir tudo Recolher tudo

E se a IA errar alguma coisa?

Menos do que as demos que você viu, mas nunca zero — é por isso que cada build é ancorado nos seus dados com retrieval, validado com saídas estruturadas e medido contra exemplos reais antes de subir. Para tarefas de alto risco adicionamos um passo de aprovação humana. A resposta honesta é: IA erra, e a engenharia está em pegar antes do usuário.

Quem paga pelo uso da IA — eu ou vocês?

Suas, faturadas direto na sua conta OpenAI / Anthropic. A gente não revende tokens nem cobra markup no uso. Você vê exatamente quanto cada chamada custa, e se nos separarmos um dia as chaves (e o gasto) ficam com você.

Quanto custa rodar isso por mês de verdade?

Para uma feature Spark, geralmente $5–$50/mês em chamadas de API. Para um assistente Stack com RAG, tipicamente $30–$300/mês dependendo do tráfego. Com prompt caching ligado, consultas repetidas podem cair 50–80%. Mostramos o painel desde o dia um para não ter surpresas.

E a privacidade dos meus dados?

OpenAI e Anthropic ambos contratualmente não treinam com tráfego de API por padrão. Seus dados moram nas suas contas (Firestore, Pinecone, S3 — o que você usa), as chamadas de IA acontecem server-side da sua infraestrutura, e nada é logado num SaaS terceiro a menos que você peça. Para trabalho regulado também podemos usar Azure OpenAI ou Bedrock para cobertura contratual extra.

Claude, GPT, Gemini, Llama — qual você usa de verdade?

Todos os principais — a resposta de verdade é "o que for melhor para o trabalho específico". Os quatro grandes provedores de IA têm forças diferentes: Claude (da Anthropic) é nosso padrão para escrita cuidadosa, raciocínio e uso de ferramentas de negócio. GPT (da OpenAI) é ótimo para classificação rápida e barata em alto volume. Gemini (do Google) ganha quando há uma quantidade enorme de contexto para processar — PDFs inteiros, transcrições longas de reunião — ou quando o seu negócio já mora no Google Workspace. Llama (da Meta) é a escolha certa quando você precisa rodar a IA nos seus próprios servidores, especialmente em indústrias regulamentadas onde os dados não podem sair das suas instalações. A boa notícia para você: a gente escreve tudo de um jeito que o provedor de IA pode ser trocado com uma única mudança de configuração. Quando o próximo modelo melhor sair, você atualiza sem reescrever nada.

Para os mais técnicos: para voz usamos ElevenLabs; para geração de imagem, Gemini 2.5 Flash Image ("Nano Banana") do Google e Sora da OpenAI para vídeo. Tudo roteado pela mesma camada de abstração.

Vamos conversar

Diga a tarefa que você está cansado de fazer. A gente diz se IA é a solução certa.

As primeiras conversas duram uns 20 minutos — só uma conversa real sobre a tarefa que está consumindo seu tempo. Você sai com um próximo passo claro: um piloto com escopo, uma recomendação, ou às vezes um sincero "isso é problema de planilha, não de IA". O que encaixar, é o que você vai ouvir.

— Quinton

Agende uma conversa gratuita hello@attunedventures.com