What if the AI gets something wrong?

Fair worry — and the honest answer is, sometimes it will. Less often than the wild AI demos you've probably seen, but never zero. Every AI feature we ship is grounded in your real information so it's answering from facts instead of guessing. For high-stakes tasks (quotes that go to customers, contracts, money) we add a step where a person reviews before anything goes out. The skill is catching mistakes before your customer ever sees them.

Who pays for the AI usage — me or you?

You do, but it's billed directly to your OpenAI or Anthropic account, not ours. We don't resell AI usage or take a markup on what the AI costs to run. You see exactly what every interaction costs in your own dashboard, and if we ever part ways the account and any unused credit stays with you.

What does this actually cost to run per month?

For a small AI feature like a chatbot, usually $5–$50 per month in AI usage. For a bigger AI assistant reading through your documents, typically $30–$300 per month depending on how much your team or customers use it. We turn on a behind-the-scenes trick called prompt caching by default that drops the cost of repeat questions by 50–80%. You get a usage dashboard from day one so nothing surprises you.

What about the privacy of my data?

Big concern, totally understandable. Short version: your data stays yours. The two main AI providers we use (OpenAI and Anthropic) have contracts saying they don't use your data to train their models when accessed through their business APIs. Your data lives in your accounts, not a third-party AI service. For regulated industries (healthcare, finance, legal), we can also use Azure OpenAI or Amazon Bedrock for extra contractual coverage that satisfies HIPAA and similar requirements.

Claude, GPT, Gemini, Llama — which do you actually use?

All of the major ones — the answer really is whichever is best for the specific job. Claude (from Anthropic) is our default for careful writing, reasoning, and using business tools. GPT (from OpenAI) is great for fast, cheap classification work at high volume. Gemini (from Google) wins when there's a huge amount of context to process or when your business already lives in Google Workspace. Llama (from Meta) is the right pick when you need to run the AI on your own servers, especially in regulated industries. We write everything so the AI provider can be swapped with a single configuration change — when the next better model comes out, you upgrade without a rewrite.

为您的生意而建的 AI

真能给您省出时间的 AI — 不是又一个您还得学的工具。

您不需要再来一个 ChatGPT 订阅。您需要的是能处理掉您这周具体卡点的 AI — 起草报价、今天第 40 次回答同一个客户问题、接电话前先摘要一下这位客户的历史。嵌进您已经在用的工具里，基于您自己的数据，价格算得过账。$500 起。

预约免费咨询电话查看套餐

不演 demo — 只交付真能干活的东西。

这适合你吗？

对您的生意，AI 到底值不值得做？

把话说在前头。

AI 可能值回票价，如果…

您一遍又一遍地做同一件事 — 起草报价、回答同一个问题、整理发票 — 而且每周吃掉好几个小时。
您攒了一大堆数据（订单、工单、邮件、PDF、电话记录），没人有时间读，但答案都埋在里面。
您的团队每天被客户问同样的 10 个问题，您的网站本来可以帮着答，只要它知道怎么答。
您想多接活，但不想再招一个人专门处理随之而来的行政。
您自己玩过 ChatGPT，心想"一定有办法把这东西接进我真正的生意里，而不是另开一个浏览器标签"。

可能先别做，如果…

真正的瓶颈是您还没有数据。背后没有您真实信息的 AI 容易乱编 — 所以更好的第一步，是先把您的数据汇到一个地方。如果有用，这块我也乐意帮，之后我们再回来谈 AI。
您想要"一个 AI"，但还指不出它具体能干哪件事。这特别常见 — AI 现在到处都是。解法很简单：想一件您手上具体、重复性的事（起草报价、回答同一个问题、整理文件），把它带到电话上来。我们围绕一件真实的问题，建一个真好用的答案。
您的团队已经用电子表格把流程搞定了，而且确实好使。省点钱吧 — 如果电话上我们发现真是这种情况，我会直接这么告诉您。
您考虑 AI 主要是因为它现在很时髦。这完全可以理解，但值得停一下：客户通常关心的是您接不接电话，而不是后面跑的是什么。如果我们能找出一件 AI 真能解决的具体问题，那很好。如果没有，那也是个不错的答案。

拿不准？预约电话 →

如果您不确定自己属于哪一边，这正是那通免费电话的用处。

每次交付都包含

我们构建的每个 AI 功能默认得到什么。

不是 upsell。我们怎么让 AI 保持诚实。

基于您的真实数据
第一天起就跟踪成本
3 秒内给答案
您能看清它在干什么
坏了有备用方案
高风险的事留人工审批
prompt 和数据归您所有

做法

我们怎么真正构建 AI 功能。

按任务挑模型。嵌进工作真正发生的地方。升级之前先量一量。

合适任务的合适模型

Claude 处理重思考的活，OpenAI 做快速分类和信息提取，更便宜的小模型干量大的苦力活。混搭不嫁给单一厂商 — 下个月有更好的模型出来，您改个配置就升级，不用重写。

答题之前先读您的东西

在任何东西上线前，我们用您实际业务里的 30–100 个真实例子跑它并打分。准确率、每条回答的成本、它多频繁拒绝。如果数字过不了门槛，我们调或者收手 — 您不为通不过测试的生产代码买单。

上线之前先测试

任何东西上线前，我都会拿您生意里 30–100 个真实例子跑一遍并打分。准确率、每次回答的成本、拒答的频次。数字过不了线，就调参或者直接放弃 — 您不用为过不了测试的生产代码买单。

嵌进您已经工作的地方

AI 出现在您的网站、应用、邮件草稿、Power Automate 流程里 — 不是再多一个要记得去登的标签页。最好的 AI 功能是那个没人需要登录的。

我们每天都在出 AI — 我们的和客户的。

我们每天用 Claude 写生产代码，在我们自己的 Rec Soccer 应用里跑多步骤 AI 工作流，并在前一份工作中用 AI 辅助自动化替换了大约 $40K/年的供应商报告。Attuned Ventures 不卖我们读到的东西 — 我们卖已经在我们自己机器上跑着的东西。

我们用来构建的模型

驱动您这次交付的 AI 模型。

我们不忠于一个供应商。我们挑在您任务上获胜的模型 — 准确率、成本、速度 — 出更好的就换。用量计费到您的账户上，不是我们，所以您从不为 token 支付加价。

Claude

Anthropic

我在推理、长上下文、严谨写作和工具调用上的默认选择。大多数任务用 Claude Sonnet，硬骨头上 Opus。

GPT

OpenAI

便宜、快速的分类和结构化信息提取。需要"读这封邮件把发票号抽出来"这种大批量活儿时，首选它。

Gemini

Google

超大上下文窗口和强多模态 — 一次性读完整的 PDF、长会议纪要或整个代码库。和 Google Workspace 数据配合得很顺。

Llama

ElevenLabs

语音

我听过的最好的语音 — 克隆音色、多语言、对话式语音代理。AI 要像真人说话，就选它。

Sora + Nano Banana

OpenAI · Google

Sora 出视频，Nano Banana 出图（Google 的 Gemini 2.5 Flash Image）。用在营销素材、演示片、广告创意、产品样图、社交贴文 — 预算里没有摄制组、没有设计师的时候。

sora.com deepmind.google

再加上真有必要时才上的专门服务 — Whisper 和 Deepgram 做语音转文字，Azure OpenAI 或 Amazon Bedrock 处理强监管或企业合同，Hugging Face 覆盖开源模型的长尾。哪个在您任务上胜出就用哪个。

套餐

三种起步方式。挑合适的。

每个 package 锚定在您的数据上、上线前评估、归您所有。范围是典型值 — 在 discovery 通话之后我们发一页固定报价。

星火

典型价格区间 $500–$2K

工期: 1–2 周
范围: 单个功能
语言: 英语

针对真实任务的探索 — 做什么、哪里好、哪里坏
按 30 个以上真实例子挑选和调教模型 + prompt
结构化输出（JSON schema），下游工具可以直接用
接进您已有的邮箱、CRM、表格或工作流

启动星火项目

堆栈

典型价格区间 $2K–$8K

工期: 3–5 周
范围: 多步工作流
语言: 英语 + 1 种

包含星火套餐的一切
基于您文档、PDF、表格、Notion 或 Slack 导出的 RAG 流水线
针对您内容调优的向量库 + 切块策略
每个答案都附出处 — 不搞"信我就行"的回答

启动堆栈项目

套件

典型价格区间 $8K–$15K+

工期: 6–12 周
范围: 多功能、嵌入应用
语言: 2–12 种语言

包含堆栈套餐的一切
工具调用 — AI 调您的 API、CRM、日历、ERP 或自定义接口
带重试、回退和人工审批关口的多步代理循环
该用多模态就用 — 语音（STT/TTS）、图像、PDF

启动套件项目

加购项

额外功能，值当的时候再加。

可以搭在任何套餐上，或者等用例长起来再加。

RAG 语料 / 向量库

$800–$2.5K

把您的文档摄入、切块、嵌入并索引 — 还有内容变动时重跑摄入的任务。Firestore 向量、Pinecone 或 pgvector。

语音（STT + TTS）

$1K–$3K

Whisper 或 Deepgram 做语音转文字，ElevenLabs 或 OpenAI 的音色做回复。电话、浏览器或应用内都行。

视觉 / 图像理解

$800–$2K

读收据、证件、表单、截图、产品照片。抽出结构化数据，或者回答图里有什么。

评测套件

$600–$1.5K

一份测试集、一套评分标准、一条命令的运行器，让您在上线前能看到每次 prompt 或模型变动的影响。

Prompt 版本管理界面

$1K–$2.5K

一个小的管理后台，您可以在里面编辑 prompt、做 A/B 测试、一键回滚 — 不用重新部署应用。

月度 AI 年付

$300–$1K / 月

Prompt 调优、成本监控、有新模型出来就升级、以及"它怎么这么干"的追查 — 随叫随到。

流程

一个 AI 项目实际上是怎么走的。

没有魔杖式 demo。一通电话、一个限定范围的试点、真的测量，然后才上生产 — 或者老实叫停。

20 分钟咨询电话

我们问您想修什么任务、今天谁在做、什么是"好"、数据在哪。如果 AI 不是对的工具，我们会说 — 有时候答案是 Power Automate flow 或一个 SQL view。

限定范围的试点

48 小时之内您拿到一份固定报价 — 一个功能、一个模型、一个成功指标。我们拿您数据里 30–100 个真实例子来建，不是编的。

用评测来量

上线之前我们先打分。准确率、每次调用成本、p95 延迟、拒答率。数字过不了线，就调参、换模型或者放弃 — 您不用为过不了测试的生产代码买单。

上线并迭代

活在您的 app 里，实时监控，带您能看的日志。大多数客户把我们留在小额月费上来调 prompt 和跟进模型升级；有些没留。两种都行。

常见问题

大家通常会问的问题。

全部展开全部收起

如果 AI 答错了怎么办？

比您看到的演示少，但从不是零 — 这就是为什么每次构建都用 retrieval 锚定在您的数据上、用结构化输出验证、并在上线前用真实样例衡量。对高风险任务我们加一个人工审批步骤。诚实的回答是：AI 会出错，工程就是要在用户之前抓住它。

AI 用量谁出钱 — 我还是您？

您的，直接计费到您的 OpenAI / Anthropic 账户。我们不转售 token，也不在用量上加价。您看到每次调用的确切成本，如果哪天我们分开，钥匙（和花费）留在您手上。

每月实际运行要多少钱？

对一个 Spark 功能，常常每月 $5–$50 在 API 调用上。对一个带 RAG 的 Stack 助手，根据流量典型每月 $30–$300。开了 prompt caching 之后，重复查询能便宜 50–80%。我们从第一天起就给您看 dashboard，所以没意外。

我的数据隐私怎么办？

OpenAI 和 Anthropic 默认都按合同不在 API 流量上训练。您的数据住在您的账户里（Firestore、Pinecone、S3 — 您用什么都行），AI 调用从您的基础设施在 server-side 发生，除非您要求否则什么都不会被记录到第三方 SaaS。对受监管的工作，我们也可以使用 Azure OpenAI 或 Bedrock 以获得额外的合同覆盖。

Claude、GPT、Gemini、Llama — 您到底用哪个？

全部主流的都用 — 答案就是"哪个最适合具体那件任务就用哪个"。四家大型 AI 提供商各有所长：Claude（来自 Anthropic）是我们在严谨写作、推理和调用业务工具时的默认。GPT（来自 OpenAI）非常适合大批量、又快又便宜的分类活。Gemini（来自 Google）在需要处理超大上下文时胜出 — 整份 PDF、长会议纪要 — 或者您的业务本身就在 Google Workspace 里。Llama（来自 Meta）适合您必须在自己服务器上跑 AI 的场景，尤其是那些数据不能离开自家场地的强监管行业。对您来说的好消息：我们写一切的方式，都让 AI 提供商可以通过一次配置变更切换。下一个更好的模型出来时，您升级不用重写。

技术细节：语音我们用 ElevenLabs；图像生成用 Google 的 Gemini 2.5 Flash Image（"Nano Banana"），视频用 OpenAI 的 Sora。全都通过同一层抽象走。

聊一聊

告诉我们您厌烦的任务。我们告诉您 AI 是不是对的解。

第一通电话大约 20 分钟 — 就是真实地聊一聊正在吃掉您时间的那件事。您挂电话时会带着一个清晰的下一步：一个限定范围的试点、一个建议，或者有时是一句诚实的"这是电子表格的问题，不是 AI 的问题"。哪一种合适，您听到的就是哪一种。

— Quinton

预约免费咨询电话 hello@attunedventures.com