真正干活的 AI — 不是戴礼帽的聊天机器人。
您不需要再来一个 ChatGPT 订阅。您需要的是能处理掉您这周具体卡点的 AI — 起草报价、今天第 40 次回答同一个客户问题、接电话前先摘要一下这位客户的历史。嵌进您已经在用的工具里,基于您自己的数据,价格算得过账。$500 起。
对您的生意,AI 到底值不值得做?
把话说在前头。
AI 可能值回票价,如果…
- 您一遍又一遍地做同一件事 — 起草报价、回答同一个问题、整理发票 — 而且每周吃掉好几个小时。
- 您攒了一大堆数据(订单、工单、邮件、PDF、电话记录),没人有时间读,但答案都埋在里面。
- 您的团队每天被客户问同样的 10 个问题,您的网站本来可以帮着答,只要它知道怎么答。
- 您想多接活,但不想再招一个人专门处理随之而来的行政。
- 您自己玩过 ChatGPT,心想"一定有办法把这东西接进我真正的生意里,而不是另开一个浏览器标签"。
可能先别做,如果…
- 真正的问题是您还没有数据。没有基础数据的 AI 就是幻觉机器 — 先把数据搞好,再来谈。
- 您想要"一个 AI",但您指不出它具体要做哪件事。回头带一件手上真实的事来,我们围绕那一件事建一个好答案。
- 您的团队已经用电子表格把流程搞定了,还挺好使。别花冤枉钱 — 电话上我会直接告诉您。
- 您追 AI 是因为它流行。客户不关心引擎盖下是什么 — 他们关心您接不接电话。
如果您不确定自己属于哪一边,这正是那通免费电话的用处。
我做的每个 AI 功能默认都带这些。
不是加价项。是我让 AI 不乱来的办法。
- 基于您的真实数据
- 第一天起就跟踪成本
- 3 秒内给答案
- 您能看清它在干什么
- 坏了有备用方案
- 高风险的事留人工审批
- prompt 和数据归您所有
我到底是怎么建 AI 功能的。
按任务挑模型。嵌进工作真正发生的地方。升级之前先量一量。
合适任务的合适模型
Claude 处理重思考的活,OpenAI 做快速分类和信息提取,更便宜的小模型干量大的苦力活。混搭不嫁给单一厂商 — 下个月有更好的模型出来,您改个配置就升级,不用重写。
答题之前先读您的东西
AI 会从您的文档、PDF、订单、过往客户邮件里调取 — 凡是相关的都拉进来 — 并注明出处。这就是"有用"和"尴尬"之间的大部分差距。不再编价格、编政策、编客户名字。
上线之前先测试
任何东西上线前,我都会拿您生意里 30–100 个真实例子跑一遍并打分。准确率、每次回答的成本、拒答的频次。数字过不了线,就调参或者直接放弃 — 您不用为过不了测试的生产代码买单。
嵌进您已经工作的地方
AI 出现在您的网站、应用、邮件草稿、Power Automate 流程里 — 不是再多一个要记得去登的标签页。最好的 AI 功能是那个没人需要登录的。
我每天都在上线 AI — 自己的和客户的。
我天天用 Claude 写生产代码,在自己的 Rec Soccer 应用里跑多步 AI 工作流,还在之前的岗位上用 AI 辅助自动化替代了约每年 $40K 的供应商报表。我不是在卖我在文章里读到的东西 — 我卖的是已经跑在我自己机器上的东西。
驱动您这次交付的 AI 模型。
我不嫁给单一厂商。我挑的是在您这件任务上胜出的模型 — 准确率、成本、速度 — 有更好的出来就换掉。用量按您的账户计费,不是我的,所以您永远不会被加 token 溢价。
Claude
Anthropic我在推理、长上下文、严谨写作和工具调用上的默认选择。大多数任务用 Claude Sonnet,硬骨头上 Opus。
GPT
OpenAI便宜、快速的分类和结构化信息提取。需要"读这封邮件把发票号抽出来"这种大批量活儿时,首选它。
Gemini
Google超大上下文窗口和强多模态 — 一次性读完整的 PDF、长会议纪要或整个代码库。和 Google Workspace 数据配合得很顺。
Llama
Meta开放权重模型,适合您需要自己跑的场景 — 在自己的服务器上、在强监管行业、或者彻底不让数据碰第三方 API。
ElevenLabs
语音我听过的最好的语音 — 克隆音色、多语言、对话式语音代理。AI 要像真人说话,就选它。
Sora + Nano Banana
OpenAI · GoogleSora 出视频,Nano Banana 出图(Google 的 Gemini 2.5 Flash Image)。用在营销素材、演示片、广告创意、产品样图、社交贴文 — 预算里没有摄制组、没有设计师的时候。
sora.com deepmind.google再加上真有必要时才上的专门服务 — Whisper 和 Deepgram 做语音转文字,Azure OpenAI 或 Amazon Bedrock 处理强监管或企业合同,Hugging Face 覆盖开源模型的长尾。哪个在您任务上胜出就用哪个。
三种起步方式。挑合适的。
每个套餐都基于您的数据、上线前先评测过、归您所有。价格区间是典型值 — 咨询电话之后我会寄一份固定价格的一页报价单。
星火
- 工期
- 1–2 周
- 范围
- 单个功能
- 语言
- 英语
- 针对真实任务的探索 — 做什么、哪里好、哪里坏
- 按 30 个以上真实例子挑选和调教模型 + prompt
- 结构化输出(JSON schema),下游工具可以直接用
- 接进您已有的邮箱、CRM、表格或工作流
堆栈
- 工期
- 3–5 周
- 范围
- 多步工作流
- 语言
- 英语 + 1 种
- 包含星火套餐的一切
- 基于您文档、PDF、表格、Notion 或 Slack 导出的 RAG 流水线
- 针对您内容调优的向量库 + 切块策略
- 每个答案都附出处 — 不搞"信我就行"的回答
套件
- 工期
- 6–12 周
- 范围
- 多功能、嵌入应用
- 语言
- 2–12 种语言
- 包含堆栈套餐的一切
- 工具调用 — AI 调您的 API、CRM、日历、ERP 或自定义接口
- 带重试、回退和人工审批关口的多步代理循环
- 该用多模态就用 — 语音(STT/TTS)、图像、PDF
额外功能,值当的时候再加。
可以搭在任何套餐上,或者等用例长起来再加。
RAG 语料 / 向量库
$800–$2.5K把您的文档摄入、切块、嵌入并索引 — 还有内容变动时重跑摄入的任务。Firestore 向量、Pinecone 或 pgvector。
语音(STT + TTS)
$1K–$3KWhisper 或 Deepgram 做语音转文字,ElevenLabs 或 OpenAI 的音色做回复。电话、浏览器或应用内都行。
视觉 / 图像理解
$800–$2K读收据、证件、表单、截图、产品照片。抽出结构化数据,或者回答图里有什么。
评测套件
$600–$1.5K一份测试集、一套评分标准、一条命令的运行器,让您在上线前能看到每次 prompt 或模型变动的影响。
Prompt 版本管理界面
$1K–$2.5K一个小的管理后台,您可以在里面编辑 prompt、做 A/B 测试、一键回滚 — 不用重新部署应用。
月度 AI 年付
$300–$1K / 月Prompt 调优、成本监控、有新模型出来就升级、以及"它怎么这么干"的追查 — 随叫随到。
一个 AI 项目实际上是怎么走的。
没有魔杖式 demo。一通电话、一个限定范围的试点、真的测量,然后才上生产 — 或者老实叫停。
20 分钟咨询电话
我问您想解决什么任务、今天是谁在干、"做得好"长什么样、数据在哪儿。如果 AI 不是正确的工具,我会直说 — 有时候 Power Automate 流程或者一个 SQL 视图就是答案。
限定范围的试点
48 小时之内您拿到一份固定报价 — 一个功能、一个模型、一个成功指标。我们拿您数据里 30–100 个真实例子来建,不是编的。
用评测来量
上线之前我们先打分。准确率、每次调用成本、p95 延迟、拒答率。数字过不了线,就调参、换模型或者放弃 — 您不用为过不了测试的生产代码买单。
上线并迭代
在您的应用里上线,实时监控,日志您能看。大多数客户会留我做一个小额年付,负责调 prompt 和跟上模型升级;也有不留的。都行。
大家通常会问的问题。
比您看到的那些 demo 要少,但永远不是零 — 这就是为什么每次交付都基于您的数据、用检索补充、用结构化输出验证、上线前先拿真实例子量过。高风险任务我还会加一道人工审批。实话是:AI 会出错,工程的意义就在于在用户发现之前先抓住它。
您的,直接计入您的 OpenAI / Anthropic 账户。我不转卖 token,也不在用量上抽成。每一次调用花多少您看得一清二楚,真要分开,key(和花销)都留在您这边。
一个星火功能,通常每月 $5–$50 的 API 调用。一个带 RAG 的堆栈助手,按流量通常每月 $30–$300。开启 prompt 缓存后,重复查询能便宜 50–80%。第一天起我就给您看仪表盘,不会有意外。
OpenAI 和 Anthropic 都在合同上默认不拿 API 流量做训练。您的数据存在您自己的账户里(Firestore、Pinecone、S3 — 您用什么就存什么),AI 调用从您自己的基础设施服务端发起,任何东西都不会日志到第三方 SaaS,除非您特别要求。强监管的活儿我也能用 Azure OpenAI 或 Bedrock 拿到额外的合同保障。
都用,按任务挑。Claude(Sonnet/Opus)是我在推理、严谨写作和工具调用上的默认。OpenAI GPT 在便宜、快速的分类和大批量结构化提取上很强。Google Gemini 在上下文超大时胜出 — 整份 PDF、长会议纪要、整个代码库 — 或者数据本来就在 Google Workspace 里。Meta Llama 是您需要在自己服务器上跑、在强监管行业、或者彻底不让数据碰第三方 API 时的首选。语音我主要用 ElevenLabs;视频和图像用 Sora 和 Nano Banana(Google 的 Gemini 2.5 Flash Image)。同一份代码,改一个配置就切换 — 下一个模型一出来,您升级不用重写。
告诉我您已经干烦了的那件事。我来告诉您 AI 是不是正确的解法。
第一通电话大约 20 分钟。您挂电话时会有一个更清晰的计划 — 一个限定范围的试点、一个建议,或者一句诚实的"这是电子表格能解决的问题,不是 AI 的"。这三种情况都会发生。