先做预算再做产品
PoC 阶段可以感性掏腰包,但月用量过了 $200 没预算就是无底洞。常见死法:
- 用户暴涨但定价没跟上,月 API 账单超过月营收
- 默认用 Opus,单次对话成本是 Sonnet 的 5 倍
- Prompt 没缓存,重复 system prompt 占 60% token
- 给免费用户开通无限调用,被薅光
预算就是「在用户付费意愿与 API 成本之间画一条红线」。
成本科目拆解
| 科目 | 占比 | 典型月支出(月用量 $500 时) |
|---|---|---|
| 推理调用 token(input + output) | 70-80% | $350-400 |
| Embeddings 嵌入 | 5-10% | $25-50 |
| 重试与失败请求浪费 | 3-8% | $15-40 |
| 工具调用 / Function Call 额外 token | 5-15% | $25-75 |
| 周边(向量库 / 缓存层 / 日志) | 8-15% | $40-75 |
计算口径:以 Anthropic 2026-05 公布单价(Sonnet input $3 / output $15 per 1M tokens)为基准。
四个阶段的预算模型
阶段 1:PoC(月营收 $0)
- 月预算:$30-50(自费)
- 仅用 Haiku / DeepSeek V3 做开发期调试
- 目标:跑通端到端、收集真实 prompt 样本
阶段 2:早期付费(月营收 $0-500)
- 月预算:$80-180
- 主力 Sonnet(核心对话)+ Haiku(轻任务)
- 开启 Prompt Caching、限速、每日免费配额
- 目标:稳住毛利率 ≥ 55%
阶段 3:规模化(月营收 $500-2000)
- 月预算:80-700
- 主力 Sonnet,部分场景上 GPT-4o / Gemini Flash
- 开始评估自营官方 vs 中转混合
- 目标:毛利率 ≥ 60%
阶段 4:成熟(月营收 $2000+)
- 月预算:$700-3500
- 多 provider 路由 + 自营官方 key + 用量监控
- 谈 Anthropic / OpenAI Volume Discount
- 目标:毛利率 ≥ 65%
预算落地公式
复制到 Google Sheets,按月填入即可:
A1: 月活付费用户数 U
B1: 客单价 P
C1: 月营收 = U × P
D1: API 成本上限 = C1 × 0.35
E1: 单付费用户 API 月成本 = D1 / U
实例:U=50、P=$19 → 月营收 $950 → API 上限 $332 → 单用户 API 预算 $6.65。
超支预警机制
- 日预警:每日 API 用量超过 (月预算/30 × 1.3) 触发邮件
- 周预警:周累计超过预算 30% 自动降级到便宜模型
- 月红线:月底前 7 天若已用 85% 预算,对免费用户冻结调用
- 工具:Helicone / Langfuse 自带 dashboard;OneAPI 自托管也有阈值告警
中转方在预算里的角色
中转方对预算最大的价值不是「便宜」(实际加价 5-30%),而是「让你免外卡 / 免公司主体启动」。预算阶段 1-2 用中转完全合理;进入阶段 3,把独立开发者可用的 Claude / OpenAI API 中转作为主力的同时,预留 1-2 个月并跑窗口去办海外卡 + 注册官方账号。
AI SaaS API 预算的准备材料
一个人运营时可以用表格压住复杂度:负责人、后台入口、到期日、费用来源和回滚动作各占一列,避免换服务商时才发现资料缺口。
涉及 Stripe、公司注册、税表或签证的内容,只能作为操作参考。当前页面没有覆盖你所在司法辖区的特殊规定时,不应把它当成法律或税务意见。
AI SaaS API 预算最怕把法律主体、收款工具和产品代码混成一个问题。动手前看清客服成本、现金流和入口位置,金额较大或涉及税务时应交给专业顾问处理。