测试方法 / 数据来源

  • 测试期:2026-02 至 2026-04,3 个月数据
  • 应用:一个 PDF 文档对话 SaaS,月活 200 用户、付费 50 用户
  • 数据来源:自己运营数据 + 5 位 indie hacker 朋友的脱敏数据
  • 模型:Claude 3.5 Sonnet 主路、Haiku 辅助
  • 测试环境:境外 Hetzner 服务器 + 直连 Anthropic 官方 + 部分中转 fallback

单付费用户经济模型

用量分布(200 月活用户)

用户层级占比月对话次数中位数月 token 中位数
轻度(< 10 次/月)40%55k
中度(10-50 次/月)45%2530k
重度(50-200 次/月)13%100150k
极重度(> 200 次/月)2%5001M

成本与定价

单用户月 API 成本(中位数):
  Sonnet 输入 25k × $3/MTok = $0.075
  Sonnet 输出 5k × $15/MTok = $0.075
  Cache read(80% 命中)20k × $0.3/MTok = $0.006
  小计 ≈ $0.16

但 50 个付费用户里有 7 个重度(150k)+ 1 个极重度(1M):
  重度 7 人 × $0.96 = $6.72
  极重度 1 人 × $6.40 = $6.40
  中度 22 人 × $0.32 = $7.04
  轻度 20 人 × $0.06 = $1.20

50 付费用户月 API 成本:约 $21
单付费用户摊薄:$0.42

这是优化后的数据(Prompt Caching + 模型降级都开了)。优化前 $0.42 是 $1.10,省 60%。

客单价 + 毛利

客单价:$19/月
付费用户 50 人 × $19 = $950 月营收
扣 Stripe 处理费 3%:$921

成本:
  API 成本 $21
  Vector DB(Pinecone Starter)$20
  服务器 $9
  其他(域名 / 监控 / 邮件)$10
  合计 $60

毛利率:($921 - $60) / $921 = 93%

但这是「全部付费用户均摊」。实际 unit economics 要看「单付费用户净利」:

单付费用户营收:$19 × (1 - 3%) = $18.43
单付费用户 API 成本:$0.42
单付费用户固定成本摊薄:($20 + $9 + $10) / 50 = $0.78
单付费用户毛利:$18.43 - $0.42 - $0.78 = $17.23
毛利率:93%

三档客单价压力测试

如果定价不同,能撑得住吗?

客单价单用户成本单用户毛利毛利率评价
$9.9$1.20$8.3086%健康
$19$1.20$17.3091%优秀
$4.9$1.20$3.4973%
$2.9$1.20$1.4651%警戒
$0.99$1.20-$0.30亏损不可行

注:单用户成本含 API + 固定成本摊薄,且假设固定成本随用户数线性摊薄。

重度用户敏感性分析

实际 AI SaaS 用户行为长尾——20% 用户消耗 60% token。

如果 20% 重度用户用量再 ×3:
  150k → 450k tokens/月
  单重度用户 API 成本 $0.96 → $2.88
  50 用户月 API 成本 $21 → $48

客单价 $19 时:
  营收 $921
  成本 $60 - $21 + $48 = $87
  毛利率 91%(依然健康)

毛利率有缓冲。但如果客单价 $4.9:

客单价 $4.9 重度用量 ×3 场景:
  单重度用户成本 $2.88(中位数)→ p90 $5+
  客单价 $4.9 cover 不住 p90 重度用户
  → 必须设月度配额

不同客单价下的建议配额

客单价月度配额等效模型
$4.950 次对话 / 5 万 tokensSonnet + Haiku 混合
$9.9200 次对话 / 30 万 tokensSonnet 主力
$19500 次对话 / 100 万 tokensSonnet 主力 + Opus 5%
$49+不限 + Opus 优先Opus / Sonnet 混合

谁该套用这个模型

直接套用

  • 文档 / 知识库对话 SaaS
  • 客服 chatbot
  • 长文本摘要类工具

需调整

  • 代码生成应用:Opus 用量更大,成本上调 3-5×
  • 多模态应用:Vision token 计费不同
  • Agent 多步骤应用:单次会话 token 累积更高

不能套用

  • 视频 / 音频生成(GPU 成本结构完全不同)
  • Fine-tuning 类(训练成本一次性大额)

局限

  • 数据基于 2026 上半年价格,价格变动后需重算
  • 没区分单租户 vs 多租户架构
  • 重度用户行为预测不准(PMF 早期用户行为变动大)

基础设施:API 连接稳定性

单用户成本测算依赖准确的 token 用量统计,调用层不能掉链子。配一条AI SaaS 出海可用的 API 中转做主路,避免「调用失败重试」让 token 用量异常上涨干扰你的成本模型。

关联文章

AI SaaS token 成本的长期成本

一个人运营时可以用表格压住复杂度:负责人、后台入口、到期日、费用来源和回滚动作各占一列,避免换服务商时才发现资料缺口。

涉及 Stripe、公司注册、税表或签证的内容,只能作为操作参考。当前页面没有覆盖你所在司法辖区的特殊规定时,不应把它当成法律或税务意见。

AI SaaS token 成本最怕把法律主体、收款工具和产品代码混成一个问题。动手前看清权限限制、维护成本和公司主体,金额较大或涉及税务时应交给专业顾问处理。