测试方法 / 数据来源
- 测试期:2026-02 至 2026-04,3 个月数据
- 应用:一个 PDF 文档对话 SaaS,月活 200 用户、付费 50 用户
- 数据来源:自己运营数据 + 5 位 indie hacker 朋友的脱敏数据
- 模型:Claude 3.5 Sonnet 主路、Haiku 辅助
- 测试环境:境外 Hetzner 服务器 + 直连 Anthropic 官方 + 部分中转 fallback
单付费用户经济模型
用量分布(200 月活用户)
| 用户层级 | 占比 | 月对话次数中位数 | 月 token 中位数 |
|---|---|---|---|
| 轻度(< 10 次/月) | 40% | 5 | 5k |
| 中度(10-50 次/月) | 45% | 25 | 30k |
| 重度(50-200 次/月) | 13% | 100 | 150k |
| 极重度(> 200 次/月) | 2% | 500 | 1M |
成本与定价
单用户月 API 成本(中位数):
Sonnet 输入 25k × $3/MTok = $0.075
Sonnet 输出 5k × $15/MTok = $0.075
Cache read(80% 命中)20k × $0.3/MTok = $0.006
小计 ≈ $0.16
但 50 个付费用户里有 7 个重度(150k)+ 1 个极重度(1M):
重度 7 人 × $0.96 = $6.72
极重度 1 人 × $6.40 = $6.40
中度 22 人 × $0.32 = $7.04
轻度 20 人 × $0.06 = $1.20
50 付费用户月 API 成本:约 $21
单付费用户摊薄:$0.42
这是优化后的数据(Prompt Caching + 模型降级都开了)。优化前 $0.42 是 $1.10,省 60%。
客单价 + 毛利
客单价:$19/月
付费用户 50 人 × $19 = $950 月营收
扣 Stripe 处理费 3%:$921
成本:
API 成本 $21
Vector DB(Pinecone Starter)$20
服务器 $9
其他(域名 / 监控 / 邮件)$10
合计 $60
毛利率:($921 - $60) / $921 = 93%
但这是「全部付费用户均摊」。实际 unit economics 要看「单付费用户净利」:
单付费用户营收:$19 × (1 - 3%) = $18.43
单付费用户 API 成本:$0.42
单付费用户固定成本摊薄:($20 + $9 + $10) / 50 = $0.78
单付费用户毛利:$18.43 - $0.42 - $0.78 = $17.23
毛利率:93%
三档客单价压力测试
如果定价不同,能撑得住吗?
| 客单价 | 单用户成本 | 单用户毛利 | 毛利率 | 评价 |
|---|---|---|---|---|
| $9.9 | $1.20 | $8.30 | 86% | 健康 |
| $19 | $1.20 | $17.30 | 91% | 优秀 |
| $4.9 | $1.20 | $3.49 | 73% | 紧 |
| $2.9 | $1.20 | $1.46 | 51% | 警戒 |
| $0.99 | $1.20 | -$0.30 | 亏损 | 不可行 |
注:单用户成本含 API + 固定成本摊薄,且假设固定成本随用户数线性摊薄。
重度用户敏感性分析
实际 AI SaaS 用户行为长尾——20% 用户消耗 60% token。
如果 20% 重度用户用量再 ×3:
150k → 450k tokens/月
单重度用户 API 成本 $0.96 → $2.88
50 用户月 API 成本 $21 → $48
客单价 $19 时:
营收 $921
成本 $60 - $21 + $48 = $87
毛利率 91%(依然健康)
毛利率有缓冲。但如果客单价 $4.9:
客单价 $4.9 重度用量 ×3 场景:
单重度用户成本 $2.88(中位数)→ p90 $5+
客单价 $4.9 cover 不住 p90 重度用户
→ 必须设月度配额
不同客单价下的建议配额
| 客单价 | 月度配额 | 等效模型 |
|---|---|---|
| $4.9 | 50 次对话 / 5 万 tokens | Sonnet + Haiku 混合 |
| $9.9 | 200 次对话 / 30 万 tokens | Sonnet 主力 |
| $19 | 500 次对话 / 100 万 tokens | Sonnet 主力 + Opus 5% |
| $49+ | 不限 + Opus 优先 | Opus / Sonnet 混合 |
谁该套用这个模型
直接套用
- 文档 / 知识库对话 SaaS
- 客服 chatbot
- 长文本摘要类工具
需调整
- 代码生成应用:Opus 用量更大,成本上调 3-5×
- 多模态应用:Vision token 计费不同
- Agent 多步骤应用:单次会话 token 累积更高
不能套用
- 视频 / 音频生成(GPU 成本结构完全不同)
- Fine-tuning 类(训练成本一次性大额)
局限
- 数据基于 2026 上半年价格,价格变动后需重算
- 没区分单租户 vs 多租户架构
- 重度用户行为预测不准(PMF 早期用户行为变动大)
基础设施:API 连接稳定性
单用户成本测算依赖准确的 token 用量统计,调用层不能掉链子。配一条AI SaaS 出海可用的 API 中转做主路,避免「调用失败重试」让 token 用量异常上涨干扰你的成本模型。
关联文章
AI SaaS token 成本的长期成本
一个人运营时可以用表格压住复杂度:负责人、后台入口、到期日、费用来源和回滚动作各占一列,避免换服务商时才发现资料缺口。
涉及 Stripe、公司注册、税表或签证的内容,只能作为操作参考。当前页面没有覆盖你所在司法辖区的特殊规定时,不应把它当成法律或税务意见。
AI SaaS token 成本最怕把法律主体、收款工具和产品代码混成一个问题。动手前看清权限限制、维护成本和公司主体,金额较大或涉及税务时应交给专业顾问处理。