如何估算用户月度 token 消耗？

拆解：单次会话 token = (input prompt + output response) × 上下文累积系数（1.5-3）。月会话次数 × 单次 token = 月人均 t。完整步骤、表格和例外情况请查看原文。

毛利率多少算健康？

SaaS 行业经验：垂直深度产品 70%+ 健康，Wrapper 类 50-60% 可接受，< 40% 警戒。AI 应用毛利低是常态——API 成本天花板锁死，差异化在 promp。完整步骤、表格和例外情况请查看原文。

客单价多少能 cover 重度用户？

经验：客单价 / 月人均 API 成本 ≥ 3。但 AI SaaS 用户行为长尾——20% 重度用户烧 60% token 成本。如果允许「无限用量」，重度用户单人月成本可能上 $。完整步骤、表格和例外情况请查看原文。

AI SaaS 单用户 token 成本测算与定价反推 | 评测对比

Q: 客单价多少能 cover 重度用户？

经验：客单价 / 月人均 API 成本 ≥ 3。但 AI SaaS 用户行为长尾——20% 重度用户烧 60% token 成本。如果允许「无限用量」，重度用户单人月成本可能上 $。完整步骤、表格和例外情况请查看原文。

测试方法 / 数据来源

测试期：2026-02 至 2026-04，3 个月数据
应用：一个 PDF 文档对话 SaaS，月活 200 用户、付费 50 用户
数据来源：自己运营数据 + 5 位 indie hacker 朋友的脱敏数据
模型：Claude 3.5 Sonnet 主路、Haiku 辅助
测试环境：境外 Hetzner 服务器 + 直连 Anthropic 官方 + 部分中转 fallback

单付费用户经济模型

用量分布（200 月活用户）

用户层级	占比	月对话次数中位数	月 token 中位数
轻度（< 10 次/月）	40%	5	5k
中度（10-50 次/月）	45%	25	30k
重度（50-200 次/月）	13%	100	150k
极重度（> 200 次/月）	2%	500	1M

成本与定价

单用户月 API 成本（中位数）：
  Sonnet 输入 25k × $3/MTok = $0.075
  Sonnet 输出 5k × $15/MTok = $0.075
  Cache read（80% 命中）20k × $0.3/MTok = $0.006
  小计 ≈ $0.16

但 50 个付费用户里有 7 个重度（150k）+ 1 个极重度（1M）：
  重度 7 人 × $0.96 = $6.72
  极重度 1 人 × $6.40 = $6.40
  中度 22 人 × $0.32 = $7.04
  轻度 20 人 × $0.06 = $1.20

50 付费用户月 API 成本：约 $21
单付费用户摊薄：$0.42

这是优化后的数据（Prompt Caching + 模型降级都开了）。优化前 $0.42 是 $1.10，省 60%。

客单价 + 毛利

客单价：$19/月
付费用户 50 人 × $19 = $950 月营收
扣 Stripe 处理费 3%：$921

成本：
  API 成本 $21
  Vector DB（Pinecone Starter）$20
  服务器 $9
  其他（域名 / 监控 / 邮件）$10
  合计 $60

毛利率：($921 - $60) / $921 = 93%

但这是「全部付费用户均摊」。实际 unit economics 要看「单付费用户净利」：

单付费用户营收：$19 × (1 - 3%) = $18.43
单付费用户 API 成本：$0.42
单付费用户固定成本摊薄：($20 + $9 + $10) / 50 = $0.78
单付费用户毛利：$18.43 - $0.42 - $0.78 = $17.23
毛利率：93%

三档客单价压力测试

如果定价不同，能撑得住吗？

客单价	单用户成本	单用户毛利	毛利率	评价
$9.9	$1.20	$8.30	86%	健康
$19	$1.20	$17.30	91%	优秀
$4.9	$1.20	$3.49	73%	紧
$2.9	$1.20	$1.46	51%	警戒
$0.99	$1.20	-$0.30	亏损	不可行

注：单用户成本含 API + 固定成本摊薄，且假设固定成本随用户数线性摊薄。

重度用户敏感性分析

实际 AI SaaS 用户行为长尾——20% 用户消耗 60% token。

如果 20% 重度用户用量再 ×3：
  150k → 450k tokens/月
  单重度用户 API 成本 $0.96 → $2.88
  50 用户月 API 成本 $21 → $48

客单价 $19 时：
  营收 $921
  成本 $60 - $21 + $48 = $87
  毛利率 91%（依然健康）

毛利率有缓冲。但如果客单价 $4.9：

客单价 $4.9 重度用量 ×3 场景：
  单重度用户成本 $2.88（中位数）→ p90 $5+
  客单价 $4.9 cover 不住 p90 重度用户
  → 必须设月度配额

不同客单价下的建议配额

客单价	月度配额	等效模型
$4.9	50 次对话 / 5 万 tokens	Sonnet + Haiku 混合
$9.9	200 次对话 / 30 万 tokens	Sonnet 主力
$19	500 次对话 / 100 万 tokens	Sonnet 主力 + Opus 5%
$49+	不限 + Opus 优先	Opus / Sonnet 混合

谁该套用这个模型

直接套用

文档 / 知识库对话 SaaS
客服 chatbot
长文本摘要类工具

需调整

代码生成应用：Opus 用量更大，成本上调 3-5×
多模态应用：Vision token 计费不同
Agent 多步骤应用：单次会话 token 累积更高

不能套用

视频 / 音频生成（GPU 成本结构完全不同）
Fine-tuning 类（训练成本一次性大额）

局限

数据基于 2026 上半年价格，价格变动后需重算
没区分单租户 vs 多租户架构
重度用户行为预测不准（PMF 早期用户行为变动大）

基础设施：API 连接稳定性

单用户成本测算依赖准确的 token 用量统计，调用层不能掉链子。配一条AI SaaS 出海可用的 API 中转做主路，避免「调用失败重试」让 token 用量异常上涨干扰你的成本模型。

关联文章

AI SaaS token 成本的长期成本

一个人运营时可以用表格压住复杂度：负责人、后台入口、到期日、费用来源和回滚动作各占一列，避免换服务商时才发现资料缺口。

涉及 Stripe、公司注册、税表或签证的内容，只能作为操作参考。当前页面没有覆盖你所在司法辖区的特殊规定时，不应把它当成法律或税务意见。

AI SaaS token 成本最怕把法律主体、收款工具和产品代码混成一个问题。动手前看清权限限制、维护成本和公司主体，金额较大或涉及税务时应交给专业顾问处理。