核心参数一览
| 维度 | Anthropic API | AWS Bedrock Claude |
|---|---|---|
| 模型 | Claude 全系(最新 Opus / Sonnet / Haiku) | Claude 全系(通常滞后 1-2 周) |
| 单价 | 官方公开 | 与官方基本一致 |
| Prompt Caching | ✅ 50-90% 折扣 | 部分支持 |
| Tier 系统 | 4 tier(Free/Build/Scale1/Scale2) | AWS quota |
| 新账户限速 | 50 RPM / 50k TPM 起 | 可申请提升 |
| 合规认证 | SOC 2 / HIPAA(自签 BAA) | SOC 2 / HIPAA / FedRAMP / IRAP / PCI DSS |
| 多 Region | us-east-1 主力 + EU 备 | 10+ region 全球 |
| SDK | Anthropic 官方 SDK | boto3 / AWS SDK |
| 注册条件 | 信用卡 + 邮箱 | 信用卡 + 手机 + 地址 |
测试环境:us-east-1 / eu-central-1,2026-04 至 2026-05 真实工作负载。
1. 定价
Anthropic 直连(Claude 3.5 Sonnet, 2026-05)
- Input:$3 / 1M tokens
- Output:5 / 1M tokens
- Prompt Caching 写入:$3.75 / 1M tokens
- Prompt Caching 读取:$0.30 / 1M tokens(90% off)
- Batch API:50% 折扣
AWS Bedrock Claude 3.5 Sonnet(us-east-1, 2026-05)
- Input:$3 / 1M tokens
- Output:5 / 1M tokens
- Cross-region Inference:稍贵但可用性更高
- Prompt Caching 已支持但折扣比例略差
重度 caching 场景
如果你的 system prompt 占 token 大头(典型 RAG / Agent 场景),Anthropic 直连用 Prompt Caching 能省 50-80% 总成本,Bedrock 节省比例略低。
2. 限速
Anthropic Tier 系统
| Tier | RPM | TPM | 触发条件 |
|---|---|---|---|
| Free | 5 | 25k | 新账户 |
| Build 1 | 50 | 50k | $5 充值 |
| Build 2 | 1000 | 100k | $40 充值 + 7 天 |
| Build 3 | 2000 | 200k | $200 充值 + 7 天 |
| Build 4 | 4000 | 400k | $400 充值 + 14 天 |
| Scale 1 | 5000+ | 800k+ | $1k+ 月用量 + 申请 |
| Scale 2 | 自定义 | 自定义 | 合同协商 |
新账户跑生产很可能撞 limit,需要预热充值 + 等账期。
Bedrock 限速
AWS 服务配额(Service Quotas)模式,默认配额较低但可以申请提升。企业账户经常拿到 10k+ RPM,且支持 Cross-region Inference 自动跨区分流。
3. 合规
Anthropic 直连
- SOC 2 Type II
- HIPAA(自签 BAA)
- GDPR 兼容
- 默认 30 天日志保留,可申请 ZDR(Zero Data Retention)
Bedrock
- SOC 2 Type II
- HIPAA + BAA(AWS 自动 enable)
- FedRAMP High
- IRAP
- PCI DSS
- VPC Endpoint 走私网
强合规场景 Bedrock 几乎是唯一选择。
4. SDK 与代码
Anthropic 直连
from anthropic import Anthropic
client = Anthropic(api_key="sk-ant-...")
resp = client.messages.create(
model="claude-3-5-sonnet-20241022",
max_tokens=1024,
messages=[{"role": "user", "content": "Hi"}],
)
Bedrock
import boto3, json
client = boto3.client("bedrock-runtime", region_name="us-east-1")
resp = client.invoke_model(
modelId="anthropic.claude-3-5-sonnet-20241022-v2:0",
body=json.dumps({
"anthropic_version": "bedrock-2023-05-31",
"max_tokens": 1024,
"messages": [{"role": "user", "content": "Hi"}],
}),
)
差异:modelId 命名、AWS Signature v4 鉴权、body 包一层 anthropic_version。
5. 谁该选哪个
选 Anthropic 直连
- 月用量 $0-2000 个人 / 小团队
- 重度用 Prompt Caching
- 需要最快用上新版本 Claude
- 不在 AWS 生态
选 Bedrock
- 公司主基建在 AWS(IAM / VPC / CloudWatch)
- 强合规(HIPAA / FedRAMP / IRAP)
- 需要全球多 Region 覆盖
- 已有 AWS Enterprise Agreement
同时用(高级)
主路 Anthropic 直连 + 备路 Bedrock。LiteLLM Proxy 配两个 channel,主线限速 / 异常自动 fallback Bedrock。运维成本略高,可用性显著提升。
局限
- Bedrock 部分 region 仅有 Sonnet 没有 Opus / Haiku
- Anthropic 直连企业账户 SLA 弱于 Bedrock
- 跨 region 跨 cloud 的延迟差异有时影响 streaming 体验
- 价格随时变,下单前以官网为准
国内访问的稳定性
无论选哪条路,国内访问 api.anthropic.com 或 Bedrock endpoint 都依赖海外网络。可以考虑配一条 LLM API 中转作为 Anthropic 直连的国内通道,把 ANTHROPIC_BASE_URL 切过去;Bedrock 可以通过 AWS PrivateLink 或自建服务器经稳定线路转发。
相关阅读
- LiteLLM vs OpenRouter vs OneAPI 多模型网关对比 — 统一管理多 provider 的方案对比
- Indie 开发者 LLM API 成本结构与中转选型 — 独立开发者的成本优化路线
- API Gateway 自托管 vs 托管 — 网关选型的详细对比
- Anthropic API 429 — Anthropic 限流机制的排查和应对