核心参数一览

维度Anthropic APIAWS Bedrock Claude
模型Claude 全系(最新 Opus / Sonnet / Haiku)Claude 全系(通常滞后 1-2 周)
单价官方公开与官方基本一致
Prompt Caching✅ 50-90% 折扣部分支持
Tier 系统4 tier(Free/Build/Scale1/Scale2)AWS quota
新账户限速50 RPM / 50k TPM 起可申请提升
合规认证SOC 2 / HIPAA(自签 BAA)SOC 2 / HIPAA / FedRAMP / IRAP / PCI DSS
多 Regionus-east-1 主力 + EU 备10+ region 全球
SDKAnthropic 官方 SDKboto3 / AWS SDK
注册条件信用卡 + 邮箱信用卡 + 手机 + 地址

测试环境:us-east-1 / eu-central-1,2026-04 至 2026-05 真实工作负载。

1. 定价

Anthropic 直连(Claude 3.5 Sonnet, 2026-05)

  • Input:$3 / 1M tokens
  • Output:5 / 1M tokens
  • Prompt Caching 写入:$3.75 / 1M tokens
  • Prompt Caching 读取:$0.30 / 1M tokens(90% off)
  • Batch API:50% 折扣

AWS Bedrock Claude 3.5 Sonnet(us-east-1, 2026-05)

  • Input:$3 / 1M tokens
  • Output:5 / 1M tokens
  • Cross-region Inference:稍贵但可用性更高
  • Prompt Caching 已支持但折扣比例略差

重度 caching 场景

如果你的 system prompt 占 token 大头(典型 RAG / Agent 场景),Anthropic 直连用 Prompt Caching 能省 50-80% 总成本,Bedrock 节省比例略低。

2. 限速

Anthropic Tier 系统

TierRPMTPM触发条件
Free525k新账户
Build 15050k$5 充值
Build 21000100k$40 充值 + 7 天
Build 32000200k$200 充值 + 7 天
Build 44000400k$400 充值 + 14 天
Scale 15000+800k+$1k+ 月用量 + 申请
Scale 2自定义自定义合同协商

新账户跑生产很可能撞 limit,需要预热充值 + 等账期。

Bedrock 限速

AWS 服务配额(Service Quotas)模式,默认配额较低但可以申请提升。企业账户经常拿到 10k+ RPM,且支持 Cross-region Inference 自动跨区分流。

3. 合规

Anthropic 直连

  • SOC 2 Type II
  • HIPAA(自签 BAA)
  • GDPR 兼容
  • 默认 30 天日志保留,可申请 ZDR(Zero Data Retention)

Bedrock

  • SOC 2 Type II
  • HIPAA + BAA(AWS 自动 enable)
  • FedRAMP High
  • IRAP
  • PCI DSS
  • VPC Endpoint 走私网

强合规场景 Bedrock 几乎是唯一选择。

4. SDK 与代码

Anthropic 直连

from anthropic import Anthropic
client = Anthropic(api_key="sk-ant-...")
resp = client.messages.create(
    model="claude-3-5-sonnet-20241022",
    max_tokens=1024,
    messages=[{"role": "user", "content": "Hi"}],
)

Bedrock

import boto3, json
client = boto3.client("bedrock-runtime", region_name="us-east-1")
resp = client.invoke_model(
    modelId="anthropic.claude-3-5-sonnet-20241022-v2:0",
    body=json.dumps({
        "anthropic_version": "bedrock-2023-05-31",
        "max_tokens": 1024,
        "messages": [{"role": "user", "content": "Hi"}],
    }),
)

差异:modelId 命名、AWS Signature v4 鉴权、body 包一层 anthropic_version。

5. 谁该选哪个

选 Anthropic 直连

  • 月用量 $0-2000 个人 / 小团队
  • 重度用 Prompt Caching
  • 需要最快用上新版本 Claude
  • 不在 AWS 生态

选 Bedrock

  • 公司主基建在 AWS(IAM / VPC / CloudWatch)
  • 强合规(HIPAA / FedRAMP / IRAP)
  • 需要全球多 Region 覆盖
  • 已有 AWS Enterprise Agreement

同时用(高级)

主路 Anthropic 直连 + 备路 Bedrock。LiteLLM Proxy 配两个 channel,主线限速 / 异常自动 fallback Bedrock。运维成本略高,可用性显著提升。

局限

  • Bedrock 部分 region 仅有 Sonnet 没有 Opus / Haiku
  • Anthropic 直连企业账户 SLA 弱于 Bedrock
  • 跨 region 跨 cloud 的延迟差异有时影响 streaming 体验
  • 价格随时变,下单前以官网为准

国内访问的稳定性

无论选哪条路,国内访问 api.anthropic.com 或 Bedrock endpoint 都依赖海外网络。可以考虑配一条 LLM API 中转作为 Anthropic 直连的国内通道,把 ANTHROPIC_BASE_URL 切过去;Bedrock 可以通过 AWS PrivateLink 或自建服务器经稳定线路转发。

相关阅读