Anthropic API 和 AWS Bedrock Claude 是同一个模型吗？

是。Bedrock 上的 Claude 由 Anthropic 提供，模型权重相同。差异在「服务层」：定价、限速、SLA、合规认证、可用 region、SDK 协议等。模型质量本身。完整步骤、表格和例外情况请查看原文。

Bedrock Claude 比 Anthropic 直接贵还是便宜？

基本一致，部分场景 Bedrock 略贵 5-10%（AWS 加了运营费）。但 Bedrock 没有 prompt caching 的折扣（Anthropic 直连有），实际成本可。完整步骤、表格和例外情况请查看原文。

哪个限速更高？

Bedrock 更高且更灵活。Anthropic 直连限速按账户 tier 划分（Free / Build / Scale），新账号 RPM/TPM 上限低。Bedrock 走 A。完整步骤、表格和例外情况请查看原文。

Anthropic API 与 AWS Bedrock Claude 选型 | 对比判断

核心参数一览

维度	Anthropic API	AWS Bedrock Claude
模型	Claude 全系（最新 Opus / Sonnet / Haiku）	Claude 全系（通常滞后 1-2 周）
单价	官方公开	与官方基本一致
Prompt Caching	✅ 50-90% 折扣	部分支持
Tier 系统	4 tier（Free/Build/Scale1/Scale2）	AWS quota
新账户限速	50 RPM / 50k TPM 起	可申请提升
合规认证	SOC 2 / HIPAA（自签 BAA）	SOC 2 / HIPAA / FedRAMP / IRAP / PCI DSS
多 Region	us-east-1 主力 + EU 备	10+ region 全球
SDK	Anthropic 官方 SDK	boto3 / AWS SDK
注册条件	信用卡 + 邮箱	信用卡 + 手机 + 地址

测试环境：us-east-1 / eu-central-1，2026-04 至 2026-05 真实工作负载。

1. 定价

Anthropic 直连（Claude 3.5 Sonnet, 2026-05）

Input：$3 / 1M tokens
Output：5 / 1M tokens
Prompt Caching 写入：$3.75 / 1M tokens
Prompt Caching 读取：$0.30 / 1M tokens（90% off）
Batch API：50% 折扣

AWS Bedrock Claude 3.5 Sonnet（us-east-1, 2026-05）

Input：$3 / 1M tokens
Output：5 / 1M tokens
Cross-region Inference：稍贵但可用性更高
Prompt Caching 已支持但折扣比例略差

重度 caching 场景

如果你的 system prompt 占 token 大头（典型 RAG / Agent 场景），Anthropic 直连用 Prompt Caching 能省 50-80% 总成本，Bedrock 节省比例略低。

2. 限速

Anthropic Tier 系统

Tier	RPM	TPM	触发条件
Free	5	25k	新账户
Build 1	50	50k	$5 充值
Build 2	1000	100k	$40 充值 + 7 天
Build 3	2000	200k	$200 充值 + 7 天
Build 4	4000	400k	$400 充值 + 14 天
Scale 1	5000+	800k+	$1k+ 月用量 + 申请
Scale 2	自定义	自定义	合同协商

新账户跑生产很可能撞 limit，需要预热充值 + 等账期。

Bedrock 限速

AWS 服务配额（Service Quotas）模式，默认配额较低但可以申请提升。企业账户经常拿到 10k+ RPM，且支持 Cross-region Inference 自动跨区分流。

3. 合规

Anthropic 直连

SOC 2 Type II
HIPAA（自签 BAA）
GDPR 兼容
默认 30 天日志保留，可申请 ZDR（Zero Data Retention）

Bedrock

SOC 2 Type II
HIPAA + BAA（AWS 自动 enable）
FedRAMP High
IRAP
PCI DSS
VPC Endpoint 走私网

强合规场景 Bedrock 几乎是唯一选择。

4. SDK 与代码

Anthropic 直连

from anthropic import Anthropic
client = Anthropic(api_key="sk-ant-...")
resp = client.messages.create(
    model="claude-3-5-sonnet-20241022",
    max_tokens=1024,
    messages=[{"role": "user", "content": "Hi"}],
)

Bedrock

import boto3, json
client = boto3.client("bedrock-runtime", region_name="us-east-1")
resp = client.invoke_model(
    modelId="anthropic.claude-3-5-sonnet-20241022-v2:0",
    body=json.dumps({
        "anthropic_version": "bedrock-2023-05-31",
        "max_tokens": 1024,
        "messages": [{"role": "user", "content": "Hi"}],
    }),
)

差异：modelId 命名、AWS Signature v4 鉴权、body 包一层 anthropic_version。

5. 谁该选哪个

选 Anthropic 直连

月用量 $0-2000 个人 / 小团队
重度用 Prompt Caching
需要最快用上新版本 Claude
不在 AWS 生态

选 Bedrock

公司主基建在 AWS（IAM / VPC / CloudWatch）
强合规（HIPAA / FedRAMP / IRAP）
需要全球多 Region 覆盖
已有 AWS Enterprise Agreement

同时用（高级）

主路 Anthropic 直连 + 备路 Bedrock。LiteLLM Proxy 配两个 channel，主线限速 / 异常自动 fallback Bedrock。运维成本略高，可用性显著提升。

局限

Bedrock 部分 region 仅有 Sonnet 没有 Opus / Haiku
Anthropic 直连企业账户 SLA 弱于 Bedrock
跨 region 跨 cloud 的延迟差异有时影响 streaming 体验
价格随时变，下单前以官网为准

国内访问的稳定性

无论选哪条路，国内访问 api.anthropic.com 或 Bedrock endpoint 都依赖海外网络。可以考虑配一条 LLM API 中转作为 Anthropic 直连的国内通道，把 ANTHROPIC_BASE_URL 切过去；Bedrock 可以通过 AWS PrivateLink 或自建服务器经稳定线路转发。

Anthropic API 与 AWS Bedrock Claude 选型 | 对比判断

核心参数一览

1. 定价

Anthropic 直连（Claude 3.5 Sonnet, 2026-05）

AWS Bedrock Claude 3.5 Sonnet（us-east-1, 2026-05）

重度 caching 场景

2. 限速

Anthropic Tier 系统

Bedrock 限速

3. 合规

Anthropic 直连

Bedrock

4. SDK 与代码

Anthropic 直连

Bedrock

5. 谁该选哪个

选 Anthropic 直连

选 Bedrock

同时用（高级）

局限

国内访问的稳定性

相关阅读

参考来源

常见问题