一分钟定义

LLM Gateway

你的应用 → Gateway → 多个 channel:OpenAI / Anthropic / Gemini / Bedrock / ...

Gateway 解决「我应用怎么调多家 LLM 还能统一管」的问题。重点是 infra 工具。

API Relay(中转站)

最终用户 → Relay 服务(中转方运营) → OpenAI / Anthropic 官方

Relay 解决「我没有海外卡 / 不想注册官方账号但想用 LLM」的问题。重点是商业服务。

关键差异表

维度LLM GatewayAPI Relay
本质软件 / 服务商业服务
谁部署应用开发者自己Relay 公司
谁持 LLM 官方 key你(应用开发者)Relay 方
谁付钱给 OpenAI / Anthropic你直接付Relay 方代付
你看到的支付对象OpenAI / AnthropicRelay 方(支付宝 / 微信)
加价0%(你直接走官方价)5-30%
责任主体你自己Relay 方
合规风险干净灰色(转售 ToS 争议)

工作原理

Gateway 内部

请求 → 协议识别 → 选 channel → 调用上游 → 统计计费 → 返回响应

            按权重 / 模型 / 用户路由

Gateway 是「编排器」。

Relay 内部

你 → Relay endpoint → Relay 内部 Gateway(路由 + 聚合) → 各家官方 API

             Relay 方的官方 key + 余额管理

Relay 本质 = Gateway + 商业账户 + 国内支付。

常见误解

误解 1:「OneAPI 就是 Relay」

不是。OneAPI 是软件你自己装。你装完不会自动有钱、不会有 OpenAI 账号——还要你自己绑 channel(中转 key 或官方 key)。Relay 是别人帮你把这套都搞定的服务。

误解 2:「Relay 就是 Gateway」

部分对。Relay 后台肯定有 Gateway-like 的软件做路由。但你作为用户消费的是 Relay 的「商业服务」(含账号 + 余额 + 客服 + 计费),不是「软件」。

误解 3:「我用 OpenRouter 就不需要 OneAPI」

不一定。如果你做 AI SaaS 团队 5+ 人需要内部分账,OpenRouter 的 Provisioning Keys 不如 OneAPI 灵活。OneAPI 后端可以接 OpenRouter 作为一个 channel——OneAPI 做内部分发 + 用量统计,OpenRouter 做 200+ 模型聚合。

典型协作模式

模式 1:纯 Relay

应用 → AnyRouter

适合个人 PoC / 月用量 < $200。

模式 2:纯 Gateway

应用 → OneAPI(你部署) → 你的 Anthropic / OpenAI 官方 key

适合有海外卡 + 想 0 加价 + 月用量 > $1000。

模式 3:Gateway + Relay 组合

应用 → OneAPI → 多 channel:
                 ├─ 你的官方 key(主路)
                 ├─ Relay A 的 key(备路 1)
                 └─ Relay B 的 key(备路 2)

适合生产环境,需要多层 fallback。

模式 4:终端用户视角

最终用户对你的应用来说看不到 Gateway 或 Relay 的区别——他们只看到「你的应用提供 AI 能力」。Gateway / Relay 是你的后端选择,不影响产品形态。

实际应用场景

选 Gateway

  • 团队开发 AI SaaS,需要内部用量管控
  • 已有官方 LLM key,想统一管理
  • 月用量大到摊薄服务器成本

选 Relay

  • 个人开发者 PoC
  • 不想自己绑海外卡
  • 多模型快速实验

同时选两者

  • 生产 AI SaaS:Gateway 做内部聚合 + Relay 做某些 channel 作为 fallback
  • 团队 + 商业用:Gateway 管分账,Relay 提供 backup capacity

相关术语

相关阅读