我会把 Cloudflare AI Search 当成「先上线」工具,而不是最终架构答案。它把抓取、切分、embedding、向量索引、关键字索引和查询接口包到一个实例里,适合先证明用户真的会搜知识库。

截至 2026-05-24,最关键的价格限制来自创建日期。2026-04-16 之后的新 AI Search 实例自带托管存储、托管向量索引和网站抓取;更早创建的实例仍会在迁移前使用你账号里的 R2、Vectorize、Workers AI、AI Gateway 等底层服务。

适合先用 Cloudflare AI Search 的,是这四类 SaaS:

场景默认选择原因
帮助中心搜索AI Search内容公开、权限简单、上线速度比调参更重要
产品文档问答AI Search文档更新频繁,自动索引能省掉不少脚本
后台客服内部检索AI Search 试点先验证客服是否真的用自然语言搜
面向客户的多租户知识库自建 RAG 更稳租户隔离、审计、套餐限制通常会变复杂
把知识库当主产品卖自建 RAG召回质量、评测和可解释性会成为核心能力

我的判断线很简单:知识库是配套功能,用 AI Search;知识库是产品护城河,直接准备自建。

AI Search 到底替你做了哪几段?

Cloudflare 官方把 AI Search 描述成托管搜索服务。你连接网站、R2 bucket 或上传文件后,它会把内容转成 Markdown、切 chunk、生成 embedding、建立向量索引;开启关键字搜索时,还会建立 BM25 这类关键字索引。

查询时,流程也被包起来了:接收用户问题,必要时改写 query,生成 query embedding,跑向量搜索;如果开了 hybrid search,会同时跑关键字搜索,再做融合、重排,最后返回 chunk 或生成回答。

这就是它省时间的地方。你不用先写 crawler、文档转换、chunk worker、embedding job、Vectorize upsert、召回 API、重排和 prompt 拼装。一个人做 SaaS 时,这些胶水代码不是难在第一版,而是难在文档每周更新、失败任务重跑、用户搜不到时你要定位是哪一段坏了。

但这也是它的限制。托管产品替你省掉的是基础设施,不是知识库产品判断。用户搜「Stripe invoice 没出来」时,到底应该优先命中文档、FAQ、工单片段还是 changelog,仍然要靠你的内容结构和评测集。

2026 年 5 月的价格限制是什么?

看 AI Search 本身。2026-04-16 之后创建的新实例,在 open beta 期间免费,但 Workers AI 和 AI Gateway 另行计费。Cloudflare 说明正式收费前会至少提前 30 天通知。

新实例的限制更值得看:

限制Workers FreeWorkers Paid
AI Search 实例数1005,000
单实例文件数100,0001,000,000,hybrid search 为 500,000
单文件大小4 MB4 MB
每月查询数20,000Unlimited
每日最多抓取网页500Unlimited
自定义 metadata 字段55

对早期 SaaS 来说,免费层已经能跑一个公开帮助中心。真正容易提前撞到的不是文件数,而是 20,000 queries/month、4 MB 文件上限和 5 个 metadata 字段。

5 个 metadata 字段听起来够用,实际会很快紧张。tenantIdplanlocaleproductAreavisibility 用完后,你再想加 versionrolesourceType,就要开始取舍。

Vectorize 自建 RAG 成本贵吗?

Vectorize 本身并不贵。Cloudflare 的计费口径是 queried vector dimensions 和 stored vector dimensions,不按索引数量、CPU、内存或活跃索引小时收费。

官方示例里,50,000 个 768 维向量、每月 200,000 次查询,估算约 1.94 美元。更大的 500,000 个 1536 维向量、每月 1,000,000 次查询,约 23.42 美元。

把这个换成一个 SaaS 帮助中心,大概是这样:

规模假设Vectorize 粗算
早期文档5,000 chunks,10,000 queries/month,384 维官方示例约 0.06 美元,通常落在包含额度内
正常帮助中心50,000 chunks,200,000 queries/month,768 维官方示例约 1.94 美元
文档 + 工单片段250,000 chunks,500,000 queries/month,768 维官方示例约 5.86 美元
知识库产品500,000 chunks,1,000,000 queries/month,1536 维官方示例约 23.42 美元

所以「自建 RAG 贵」这句话不准确。贵的是生成模型、重排、失败重试、日志保留、评测、人肉调参,以及你把这些东西做成可维护后台的时间。

如果你已经在用 Workers Paid,很多轻量 RAG 的向量库账单不是主要矛盾。主要矛盾是你有没有能力长期维护索引 pipeline。

Workers AI 会把账单放大到哪里?

Workers AI 的免费分配是每天 10,000 Neurons;超过后,Workers Paid 按每 1,000 Neurons 0.011 美元计费。Cloudflare 现在也直接给模型的 token 等价价格,方便和别家模型比较。

embedding 这段很便宜。例如 2026-05-24 比对时,@cf/baai/bge-m3@cf/qwen/qwen3-embedding-0.6b 都是每百万输入 token 0.012 美元,@cf/baai/bge-large-en-v1.5 是每百万输入 token 0.204 美元。

生成回答才是大头。以每月 200,000 次知识库问答为例,如果每次给模型 1,000 input tokens、输出 200 tokens:

生成模型输入成本输出成本月成本粗算
@cf/qwen/qwen3-30b-a3b-fp8200M * 0.051/M = 10.20 美元40M * 0.335/M = 13.40 美元23.60 美元
@cf/meta/llama-3.3-70b-instruct-fp8-fast200M * 0.293/M = 58.60 美元40M * 2.253/M = 90.12 美元148.72 美元
只返回搜索结果,不生成回答主要是查询和 embedding0接近 Vectorize / AI Search 查询成本

这张表只用来提醒一件事:AI Search 免费 beta 不等于知识库问答免费。只要你走 Chat Completions 或让 Workers AI 生成答案,模型账单就会出现。

我的做法是先把产品分成两档:免费用户只返回文档片段和引用;付费用户才给生成回答。这样能把「搜索」和「生成」两笔账拆开。

自建 RAG 比 AI Search 多了哪些工作?

自建通常是这条链:

  1. crawler 或 webhook 监听文档变化。
  2. 把 HTML、PDF、Markdown、工单内容统一转成文本。
  3. 自己决定 chunk 大小、重叠、标题继承和代码块处理。
  4. 调 Workers AI 或外部模型生成 embedding。
  5. 写入 Vectorize,并保存 source、tenant、权限、版本和删除状态。
  6. 查询时做权限过滤、向量召回、关键字召回、重排和 prompt 拼接。
  7. 记录 query、命中 chunk、点击、用户反馈和成本。

AI Search 的优势是把 1-6 的第一版压短。自建的优势是第 7 步以后:你能知道为什么没搜到,能做离线评测,能给不同租户做独立索引策略,也能把高成本模型只开放给高套餐。

如果你现在只有 40 篇帮助文档,别急着自建,把用户真实 query 收集起来,跑 2-4 周,再决定是调内容还是调架构。

多租户 SaaS 最容易踩哪三个坑?

第一个坑是权限。用户 A 的内部知识库绝不能被用户 B 召回。AI Search 有 metadata filtering 和多租户思路,但字段数、路径组织和权限范围要在建实例前想清楚。

第二个坑是版本。B2B SaaS 经常有旧版功能、私有部署功能和灰度功能。用户问到一个按钮,答案必须匹配他的版本,不是匹配最新文档。

第三个坑是可解释性。客户说「你这个 AI 乱答」时,后台至少要看到 query、命中的 source、chunk、分数、生成模型和回答版本。AI Search 能快速启动,但你仍然要设计自己的日志层。

这个位置也会遇到很现实的开发问题:Cloudflare Dashboard、wrangler 部署、GitHub Actions、DNS 和回滚都在同一条链路上。跨地区协作或临时在外办公时,我会把 Cloudflare、GitHub、Stripe 这类生产后台放进一套固定访问规范里,必要时用海外服务跑 GitHub Actions / Cloudflare 的稳定线路承载发布操作,避免上线窗口里反复切换环境。

我会怎么选?

我的默认路线分三档。

阶段推荐架构月成本重点退出条件
0-1,000 搜索/月AI Search + 搜索结果基本看 Workers AI 是否生成答案用户没人搜,先别做复杂
1,000-20,000 搜索/月AI Search + 付费用户生成回答Workers AI 模型、query cache、回答长度metadata 不够或权限变复杂
20,000+ 搜索/月Workers + Vectorize + AI Gateway + 自有日志生成模型、重排、日志、工程维护知识库成为核心产品能力

有一个反常识点:20,000 搜索/月以前,省工程时间通常比省几美元账单更重要。一个人做 SaaS,花两周自建 RAG,只为了把 Vectorize 从 1.94 美元压到包含额度内,账面很漂亮,产品节奏很差。

到了 20,000 搜索/月以后,问题会变成质量和控制。你会想做 query 分类、召回评测、套餐限额、缓存、失败重跑和模型路由。那时自建不是为了省钱,而是为了把知识库变成可运营系统。

Cloudflare AI Search SaaS 知识库 不覆盖什么

我没有把 AI Search 当作企业搜索采购方案评测,也没有测试私有数据合规、SAML、DLP、区域数据驻留或 Enterprise 合同条款。Cloudflare 的 beta 价格也可能变化,本文只按 2026-05-24 可见的公开文档计算。

我也没有伪装成做过百万级知识库压测。上面的成本模型适合独立开发者先估算帮助中心、文档站、客服内部检索,不适合直接拿去承诺企业 SLA。

相关阅读