判断 Auto 模式是否已经降级
跑一段你以前用 Claude 4.7 跑过的任务,观察:
- Cascade 对话框上方小字是否显示「Claude Sonnet 4.6」「GPT-5-mini」等不期望的模型名
- 回复速度比平时快 2-3 倍(便宜模型延迟低)
- 复杂多文件任务只给 1-2 行总结,不像 Claude 4.7 那样先列计划再展开
- Cascade 对话顶部偶尔出现「You’re using basic model due to high demand」之类提示
三个里命中两个,就是 Auto Mode 自动降级了。
最短处理路径
先关掉 Cascade 面板的 Auto。打开 Cascade 面板,顶部模型选择器默认是「Auto」。点开下拉,选「Claude Sonnet 4.7」或你期望的具体模型名。
Windsurf → Cascade panel (Cmd+L)
→ 顶部 model selector
→ 取消「Auto」勾选
→ 选「Claude Sonnet 4.7」
锁定后这一会话不会再被自动切。但新会话默认还是 Auto,这是 Windsurf 的产品决策,不是 bug。
再把全局默认改成手动选模型:
Windsurf → Settings → Editor → Cascade
→ Default Model: Claude Sonnet 4.7
→ Default Auto Mode: OFF
设完后所有新建会话默认用 Claude 4.7。
最后检查套餐配额。Windsurf → Settings → Account → Usage 看本月 user prompt credits 余额。Pro 套餐约 500 credits/月,重度一周用掉 200-300 不奇怪。配额耗尽后即使锁定模型,系统也会自动降到 free tier 备路。
降级原理
Auto Mode 决策三因子
Windsurf 官方文档列出 Auto Mode 选模型的三个考量:
| 因子 | Auto Mode 行为 |
|---|---|
| 任务复杂度 | 简单任务 → 便宜模型;复杂多文件 → Claude 4.7 |
| 用户当前配额 | 配额低于阈值 → 降到便宜模型 |
| 服务侧负载 | 高峰排队 → 优先放低优先级模型 |
三个因子都是「保护服务侧成本」的视角,跟用户「质量优先」诉求时常冲突。
高峰时段的隐性排队
2026 年初 Windsurf 用户量爆发,北美工作日 9am-12pm PT 经常出现 Claude 4.7 排队 30-60 秒情况。Auto Mode 检测排队后会自动切到无排队的便宜模型——快但质量打折。
套餐分级与配额
| 套餐 | 月费 | User Prompt Credits | Flow Action Credits |
|---|---|---|---|
| Free | $0 | 25 | 200 |
| Pro | $15 | 500 | 1500 |
| Pro Ultimate | $60 | 3000 | 8000 |
| Teams | $35/seat | 500 | 1500 |
价格与 credit 数以 windsurf.com/pricing 实时公布为准,本表为 2026-05 当时配置。
进阶处理:BYO key 接中转
Solopreneur 重度使用最干净的解法是 BYO Keys(Bring Your Own Keys),Windsurf 只做 IDE + Cascade UI,模型调用走自己的 key。
步骤一:Settings → Cascade → BYO Keys
Provider: Anthropic
API Key: sk-你的中转key
Base URL: https://你的中转域名
步骤二:在 Cascade 选 Custom model
模型下拉会多出「Custom: claude-opus-4-7」选项,选它后调用全部走中转。
步骤三:验证不再扣套餐配额
跑几轮 Cascade,回到 Settings → Usage 看 credit 是否变化。BYO key 模式下 credit 应该不动,扣的是中转方账单。
Solopreneur 月成本估算
走 BYO key + 中转方时月成本 = Windsurf Pro($15)+ 中转方 token 用量。重度日均 4-6 小时 Cascade,月 token 30-60M,中转方加价 15% 下:
| 模型 | 占比 | 估算月费 |
|---|---|---|
| Claude Opus 4.7 | 50% | 80-160 美金 |
| Claude Sonnet 4.6 | 30% | 25-50 美金 |
| GPT-5.5(补路) | 20% | 15-30 美金 |
| Windsurf Pro 月费 | - | 15 美金 |
| 合计 | - | 135-255 美金 |
跟 Windsurf Pro Ultimate($60 含较多 credits)比,BYO key 在重度场景下灵活度高得多——credit 不会突然耗尽,模型不会被自动降级。
还没恢复时,单独查 Windsurf 锁定 Claude 4.7
立即兜底
中转方挂时,Solopreneur 最快兜底是切回 Windsurf 自家套餐(Cascade 模型选择器临时切回 Default),保证手头工作不停。
长期兜底:多 provider 列表
LiteLLM Proxy 在中间挡一层,把官方 Anthropic + 中转 A + 中转 B 都注册成 backend,Windsurf BYO key 只指向 LiteLLM 一个 endpoint。任一 backend 挂,LiteLLM 自动 fallback,Cascade 体感无中断。
具体落地可以参考一条AI SaaS 出海可用的 API 中转,Solopreneur 早期跟它对接做主路,后续再加备路。
相关报错与现象
- 「You’re using a basic model due to high demand」:Auto Mode 主动降级提示,关 Auto 即可
- 「Insufficient prompt credits」:套餐配额耗尽,升级套餐或开 BYO key
- 「Provider returned 503」:中转方临时挂,切回默认或换中转
- Cascade 长任务中途断:多见于网络 / 中转方 SSE streaming 不稳,把 base_url 切到更稳的中转