2026 OpenClaw 租用 Mac Mini 实战
主备模型路由与配额降级(节流重试可观测)
2026年3月28日
RunMini 技术团队
阅读时间:约 8 分钟
租用 Mac Mini跑OpenClaw七乘二十四长跑时,模型路由遇配额比算力更致命,适合长期租户按表落地。本文含主备切换条件、四二九与账单错误分流、退避熔断参数表、可入库 YAML 片段、六步 HowTo与日志字段。内链博客、帮助、购买;机内限额见资源限额文。
痛点拆解
- 单车道:配额或限流时队列静默堆积。
- 误分类:四二九与账单耗尽共用重试,放大封禁与账单。
- 缺字段:无车道与断路状态,租用机上难复盘。
主备车道决策矩阵(切换条件)
主模型保质量,备模型保可用,本机为第三车道。
| 信号 | 表现 | 动作 |
|---|---|---|
| 限流 | 四二九或等价,可有 Retry-After | 先退避后主;连续失败转备 |
| 配额 | 额度尽、欠费、密钥拒 | 立刻备或本机,主车道冷却 |
| 批任务 | 摘要回归等可降质 | 直走备道省令牌 |
| 窗口 | 五分钟失败率超百分之二十 | 备道全开并降并发 |
退避、熔断与节流参数表
| 参数 | 建议初值 | 说明 |
|---|---|---|
| 初始退避毫秒 | 五百到一千 | 无 Retry-After 时起点,指数乘二至封顶 |
| 退避上限毫秒 | 三万到六万 | 控日志与温控 |
| 抖动 | 零点二全抖动 | 打散齐步重试 |
| 断路阈值 | 连五或三十秒内八次 | 开路仅探针 |
| 半开探针秒 | 六十到一百二十 | 成功后闭路升并发 |
| 并发上限 | 断路时降到一 | 护租用 Mac Mini磁盘与句柄 |
可复现配置片段(入库版本化)
入库由流水线渲染;密钥勿明文进库。
router:
primary_model: "cloud-premium"
fallback_model: "cloud-econ"
local_model: "ollama-mid"
switch_on_http: [429]
switch_on_body_regex: ["quota", "insufficient_quota", "billing"]
backoff_ms_initial: 800
backoff_ms_max: 45000
jitter_ratio: 0.2
breaker_fail_threshold: 5
half_open_probe_sec: 90
throttle_concurrency_on_open: 1
HowTo 落地六步
- 文档固化主备本模型名与基址,变更评审。
- 分类器:状态码与 Retry-After 优先,体文关键字分配额与限流。
- 可重试走指数退避加抖动;配额拒则直降级勿死磕主道。
- 熔断开路后新请求走备道,并发用表内上限。
- Mac Mini用 launchd 保活;日志磁盘见专栏他文。
- 十分钟探针验主道,成则半开闭路阶梯升并发。
日志可观测性(每次调用必填字段)
单行 JSON:含请求标识、车道、尝试、退避毫秒、断路状态、状态码、是否配额关键字、优先级。四二九与配额分指标;轮转见磁盘告警文。
可引用要点
- 四二九先 Retry-After;否则五百毫秒起跳、上限约四十五秒、零点二抖动。
- 配额与瞬时错分桶重试预算。
- 断路时并发一并备,减租用机日志放大。