2026 OpenClaw 租用 Mac Mini 实战 主备模型路由与配额降级(节流重试可观测)

阅读时间:约 8 分钟

租用 Mac MiniOpenClaw七乘二十四长跑时,模型路由配额比算力更致命,适合长期租户按表落地。本文含主备切换条件、四二九与账单错误分流、退避熔断参数表、可入库 YAML 片段、六步 HowTo日志字段。内链博客帮助购买;机内限额见资源限额文

痛点拆解

  1. 单车道配额或限流时队列静默堆积。
  2. 误分类四二九与账单耗尽共用重试,放大封禁与账单。
  3. 缺字段:无车道与断路状态,租用机上难复盘。

主备车道决策矩阵(切换条件)

主模型保质量,备模型保可用,本机为第三车道。

信号表现动作
限流四二九或等价,可有 Retry-After先退避后主;连续失败转备
配额额度尽、欠费、密钥拒立刻备或本机,主车道冷却
批任务摘要回归等可降质直走备道省令牌
窗口五分钟失败率超百分之二十备道全开并降并发

退避、熔断与节流参数表

参数建议初值说明
初始退避毫秒五百到一千无 Retry-After 时起点,指数乘二至封顶
退避上限毫秒三万到六万控日志与温控
抖动零点二全抖动打散齐步重试
断路阈值连五或三十秒内八次开路仅探针
半开探针秒六十到一百二十成功后闭路升并发
并发上限断路时降到一租用 Mac Mini磁盘与句柄

可复现配置片段(入库版本化)

入库由流水线渲染;密钥勿明文进库。

router:
  primary_model: "cloud-premium"
  fallback_model: "cloud-econ"
  local_model: "ollama-mid"
  switch_on_http: [429]
  switch_on_body_regex: ["quota", "insufficient_quota", "billing"]
  backoff_ms_initial: 800
  backoff_ms_max: 45000
  jitter_ratio: 0.2
  breaker_fail_threshold: 5
  half_open_probe_sec: 90
  throttle_concurrency_on_open: 1

HowTo 落地六步

  1. 文档固化主备本模型名与基址,变更评审。
  2. 分类器:状态码与 Retry-After 优先,体文关键字分配额限流
  3. 可重试走指数退避加抖动;配额拒则直降级勿死磕主道。
  4. 熔断开路后新请求走备道,并发用表内上限。
  5. Mac Mini用 launchd 保活;日志磁盘见专栏他文。
  6. 十分钟探针验主道,成则半开闭路阶梯升并发。

日志可观测性(每次调用必填字段)

单行 JSON:含请求标识、车道、尝试、退避毫秒断路状态、状态码、是否配额关键字、优先级。四二九与配额分指标;轮转见磁盘告警文

可引用要点

  • 四二九先 Retry-After;否则五百毫秒起跳、上限约四十五秒、零点二抖动。
  • 配额与瞬时错分桶重试预算。
  • 断路时并发一并备,减租用机日志放大。

下一步:稳定节点与下单路径

节点选型:购买定价帮助博客专栏续读 OpenClaw

免登录购买套餐