2026 OpenClaw 租用 Mac Mini 實戰:主備模型路由與 API 配額耗盡自動降級(節流/重試)可複現配置步驟
2026年3月28日
RunMini 技術團隊
約 8 分鐘
🧭 長期在租用 Mac Mini跑OpenClaw的租戶,遇配額用罄或四二九時,若缺模型路由與降級,佇列易雪崩。本文含主備切換條件、退避與熔斷、日誌欄位與可複現 YAML;附決策表與參數表。延伸:部落格、幫助中心、免登入購買、資源限額。
痛點:① 單模型無法隔離尖峰。② 四二九與帳戶配額混判會誤重試。③ 無熔斷則備援也被拖垮;日誌缺欄位難還原路由。
主備模型切換條件(決策表)
以滑動視窗統計下列訊號,作為切備援與回切主模型之閘門。
| 觸發訊號 | 建議閾值思路 | 路由動作 |
|---|---|---|
| 四二九/五二九密集 | 短視窗次數超閾值 | 切備援並全局限流 |
| 配額用罄 | 錯誤碼或關鍵字命中 | 立即降級備援,暫停低優先佇列 |
| 高尾延遲 | 九五分位連續超標 | 比例分流備援,保留主路徑探測 |
| 熔斷開路/恢復 | 連續失敗達閾值;探測連勝 | 半開單發探測;漸進回切並記錄版本 |
節流、重試與熔斷:HowTo 參數表
數值依供應商調整;四二九可退避重試,真配額須降級勿硬重試。
| 參數 | 建議起點 | 用途說明 |
|---|---|---|
| initial_backoff_ms | 五百至一千毫秒 | 四二九首等,抑同步風暴 |
| max_backoff_ms | 十六至三十二秒 | 退避上限,配抖動 |
| retry_budget | 三至五次 | 僅可重試錯;配額勿重試 |
| breaker_fail_threshold | 連續五至十次 | 視窗內計數後開路 |
| half_open_probe_interval | 三十至六十秒 | 半開單發探測主模型 |
可複現落地步驟與設定片段
- 鎖定主備與金鑰別名:設定檔入版本庫,Mac Mini以環境變數注入,利審計。
- 路由區塊:下列 YAML 示範主備與切換欄位,請替換實際模型與端點。
routing:
primary_model: gpt-example-primary
fallback_model: gpt-example-fallback
switch_on:
- http_status: [429, 503]
- error_contains: ["insufficient_quota", "rate_limit"]
recover_probe:
interval_sec: 45
success_streak: 3
- 錯誤分流:四二九退避重試;配額用罄或帳戶停用不重試,標記降級並告警。
- 退避與節流:指數等待加抖動,並設每分鐘上限,防多程序同相位移。
- 熔斷三態:狀態寫共享檔;半開僅單發探測,成功再漸進放大主模型比例。
- launchd:常駐時固定設定與狀態目錄,見守護選型。
- 演練:離峰模擬四二九與配額錯誤,驗證回切與成本,保留設定雜湊。
日誌可觀測性(建議欄位)
每請求記錄識別、模型層級、重試次數、錯誤分類、熔斷狀態、延遲。結構化匯出後接輪轉告警,免塞滿租用 Mac Mini磁碟。
- 分欄標示速率限與配額耗盡,儀表板分色。
- 附路由決策與探測結果,利事後還原。
可引用資訊
- 四二九可退避;帳戶配額層應切備援或暫停非核心流。
- 半開探測用單發低流量,忌一回復即全量。
- 設定與環境樣板入庫並打標,跨節點可複現模型路由。