二〇二六 OpenClaw 守護整合實戰:
租用 Mac Mini 健康檢查與異常 Webhook 告警
二〇二六年三月二十四日
RunMini 技術團隊
閱讀約 七分鐘
遠端租用的 Mac Mini 長跑助理流程時,行程易悄悄退出。本文給可複現步驟:安裝啟動驗證、守護或排程、健康探針、異常Webhook,附對照表、欄位範例與退出碼表。延伸:排程與看門狗、連線清單、定價(免登入)。💻🛡️
① 三類痛點
- 靜默退出:互動啟動易在斷線後被回收,外部難察覺。
- 假存活:行程在但埠無回應,僅看程序表不夠。
- 告警雜訊:欄位未約定則難自動分派。
② 守護方式決策矩陣
租用節點外包電力與硬體,客戶端仍須守護與觀測;下表助選 macOS 整合路徑。
| 方式 | 適用情境 | 取捨 |
|---|---|---|
| 系統守護 | 開機即起、崩潰拉起、標準日誌 | 設定檔與權限須正確 |
| 排程喚醒 | 週期探針、輕量巡檢 | 避免重疊執行 |
| 外部監控 | 多節點統一告警 | 仰賴網路與接收端 |
③ 可複現落地步驟
④ Webhook 告警欄位範例
欄位可依機器人模板調整;鍵名建議英文。
{
"event": "openclaw.health_failed",
"severity": "critical",
"host_id": "node-01",
"probe": "local_port",
"exit_code": 1,
"message_zh": "探針連兩次失敗",
"log_tail": "摘錄"
}
⑤ 常見退出碼排查表
| 退出碼 | 常見原因 | 建議處置 |
|---|---|---|
| 零 | 正常 | 記錄耗時即可 |
| 一 | 一般錯誤 | 看標準錯誤,重試一次再告警 |
| 一百二十四 | 逾時 | 放寬逾時或拆任務 |
| 一百二十七 | 找不到指令 | plist 內寫絕對路徑並載入環境檔 |
| 一百三十七 | 記憶體不足 | 降併發或縮模型並監控交換空間 |
⑥ 可引用要點
- 探針:主探針約六十秒、備援五分鐘;連兩次失敗再告警。
- 重啟節流:單位時間內重啟上限三次,逾則只告警勿死迴圈。
- 關聯鍵:事件帶主機識別與任務名對齊控制台標籤。