二〇二六年 OpenClaw レンタル Mac Mini 実戦:Node Exporter 閾値でプロキシ告警と退避再試行を再現する手順

可観測性・OpenClaw
約8分

閾値だけでは通知嵐や Webhook 四二九が出やすいです。最小スタック、閾値表、OpenClaw ひな形、抑制と退避、無データ切り分けを同じ順で固定します。Webhook 手順劣化稿併読を推奨します。

① 最小監視スタックの選定

  1. ログ単体では閾値が揺れ夜間誤報が増えます。
  2. フルスタックは秘密管理と更新が重いです。
  3. Webhook 直結はレートと再試行が未定義になりがちです。

単一ホストは Node Exporter・Prometheus・Alertmanager の三段が再現性と負荷の折り合いです。

構成 向く場合 注意
curl のみ 最短検証 履歴なし
+ Prometheus ルールをコード化 ラベルずれで無データ
+ Alertmanager 抑制と経路宣言 group 甘いと嵐

② 主要指標と閾値表

継続時間は二〜五分から。ディスクは水位 FAQと併用します。

意図 PromQL 骨格 閾値目安
死活 up{job="node"} 零が2分超で警告
CPU idle 以外の rate 合計÷コア数 0.9超を5分で重大
メモリ 1−MemAvailable÷総量 0.9超を5分で警告
ディスク avail / size 15%未満で即応

③ OpenClaw 連携のルールひな形

固定ポートのゲートウェイへ bearer で送ります。フィールドはOpenClaw 仕様に合わせて置換してください。

receivers:
- name: openclaw_webhook
  webhook_configs:
  - url: https://<gw>/hooks/prometheus
    http_config:
      bearer_token: <secret>
    send_resolved: true

OpenClaw は JSON をキューへ載せ、四二九なら一秒始まり指数退避・上限六十秒・五回で打切りです。

④ アラート嵐の抑制と退避再試行

group_by にアラート名と instance、group_wait 三十秒、group_interval 五分、repeat 一〜四時間から。夜間は repeat を長くします。

  • Webhook はホスト・閾値・現在値・ジョブ名のみ、ログは添付へ。
  • 五xx はジッタ付き退避、成功でカウンタリセット。
  • 同一指紋は冷却で束ね、復旧は send_resolved 一回。

⑤ よくある無データ FAQ

UP なのにパネルが空
instance と変数、録画ルールの job を突合します。
時々戻る
レンジが長いと右端が欠けます。間隔とレンジを揃えます。
プロキシだけ落ちた様子
ポートと up を見て、合成チェックは別ルートに分けます。

再現チェックリスト(七手順)

  1. Exporter を九一零零番に拘束しローカル限定公開。
  2. Prometheus の job と instance を UI と同じ綴りで十五〜三十秒スクレイプ。
  3. 閾値式を rules に貼り継続二〜五分。
  4. receiver を OpenClaw URL と bearer に。
  5. OpenClaw で四二九・五xx に指数退避と試行上限。
  6. group と repeat を④に合わせ夜間は repeat 延長。
  7. 週次で Targets と変数を監査。

引用:ラベル先固定/group 抑制優先/Webhook は短く添付へ。

閾値はレンタルで検証後に購入判断へ。ホーム購入ヘルプ料金ログイン不要です。Mini マネージド托管でノードを選び SSH/VNC で確認。ブログ一覧もどうぞ。

ノードを選ぶ

まずレンタルで閾値と Webhook を固めます。料金購入ヘルプはログイン不要です。

ログイン不要で購入ページへ