2026 OpenClaw 대여 Mac Mini
Alertmanager Webhook 침묵·에스컬·백오프
2026년 4월 11일
RunMini 기술 전략팀
약 9분
맥 미니에서 프로메테우스 알림이 알림 관리자 웹훅으로 오픈클로에 들어올 때 야간 배치와 겹치면 소음이 커집니다. 침묵창·에스컬·백오프와 헬스·로그를 한 런북에 묶었고 아래 표와 단계만 따라가면 재현됩니다. 페이저듀티·헬스웹훅·고객센터.
리스크
- 그룹 간격 없이 웹훅이 몰리면 오픈클로 큐가 막히고 배치 슬롯이 밀립니다.
- 침묵이 끝나는 순간 알림이 한꺼번에 터지면 새벽 온콜이 깨집니다.
- 게이트웨이 업스트림이 내려간 뒤에도 재시도만 돌면 로그 파티션이 먼저 찹니다.
의사결정 표
단일 노드에서 웹훅을 어디에 두느냐에 따라 지연과 감사 난이도가 갈립니다.
| 모드 | 장점 | 주의 |
|---|---|---|
| 루프백 직결 | 지연 최소 설정 단순 | 포트 충돌 시 알림 유실 |
| 리버스 프록시 | 헬스 분리와 토큰 검사 용이 | 업스트림 프로브 필수 |
| 얇은 중계 | 감사·이그레스 화이트리스트 | 한 홉 지연과 장애면 |
재현 단계
- 런치디로 비로그인 계정에 오픈클로를 고정하고 수신 URL은 루프백 또는 프록시 한 경로만 개방합니다.
- receivers에 webhook을 넣고 전송 타임아웃과 한 번에 보낼 알림 개수 상한을 현실 값으로 줄입니다.
- route에서 group_wait와 repeat_interval로 첫 묶음 지연과 재알림 주기를 분리합니다.
- 치명 라벨만 다른 receiver로 보내 에스컬 체인을 만들고 야간에는 비치명 경로를 침묵합니다.
- mute_time_interval 또는 silence로 배치 작업 라벨과 겹치는 창을 만들고 종료 시각을 운영 달력과 맞춥니다.
- 혼잡 시 이 초에서 육십초까지 지수 백오프에 지터를 얹고 resolved를 빼먹지 않습니다.
게이트웨이 헬스와 로그
프록시 /healthz 살 때만 웹훅 전달 시 재시도 폭주가 줄어듭니다. StandardOutPath 예 /usr/local/var/log/openclaw/webhook.log 또는 ~/Library/Logs/OpenClaw/webhook.log 관리자 로그는 별도 로테이트 배포 직후 curl로 헬스·샘플 페이로드 서명 실패·성공 검증.
자주 묻는 질문
- 서명은 어디서 검증하나요
- 오픈클로 수신 핸들러에서 공유 비밀 헤더를 먼저 보고 실패 시 즉시 사백일을 주면 알림 관리자가 백오프합니다. 키 파일은 사백육십 퍼미션으로만 읽게 고정하세요.
- 같은 알람이 계속 찍힐 때
- 그룹 라벨 키를 줄여 한 덩어리로 묶고 repeat_interval을 늘리면 화면이 조용해집니다. 복구 이벤트를 보내지 않으면 에스컬이 끊기지 않습니다.
- 침묵 문법 팁
- 매처는 모두 참이어야 하고 라벨 철자가 틀리면 아무 일도 없는 것처럼 빗나갑니다. 와일드카드는 최소화하고 창 끝을 배치 종료와 맞추세요.
복붙 체크
- 백오프 상한 육십초 지터 포함.
- 헬스 경로와 업스트림 프로브 주기 분리.
- 표준출력 로그 디렉터리 APFS 여유 십퍼 이상.
RunMini 맥 미니 대여로 스펙 맞춘 뒤 런북 그대로 복제하세요. 오늘 구매로 노드를 잡고 밤창 전 스테이징 한 번이면 충분합니다.