2026 : OpenClaw sur Mac Mini loué — routage principal–secours, quotas API et dégradation automatique
« Sur un Mac Mini loué, le routage de modèles n’est pas un luxe marketing : c’est le filet qui évite qu’une quota API épuisée ou une rafale de réponses HTTP 429 ne transforme votre OpenClaw en file d’échecs silencieuse pendant la nuit. »
Pour les tenants en continu : bascule principal→secours, erreurs quota, backoff, disjoncteur, champs de logs. Contenu : freins, matrice, paramètres, HowTo six étapes, YAML reproductible, repères. Liens blog, aide, achat ; launchd, prod/lab.
Pourquoi l’absence de routage coûte cher en automatisation longue durée
- Quota invisible. Agrégats journaliers côté fournisseur vs rafales OpenClaw : sans sonde locale, la panne apparaît quand les appels sortants cessent.
- Retry naïfs. Boucler tout de suite après
429aggrave le throttling et le CPU du Mac Mini si plusieurs workers partagent la clé. - Pas de secours documenté. Sans modèle secondaire ni file locale, pas de dégradation mesurable : arrêt total ou file sans SLA.
Matrice décisionnelle : conserver le principal ou activer le secours
Contrat dev/astreinte ; seuils selon fournisseur et nœud loué.
| Signal observé | Action sur la voie LLM | Commentaire opérationnel |
|---|---|---|
HTTP 429 ou en-tête Retry-After |
Attendre puis réessayer sur principal ; basculer si échec après trois tentatives espacées | Le backoff doit respecter la seconde indiquée avant toute nouvelle rafale |
Corps JSON insufficient_quota ou équivalent |
Bascule immédiate vers secours ou file locale jusqu’à fenêtre de quota | Marquer la bascule dans les journaux pour facturation interne |
| Taux d’erreurs > vingt % sur cinq minutes | Disjoncteur semi-ouvert : trafic réduit puis retour progressif | Évite d’empiler des jobs sur un fournisseur déjà saturé |
Tableau des paramètres : retry, disjoncteur et limitation d’entrée
Base reproductible à versionner avec vos agents OpenClaw.
| Paramètre | Valeur de départ | Rôle |
|---|---|---|
max_attempts |
5 | Plafond de tentatives avant bascule ou abandon explicite |
backoff_base_ms |
500 | Base exponentielle ; multiplier par deux à chaque échec jusqu’au plafond |
backoff_cap_ms |
60000 | Évite d’immobiliser la file pendant des heures |
jitter_ratio |
0,2 à 0,5 | Gigue complète pour désynchroniser les workers sur le Mac Mini |
breaker_fail_threshold |
5 échecs consécutifs | Ouverture du disjoncteur vers le fournisseur défaillant |
breaker_cooldown_s |
120 | Durée avant sonde demi-ouverte |
max_concurrent_jobs |
Réduire de moitié quand le disjoncteur est ouvert | Protège thermique et disque sur location partagée |
HowTo : six étapes pour une configuration traçable
- Voies versionnées. Fichier avec principal, secours, URL, plafonds tokens ; déployé comme le reste d’OpenClaw sur le Mac Mini loué.
- Classification.
429, codes quota, timeouts → attente, bascule ou abandon notifié. - Backoff + gigue.
Retry-Afteren plancher sinon exponentiel du tableau ; éviter l’orage de retries. - Disjoncteur HTTP. Échecs consécutifs, ouverture, une sonde après refroidissement, fermeture si OK sinon dégradation prolongée.
- Limiter l’entrée. Circuit ouvert : moins de concurrence et de prompts ; consigner dans le runbook.
- Test charge. Simuler quota épuisé ; logs doivent montrer
principal → secours → disjoncteur.
Fragment YAML minimal (adapter les clés à votre OpenClaw) :
openclaw_llm_routing:
primary_model: "provider-a/large"
fallback_model: "provider-b/medium"
local_optional: "http://127.0.0.1:11434/v1"
switch_on_http: [429, 503]
switch_on_body_tokens: ["insufficient_quota", "rate_limit_exceeded"]
retry:
max_attempts: 5
backoff_base_ms: 500
backoff_cap_ms: 60000
jitter_ratio: 0.35
circuit_breaker:
fail_threshold: 5
cooldown_seconds: 120
half_open_probes: 1
throttle_when_open:
max_concurrent_jobs_multiplier: 0.5
Variables d’environnement équivalentes :
OPENCLAW_LLM_PRIMARY=provider-a/large
OPENCLAW_LLM_FALLBACK=provider-b/medium
OPENCLAW_RETRY_MAX=5
OPENCLAW_BACKOFF_BASE_MS=500
OPENCLAW_BACKOFF_CAP_MS=60000
OPENCLAW_BREAKER_THRESHOLD=5
OPENCLAW_BREAKER_COOLDOWN_S=120
Observabilité : champs de logs pour diagnostiquer quotas et bascules
Une ligne structurée par appel : sinon impossible de séparer quota et panne réseau à distance sur Mac Mini loué.
model_lane,attempt,backoff_ms_applied,provider_http_status,breaker_state.request_idfournisseur,tenant_job_idpour corréler les files OpenClaw.
Objectif astreinte : trancher en cinq minutes 429 transitoire vs quota épuisée.
Repères citables pour votre contrat d’exploitation
- Trois tentatives maximum sur le principal après un
429avant bascule automatique documentée. - Cinq échecs consécutifs : ouverture standard du disjoncteur ; cent vingt secondes de refroidissement avant sonde.
- Moitié de la concurrence acceptée lorsque le circuit est ouvert : compromis simple entre débit et stabilité thermique sur Mac Mini.
- Vingt pour cent d’erreurs glissantes sur cinq minutes : déclencheur d’alerte proactive avant saturation complète de la quota API.
Prochaine étape. Déployez ces garde-fous sur un nœud Apple Silicon dédié : parcourez le blog, le centre d’aide pour l’accès distant, puis commandez via l’achat en ligne sans friction inutile. La version anglaise du même HowTo est disponible pour les équipes bilingues.
Choisissez votre nœud Mac et votre mode d’accès
Un Mac Mini loué pour OpenClaw en 7×24 avec routage de modèles et marge de dégradation ? Consultez l’accueil, les tarifs, puis louer — le centre d’aide couvre SSH et VNC ; le blog détaille quotas, launchd et observabilité.
Poursuivez votre feuille de route OpenClaw : achat, aide, blog.