2026年租用 Mac Mini 夜間 OCR 批處理決策矩陣
Vision 並行會話、語言包體積與磁碟水位閾值清單
自動化腳本與小團隊把租用 Mac Mini當成七乘二十四離線工人時,以 Apple Vision 做OCR省成本、延遲可控——直到多路 VNRecognizeTextRequest、語言資源與暫存頂穿磁碟水位。本文給可貼跑冊的決策矩陣與閾值清單;內鏈 APFS 磁碟水位 FAQ、launchd 公平性與 I/O、時段排程與佇列矩陣、CPU/記憶體與退避矩陣。免登入購買為公開頁;長期目錄增量宜長租方案鎖價。
決策矩陣(場景 × 策略)
先判斷「誰吃記憶體、誰吃碟」,再調業務並行;矩陣列可與監控面板一一對應,避免只看 CPU 利用率誤判。若磁碟已進黃線,提高 Vision 並行通常只會讓完成時間變長。
| 場景 | 首要槓桿 | 預期收益 | 注意 |
|---|---|---|---|
| 多頁 PDF/高解析掃描夜間灌庫 | 限制並行 Vision 會話、單寫匯出 | 降交換與 I/O 尾延遲 | 暫存與成品同卷時加倍謹慎 |
| 同機還跑轉碼/建置 | 深窗疊 Nice/低優先 I/O、錯開日曆分鐘 | 保 OCR 完成率 | 參考 VideoToolbox 批處理 |
| 辨識語言多、冷啟動慢 | 裁剪語言白名單、預熱一輪 | 縮碟佔用、穩定首包時延 | 與快照/備份爭用安裝卷 |
| 上游佇列高頻投遞 | ThrottleInterval 與單實例互斥 | 抑制驚群與重複 OCR | 與檢查點冪等鍵一致 |
磁碟與運行時閾值清單(可貼進跑冊)
與 APFS 水位 FAQ 對齊:黃線約剩餘 15%限新批並輪轉日誌;紅線約 10%停大匯出;約 5%僅留檢查點。小卷另看絕對剩餘 GB(常見 50 GB 硬閘)。
| 監控項 | 黃線(規劃) | 紅線(處置) |
|---|---|---|
| 卷剩餘空間(占卷容量) | ≤15%:告警、盤點快照、限新切片 | ≤10%:暫停新 OCR 切片;≤5%:停大型循序寫,僅保留檢查點 |
| 暫存目錄時序增速 | 連續分鐘高於預測:限並行解碼 | 預估窗末前將寫滿:並發減半、排空暫存 |
| 交換/記憶體壓力 | 持續壓縮或換入:減一路 Vision | 換頁風暴:停冷佇列,僅留熱佇列 |
| 單切片重試 | ≥3 次失敗:退避並拉開節奏 | ≥6 次失敗:死信目錄並告警 |
工作目錄應在扣減語言資源與快取後仍滿足水位;併讀 快照與排除矩陣。
並發與記憶體
Apple Silicon 上 Vision 與解碼、匯出共用統一記憶體:流水線宜解碼 → 辨識 → 寫結果分段,辨識用有界佇列;重壓縮匯出維持單寫者或錯峰。壓測看 RSS 與交換,異常先減並行。十六 GB 級夜間常見起點:一路解碼加一至二路辨識,以 memory_pressure 驗證後再加池。熱路小量 OCR 與冷路大掃描分佇列,避免 backlog 擠掉互動作業。
語言資源裁剪
辨識語言越多,安裝體積、首次載入與快取越大。七乘二十四基線只留白名單(如繁中+英文帳票),多腳本以環境變數切語言集;裁剪後量測冷啟動並寫入 首檔延遲 SLA。CJK 與拉丁可拆夜窗;大跑前安排監督式預熱,避免首晚與快取膨脹疊加寫入。
launchd 視窗
StartCalendarInterval 把重活放深窗;易重入任務加 ThrottleInterval 與獨立 Label。與他業並存見 launchd 節流矩陣;長跑防休眠對照 pmset/caffeinate 矩陣;產線/實驗分軌見 launchd 分區實務。
失敗重試與檢查點
防「半截成功」:每 batch_id 維護切片清單(原子重新命名),下游鍵含 slice 序號與內容雜湊;重試指數退避封頂,連敗進死信。日誌輪轉見 syslog 與 inode 閾值。
自購與租用(簡述)
自購硬體前置資本支出、綁定三年攤銷與機房/桌邊維運;適合規格與工位長期鎖定。租用 Mac Mini則把資本轉成可預測月費,SSD/記憶體升檔或退租較快,試錯成本低。目錄增量數月不撤的 OCR 管線,通常寧可一次選對容量再以長租方案鎖價。與企業機房池對照可讀 企業池與單節點矩陣。