2026 장기 AI 추론 호스팅 FAQ:
대여 Mac Mini VRAM·연산력 선정 및 중단 복구 체크리스트
고민: M 시리즈 VRAM·통합 메모리 용량, 7×24 중단 시 복구 절차, SLA·장애 대응, 비용·대여 기간, 대여 vs 자가 구축. 아래 FAQ와 실행 포인트로 정리했습니다.
VRAM·연산력 선정 FAQ
Q. M 시리즈 VRAM·통합 메모리는 어떻게 고르나요? 모델 파라미터·배치 크기에 따라 8GB는 소형 추론, 16GB는 중형, 24GB 이상은 대형·배치에 권장. 통합 메모리는 CPU·GPU가 공유하므로 동시 작업 시 여유를 두고 선정하세요.
실행 포인트: 추론 모델 크기·배치 수로 필요 메모리 산정 → 동시 프로세스 수 고려 → 8/16/24GB 중 선택.
Q. 연산력(코어)은 어떻게 맞추나요? 추론은 메모리 밴드폭이 중요. M4 등 최신 칩이 동일 메모리에서 더 유리. 장기 배치면 안정적인 노드·SLA가 코어 수보다 우선.
중단·복구 체크리스트
Q. 7×24 작업 중단 시 어떻게 복구하나요? ① SSH/VNC 접속 가능 여부 확인(로컬 네트워크 제외) ② 비가용 시 상태 페이지·티켓 확인, 중단 시각 기록 ③ 가용한데 작업만 멈춤 → 프로세스·로그 점검, 하트비트·자동 재시작·체크포인트 적용 ④ 장애 신고 시 노드 ID·중단 구간 명시 ⑤ 작업층 재시도·이어하기 구성.
- SSH/VNC 확인·중단 시각 기록
- 비가용 시 상태/티켓·P1 제출
- 가용 시 프로세스·로그·하트비트·자동 재시작(7×24 하트비트 복구)
- 재시도·체크포인트 적용
SLA·비용 FAQ
Q. SLA·장애 대응 시간은? 월간 가용률(예 99.5% ≈ 월 약 3.6시간)·계획 외 장애 정의·P1/P2 대응 시간을 계약에서 확인. P1은 수 시간 내 대응이 일반적.
Q. 비용·대여 기간은 어떻게 선택하나요? 장기 사용 시 월정액이 유리. 최소 대여 기간·자동 갱신·해지 조건을 확인하고, 비용 대비 가용률을 비교하세요.
| 항목 | 확인 포인트 |
|---|---|
| SLA | 가용률·보상·P1/P2 대응 시간 |
| 비용 | 월정액·최소 기간·갱신·해지 |
| 대여 vs 자가 구축 | 전력·유지보수·SLA 대비 비용 |
선정 요약
Q. 자가 구축과 비교했을 때? 대여: 전력·냉각·네트워크·SLA를 업체가 관리해 유지보수 부담 감소. 자가 구축: 초기 비용·관리 부담이 있으나 장기 고정 수요에 맞출 수 있음.
- VRAM: 모델·배치 크기 → 8/16/24GB 선택
- 중단 복구: SSH/VNC 확인 → 하트비트·재시도·체크포인트
- SLA: 가용률·P1/P2 대응·보상 조건
- 비용: 월정액·최소 기간·대여 vs 자가 구축 비교
장기 AI 추론·배치 작업을 안정적으로 돌리려면, 대여 Mac Mini로 VRAM·노드를 골라 7×24 환경을 구성하는 것을 권장합니다. 가격·구매에서 플랜을 확인하세요.