## Overview - 지금 로그는 많지만 운영 관측성은 약하다. - 프로덕션에서는 로그만 보는 방식보다 표준 상태 신호와 메트릭이 먼저 갖춰져야 한다. ## Details - 현재 health endpoint 는 `/health-check` 의 문자열 `"OK"` 응답뿐이다. - Actuator 의존성은 있지만 readiness/liveness/metrics 활용 흔적이 없다. - 배포 이후 장애를 확인할 표준 endpoint, 메트릭, 대시보드, 알림 기준이 부족하다. ## 작업 내용 - Spring Boot Actuator 기반 `health`, `readiness`, `liveness` 를 정식 공개한다. - 인프라에서 사용할 probe endpoint 와 외부 공개 endpoint 를 분리한다. - Micrometer/Prometheus 또는 현재 인프라에 맞는 메트릭 수집을 붙인다. - 최소한 아래 지표를 볼 수 있게 한다. - 요청 수 - 에러율 - 응답 지연 - 외부 AI 호출 실패율 - 비동기 작업 실패 수 - 운영 대시보드와 알림 임계치를 정의한다. ## Expected Outcome - 배포 이후 readiness 실패, 응답 지연, 에러율 상승을 대시보드와 알람으로 감지할 수 있다. - 로그를 열기 전에 시스템 상태를 health 와 metrics 로 먼저 파악할 수 있다.
Overview
Details
/health-check의 문자열"OK"응답뿐이다.작업 내용
health,readiness,liveness를 정식 공개한다.Expected Outcome