Skip to content

관측성 기본선 구축: health/readiness/liveness/metrics #239

Description

@Goder-0

Overview

  • 지금 로그는 많지만 운영 관측성은 약하다.
  • 프로덕션에서는 로그만 보는 방식보다 표준 상태 신호와 메트릭이 먼저 갖춰져야 한다.

Details

  • 현재 health endpoint 는 /health-check 의 문자열 "OK" 응답뿐이다.
  • Actuator 의존성은 있지만 readiness/liveness/metrics 활용 흔적이 없다.
  • 배포 이후 장애를 확인할 표준 endpoint, 메트릭, 대시보드, 알림 기준이 부족하다.

작업 내용

  • Spring Boot Actuator 기반 health, readiness, liveness 를 정식 공개한다.
  • 인프라에서 사용할 probe endpoint 와 외부 공개 endpoint 를 분리한다.
  • Micrometer/Prometheus 또는 현재 인프라에 맞는 메트릭 수집을 붙인다.
  • 최소한 아래 지표를 볼 수 있게 한다.
    • 요청 수
    • 에러율
    • 응답 지연
    • 외부 AI 호출 실패율
    • 비동기 작업 실패 수
  • 운영 대시보드와 알림 임계치를 정의한다.

Expected Outcome

  • 배포 이후 readiness 실패, 응답 지연, 에러율 상승을 대시보드와 알람으로 감지할 수 있다.
  • 로그를 열기 전에 시스템 상태를 health 와 metrics 로 먼저 파악할 수 있다.

Metadata

Metadata

Assignees

Labels

No labels
No labels

Type

No type
No fields configured for issues without a type.

Projects

No projects

Milestone

No milestone

Relationships

None yet

Development

No branches or pull requests

Issue actions