SPOF
개요
Single Point Of Failure, 즉 단일 실패 지점을 말한다.
여러 서비스가 복합적으로 통합된 아키텍쳐에서 특정 서비스의 장애가 모든 서비스의 장애로 이어진다면 이 지점을 SPOF라고 부른다.
가장 쉬운 예시는 이렇다.
하나의 Gateway 서버가 있고, 모든 서버들이 이 서버를 경유하여 서로 통신을 하는 구조이다.
이때 Gateway 서버가 다운이 되면 모든 서비스들이 서로 통신할 수 없게 되고, 결국 전체 장애로 이어진다.
(애초에 API Gateway 구조는 외부 트래픽을 받는 곳도 Gateway라 클라 입장에서는 그냥 완전히 서비스 접근이 불가능해지긴 함)
시스템을 운영하는 입장에서 SPOF가 없는 아키텍쳐를 설계하고 구축하는 것은 매우 중요하다고 할 수 있다.
보통 사용되는 방법 중 하나는 고가용성, HA를 구축하는 것이다.
위의 예시로 치자면 여러 Gateway 서버를 두어서 Active-Standby 모드로 구성한다.
그러면 Active 상태인 Gateway 서버가 다운되더라도 Standby 상태의 Gateway 서버가 Active로 전환되어 계속 기능할 수 있게 된다.
이 경우 단일 Gateway 서버는 SPOF는 아니게 된다.
관련 문서
이름 | noteType | created |
---|---|---|
SPOF | knowledge | 2025-04-11 |