Cloud Native 서비스의 Multi-AZ, Multi-Region 환경을 위한 HA
개요
CSP 의 Managed K8s 서비스를 위한 Multi-AZ / Multi-Region 환경에서 오픈소스 "LoxiLB" 를 사용하여 인프라의 HA(High Availability)를 구축한 사례의 기술을 공유 합니다.
구축 사례인 Sky UK TV 는 스트리밍 서비스를 제공하고 있으며, AWS 환경에서 재난복구(DR)을 위한 인프라의 이중화가 필요합니다.
LoxiLB 는 클라우드 서비스의 Multi-AZ 나 Multi-Region 환경에서 K8s 서비스를 위한 Stateful HA(고가용성) 로드밸런싱을 제공합니다. 또한 BFD(Bi-directional Forwarding Protocol)를 사용하여 이중화 구성의 빠른 전환이 가능 합니다.
Sky UK TV 는 사용중인 Multi-AZ 구성에서 HA를 지원하는 로드밸런싱이 필요하고, 향후 Multi-Region 으로 확장을 고려하며 LoxiLB 적용을 시험하였습니다.
AWS 환경에서는 가용영역 (AZ)간 플로팅 IP 기반으로 서비스를 지원하고 있지만 LoxiLB가 로드밸런싱의 HA를 위해 Multi-AZ 환경에서 구성하는 서비스를 검증하고, 이를 Sky UK TV와 공유하며 적용한 기술의 레퍼런스로 소개합니다.
현재 LoxiLB의 로드밸런싱 기능을 멀티-VPC 및 멀티클라우드 등의 다양한 환경으로 확장하며 HA 서비스의 고도화를 구현할 수 있습니다.
발표에서는 기업들의 클라우드 네이티브 서비스가 중요해지면서 HA(고가용성)를 위한LoxiLB가 이해를 위한 설명과 함께 다중 AZ 환경에서 Stateful HA를 지원하는 방법과 Sky UK TV 사례로 eksctl 을 사용한 멀티 AZ EKS 클러스터 설정, LoxiLB 인스턴스 배포 및 HA 구성, 장애 조치 및 로드 밸런싱의 구성 영상을 포함합니다.
그리고, 개발과 시험에 직접 참여한 개발자와의 Q&A 세션을 통해 질문에 대한 답을 드릴 예정입니다.
참석자들은 최신 클라우드 네이티브 도구를 사용하여 다중 AZ/Region/Cloud 환경에서 HA를 구현하는 것에 대한 이해, K8s 서비스로 LoxiLB를 구성 및 배포하는 실용적인 지식, 그리고 Sky UK TV 와의 협력을 통해 얻은 실제 문제와 솔루션에 대한 인사이트를 얻을 수 있습니다. Kubernetes 커뮤니티에서 HA 구성 경험을 공유하고 배울 수 있기를 기대합니다.
LoxiLB 메인 기여자 발표
NetLOX
spxmdnjzld, qhdks alc rktltj dtjqltmdml ajfxl zmffkdnem ghkrwkd rltnf wprhd
발표
개요
loxi lb
기본적으로는 metalb라고 보면 된다고.
ebpf 기반 네트워크 가속
새로운 기능들이 많이 추가되고 있다.
- kube-proxy 오프로드
- ingress
- gateway api
이를 통해 멀티 클라우드 dr을 위한 ha 서비스 제공 구축
통신, 모빌리티 및 엣지
ebpf의 장점을 가지고 있다.
여러 네트워크 기능을 커널에서 구현 가능
csp 입장에서는 cpu 사용량 중리고 속도를 높이는 게 중요함
프록시 트래픽 병목 현상을 해결함
쿠버 내부 ip를 인식하고, ip 주소 기반으로 바로 파드로 연결해서 클러스터가 커져도 속도가 유지됨
현재 로드 밸런서로 시작됐지만, 인그레스와 보안, 프록시, 정책 등의 다양한 영역을 포함하고 있다.
sky tv uk는 왜 loxi lb를 선택했는가?
오픈소스
멀티 클라우드 dr(재난 회복)의 표준화
- 각 csp에도 dr은 있지만 종속성.
ebpf 기반 로드밸런싱을 통한 성능 개선
텔코 레퍼런스 많음
클러스터가 아니어도 스탠드얼론까지도 가능
warm standby dr 전략 지원
사이트가 수분 내에 복구되도록
dr 전략 중 하나
록시 lb 이중화
bfd를 통해서..?
도커 컨테이너로 돼있음
master가 죽으면 backup이 master로 수초내로 바뀐다.
방식은 각 csp에 loxilb 배포하고 로드밸런싱 하는 동시에 이중화가 되도록
구성 및 적용
ha 구성
웜스탠바이 전략
리전당 두개의 loxilb 를 다른 az에 배포
리전당 하나의 kube-loxilb
각 cidr다르게 함
HA 시나리오
서비스 자동화에 맞춰서 개발을 진행하며 다양한 시나리오고려중.
flat한 네트워킹
l3 네트워킹(bgp로 액티브 백업)
bgp, ecmp도 지원
백업을 액티브로 하는 것을 빠르게
후기
후기
LoxiLB 메인 기여자 발표라서 기대됨
ebpf가 뭔지 잘 몰라서 이대로 가다간 평생 모를 것 같으니 일단 부딪치고 보는 게 좋을 것 같아서 참관했다.