NFV 장애 관리 통합 매니지먼트 시스템안녕하세요 . 이번 포스팅에서는 NFV 장애 관리를 위해 다양한 기능을 통합하여 관리하는 시스템에 대해 구조와 구현 내용들을 말씀드리고자 합니다. 해당 내용은 NFV 환경에서 발생하는 다양한 문제들 특히 인프라, 가상 머신, 애플리케이션 등 여러 계층에서 발생하는 문제들을 일괄적으로 편리하게 처리하기 위해 제안한 시스템입니다. 또한 클라우드 기반의 NFV 환경에서는 다양한 모니터링 프로젝트들이 개별적으로 개발되고 있어서 이들을 통합하고 자동화하는 것이 필요하다고 생각되어 시작하게 되었습니다. 글로벌 멀티 사이트 환경에서 고가용성 기능들의 개별적 제공이 아닌 상호 작용을 통해 보다 높은 수준의 관리가 필요하였고, 고가용성 기능들의 개별적인 개발로 이들에 대한 통합 ..
오픈소스 RCA 프로젝트 : ONAP Holmes안녕하세요. 이번 포스팅에서는 RCA 프로젝트인 ONAP Holmes에 대해 말씀드리고자 합니다. ONAP은 아주 거대한 플랫폼으로 다수의 프로젝트를 포함하고 있습니다. 그중 RCA 기능이 포함되어 있는데, Holmes가 ONAP에서 RCA의 기능을 제공하고 있습니다. 그럼 지금부터 간단하게 Holmes에 대해 구조를 파악하고 간단한 프로젝트 컨셉에 대해 소개하도록 하겠습니다. # 해당 포스팅에 나오는 모든 그림과 내용은 [1]을 참조하였습니다. Architecture & Concept Holmes 프로젝트는 NFV 환경에서 인프라 및 서비스에 대한 장애 알림, 장애 원인의 상관관계를 분석하여 원인을 찾아냅니다. ONAP에서 DCAE 프로젝트에 속..
오픈스택 이해하기 : Test Project Rally안녕하세요 . 이번 포스팅에서는 Openstack Testing Project인 Rally에 대해 대략적으로만 말씀드리고자 합니다. Rally는 주로 Openstack의 성능을 파악하기 위한 기능을 제공하고 있습니다. 물론 저의 연구 주제로도 많이 사용하기도 하였고 Rally가 제공하는 기능인 Openstack의 최대 성능치 분석 기능을 이용해 클라우드를 점검하는 시스템을 설계하기도 하였습니다. 아마 테스팅 툴에 관심이 있으신 분들이 계시면 해당 포스팅을 참고하시고 이런 것이 있구나라고 생각하셔도 될 것 같습니다. * 이미지 출처 : [1] 그럼 지금부터 Openstack Testing Project인 Rally에 대해 대략적으로 알아보도록 하..
오픈스택 연구하기 : 코어프로젝트안녕하세요. 이번 포스팅에서는 오픈스택에 대해서 말씀드리고자 합니다. 사실 오픈스택은 이미 많이 알려져 있는 프로젝트이기도 하고 그만큼 오래되었기 때문에 손쉽게 자료도 구하실 수 있습니다. 그럼에도 불구하고 해당 포스팅을 진행하는 이유는 제 블로그의 다른 내용을 보다가 오픈스택에 대해 궁금해하실 분들이 계실까 봐 번거로이 다른 블로그에서 찾기보다는 간편하게 오픈스택에 대해 대략적으로 파악하실 수 있게 오픈스택에 대해 포스팅하고자 합니다. *이미지 출처 : [1] 2010년 6월 NASA와 RackSpace가 함께 개발한 Cloud OS인 Openstack을 오픈소스로 발표하였습니다. 그렇다면 왜 Openstack을 Cloud OS라고 할까요? 운영체제는 하드웨어와 사용자 ..
오픈소스 MANO 프로젝트 : OSM 안녕하세요. 이번 포스팅에서는 NFV, MANO에 이어 실제 오픈소스 MANO 프로젝트들에 대해 알아보고 이들에 대한 비교를 해보고자 합니다. 오픈소스 MANO 프로젝트들은 ETSI 표준 문서를 기반으로 각자 개발되고 있습니다. 어떤 MANO 프로젝트는 연구소 하나가 프로젝트에 참여하는 경우도 있으며, 특정 프로젝트는 불특정 다수의 개발자들이 함께 개발하는 경우도 있습니다. 이번 포스팅에서는 오픈소스 MANO 프로젝트 중 OSM(Open Source Mano) 구조를 알아보고, 어떤 특징을 가지고 있는지 설명 드리겠습니다. 해당 포스팅은 White Paper 3를 기반으로 연구하여 이에 대한 내용을 바탕으로 작성하였기 때문에 이해가 어려운 부분이 있을 수 있습니다..
오픈소스 컨테이너 모니터링 툴 Prometheus(1) : 이론편안녕하세요. 이번 포스팅은 대표적인 컨테이너 모니터링 툴인 prometheus에 대해서 포스팅하고자 합니다. 아마 많은 분들이 prometheus에 대해 접해보셨을 테고 실질적으로 이를 이용해 인프라에 적용해보셨을 것으로 예상됩니다. 저는 prometheus의 공식 문서를 기준으로 이를 작성하고 실제로 설치 및 실험을 통해 어떤 범위까지 모니터링이 가능한지 궁금했던 부분에 대해 기록해 놓았던 것을 공유드리는 포스팅으로 생각해주시면 될 것 같습니다. Prometheus는 2012년에 SoundCloud에 의해 개발된 오픈소스 시스템 모니터링 프로젝트입니다. 그리고 CNCF(Cloud Native Computing Foundation)에 20..
오픈스택 연구하기 : RCA Project Vitrage 안녕하세요. 이번 포스팅에서는 오픈스택에서 RCA 프로젝트인 Vitrage에 대해 말씀드리고자 합니다. 제가 개발한 내용들을 보면 아시겠지만, 고가용성 연구를 위해 Vitrage를 이용하여 많은 개발을 진행하기도 하였습니다. 먼저 Vitrage에 대해 말씀드리기 전에 RCA에 대해 말씀드리겠습니다. RCA는 Root Cause Analysis의 약자로 장애 원인을 분석하는 프로젝트입니다. 특정 장애가 발생했을 때 해당 장애가 왜 발생했는지에 대해서 이유를 밝혀 내는 것입니다. RCA에 대해서는 관련 논문이 몇개 있으니 꼭 확인해보시길 바랍니다. 따라서 현재까지 오픈소스 기반의 RCA 프로젝트는 오픈스택의 Vitrage와 ONAP의 Holmes가..
엣지클라우드 장애 원인 분석 시스템 개발안녕하세요. 이번 포스팅에서는 엣지 클라우드 장애 원인 분석 시스템 개발에 대한 내용을 말씀드리고자 합니다. 가입자에 근접한 네트워크 엣지에서 서비스를 제공하는 엣지 클라우드는 5G에 대한 초 저지연의 속도를 이루기 위한 중요한 기술로 떠오르고 있습니다. 엣지 클라우드는 지리적으로 가입자와 가까운 곳에 위치하면서 서비스를 제공하기 때문에 실질적으로 응답 신속성이 높아지며, VR/AR과 같은 트래픽이 높은 컨텐츠를 제공할 수 있게 됩니다. 또한 기존 중앙 클라우드 방식으로 트래픽이 중앙으로 몰리게 되면서 발생하는 여러 문제점을 엣지 클라우드로 인한 트래픽 분산으로 해결할 수 있게 됩니다. 이러한 엣지 클라우드는 현재 ETSI를 비롯하여 많은 표준 기관에서 표준 문..
백업 기반의 VNF 고가용성 기술 개발안녕하세요. 이번 포스팅에서는 VNF가 제공하는 서비스에 장애가 발생해도 서비스를 제공받는 입장에서 계속적으로 서비스를 받을 수 있는 기법을 개발한 결과를 포스팅하고자 합니다. VNF가 제공하는 서비스 유지 기법은 고가용성을 연구하는 분야나 실제 서비스 사업자들도 굉장히 중요한 문제입니다. 예를 들어 요즘 같이 클라우드 스트리밍, 게임 등과 같이 서비스를 지속적으로 제공하고 장애가 발생해도 사용자가 인지하지 못하게 하여 콘텐츠를 계속 이용할 수 있는 것은 사업의 성공에 중요한 키워드가 될 것 같습니다. 이러한 서비스 유지 기법을 구현하고 해결하기 위해서는 여러 방법들이 있겠지만, 저의 경우에는 가상 머신 스냅샷, 즉 백업 기능을 이용하여 VNF 서비스 유지 기법을..
오픈스택 연구하기(2) : NFV Project Tacker안녕하세요. 본 포스팅에서는 오픈스택 NFV project인 Tacker에 대해 알아도록 하겠습니다. Takcer는 제가 NFV 환경에 대해 연구 할때 가장 많이 사용했던 프로젝트입니다. 연구 결과 도출도 빠르고 비교적 필요한 기능도 어느정도 구현 되어있어서 빠르게 설계를 검증하기도 편리했던 것 같습니다. 오픈스택 NFV 프로젝트인 Tacker는 2015년에 5월 오픈스택 밴쿠버 서밋에서 발표되었습니다. Tacker는 오픈스택 정식 프로젝트로 VNFM, NFVO 그리고 VNFD와 같이 ETSI 표준을 구현하는 프로젝트로 해를 거듭해가면서 여러 내용들을 꾸준하게 업데이트 해갔습니다. 초반에는 모니터링과 같은 기능을 시작해서 SFC,Multi-Si..
오픈소스 모니터링 툴 Zabbix(1) : 이론편안녕하세요. 이번 포스팅에서는 아마 많은 분들께서 서버 관리, 인프라 관리, 클라우드 등에서 사용하고 계시면서도 잘 알려져 있는 오픈소스 모니터링 툴인 Zabbix 이론에 대해 말씀드리고자 합니다. 저 또한 장애 관리나 고가용성에 대한 연구들을 진행하면서 Zabbix를 많이 사용했었습니다. 그 이유는 간편하게 구성할 수 있었고, 제 나름대로의 주관은 웹 UI 즉 인터페이스가 편리했습니다. 이 부분에 대해서는 여러 의견이 있을 것 같네요. 그래도 Template라는 개념을 기반으로 해서 모니터링 범위도 넓기 때문에 범용적으로 사용될 수 있다고 생각됩니다. 그럼 지금부터 오픈소스 모니터링 툴 Zabbix 이론 편에서 Zabbix 기본, 모니터링 범위, 유즈..
MANO란?안녕하세요. 이번 포스팅에서는 NFV를 구성하는 컴포넌트 중 MANO에 대해서 설명하고자 합니다. MANO (Management And Orchestration)의 약자로 한마디로 NFV 환경에서 리소스와 VNF의 라이프사이클을 관리하는 역할은 하는 관리 컴포넌트입니다. 제가 가장 많이 연구했던 컴포넌트이기도 하고, 해당 컴포넌트와 연동하여 VNF의 모니터링, 장애 복구, 관리 등에 대해서 진행하기도 하였습니다. 본 포스팅은 먼저 MANO 표준 문서인 ETSI GS NFV-MAN 001 v1.1.1 (그림참조 : [1]) 문서를 기준으로 최대한 이해하기 쉽게 설명하고자 합니다. 또한 현재 있는 MANO를 구현한 오픈소스 프로젝트까지 알아보고 이들의 차이점이 무엇인지 분석하고자 합니다. * ..