오픈소스 RCA 프로젝트 : ONAP Holmes

반응형

오픈소스 RCA 프로젝트 : ONAP Holmes

안녕하세요 김민욱입니다.

 

이번 포스팅에서는 RCA 프로젝트인 ONAP Holmes에 대해 말씀드리고자 합니다. ONAP은 아주 거대한 플랫폼으로 다수의 프로젝트를 포함하고 있습니다. 그중 RCA 기능이 포함되어 있는데,  Holmes가 ONAP에서 RCA의 기능을 제공하고 있습니다. 

 

그럼 지금부터 간단하게 Holmes에 대해 구조를 파악하고 간단한 프로젝트 컨셉에 대해 소개하도록 하겠습니다. 

 

# 해당 포스팅에 나오는 모든 그림과 내용은 [1]을 참조하였습니다.

 

Architecture & Concept

 

Holmes 프로젝트는 NFV 환경에서 인프라 및 서비스에 대한 장애 알림, 장애 원인의 상관관계를 분석하여 원인을 찾아냅니다.  ONAP에서 DCAE 프로젝트에 속해 있으며 DCAE는 Holmes를 도커 기반으로 배포할 수 있습니다. 문서에 따라서 Holmes는 독립적으로 배포하거나 DCAE에서 분석의 역할을 담당하도록 하나의 부분으로 배포될 수 있습니다.

 

ONAP Holmes의 문서에서 나오는 Holmes 프로젝트가 가지는 범위는 아래와 같습니다. 

 

* Alarm Correlation Rule Management

Holmes는 Openstack Vitrage가 제공하는 템플릿 기능을 마찬가지로 제공하고 있습니다. 이에 따라 알람들의 관계 및 장애에 대한 원인을 파악하기 위한 여러 규칙들을 템플릿 형태로 정의하고 관리합니다.

*Collect Alarms from Different Alarm Sources

Holmes 또한 여러 장애 알람들의 상관 관계를 분석하기 위하여, 다양한 모니터링 프로젝트들 혹은 NFV 기능, SDN 등으로부터 다양한 종류의 장애 알람을 가져오게 됩니다. 

*Alarm Analysis
Holmes는 이처럼 여러 장애 알람을 수집하고, 정의 된 규칙에 따라 알람에 대한 장애 원인을 밝힙니다.  

* Persistence of the Results of Data
모든 결과는 DB에 저정 되어 일관성이 유지되면서도 해당 DB로부터 사용자에게 데이터 분석 결과를 제공하기 위한 View를 제공합니다. 

 

그림 1. Holmes 아키텍쳐(참조 : [1])

 

그림 1에서는 Holmes 구조를 나타냅니다. Holmes는 비교적 간단하게 구성됩니다. 먼저 Rule Designe는 관리자가 GUI를 통해서 수집되는 알람들의 상관관계에 대한 규칙을 작성할 수 있도록 합니다.  그다음 Correlation Engine은 기존의 알람들을 DCAE 실시간 분석 애플리케이션으로부터 알람을 수집하고 Rule Designer를 통해 작성된 규칙에 따라 결과를 분석하고 반환하게 됩니다. 

 

DCAE 실시간 분석 어플리케이션은 텔코의 클라우드 환경에서 계속적으로 이벤트들을 수집하고 Correlation Engine에게 보냅니다. 만약 분석 결과를 받게 되면 Policy 컴포넌트에게 장애 원인을 보내고 장애에 대한 복구를 진행합니다. 

 

결론적으로 Holmes는 ONAP이라는 거대한 프로젝트 내에 속해 있습니다. 사실 각 프로젝트들에 대한 상관관계를 이해하고 분석하기 위해서는 너무 많은 양의 내용이 필요할 수 있습니다.

 

따라서 Holmes는 "모니터링으로 부터 장애를 수집 -> 관리자가 작성한 장애 상관관계 규칙 비교 -> 규칙에 따라 분석 -> 분석 결과 반환"까지의 기능을 가진다고 생각하면 될 것 같습니다.

 

결론

이번 포스팅에서는 ONAP 프로젝트에서 장애 원인 분석 프로젝트인 Holmes에 대해 설명하였습니다. Holmes는 RCA를 수행하면서 유기적으로 다른 프로젝트들과 연계하게 됩니다. 다만 다른 프로젝트와 연계에 대해서 설명하기에는 내용이 너무 방대해지기 때문에 Holmes라는 프로젝트에 대하여 콘셉트만 파악하시고 자세하게 공부하고 싶으시다면, DCAE 프로젝트를 먼저 보시길 추천드립니다.

 

감사합니다.

 

인용글

[1] ONAP Holmes : https://wiki.onap.org/pages/viewpage.action?pageId=5734499

업데이트로그

------------------------------------------------------------------------------------------------------------------------------

해당 글은 스스로 연구한 내용을 통한 주관적인 이해를 바탕으로 작성 되었습니다. 수정 할 부분이 있거나, 다른 의견이 있으시다면 언제든지 말씀해주시면 반영하도록 하겠습니다. 읽어 주셔서 감사합니다. 끝으로 불법으로 복제하는 것은 금합니다.

 

반응형

댓글

Designed by JB FACTORY