テレコムアプリの実装の特徴と監視方法② 〜EM編〜

引き続きテレコムアプリ(Network Function)の特徴と監視方法についてまとめてみた。今回はNFの監視機能部であるEM(Element Manager)についてまとめてみた。

EMの役割

テレコムアプリ(NF)はユーザに安定した通信を提供するため、長期間NFを動作させ続けるという要件があり、「モバイルネットワークの保守運用の基礎」のようなテレコムアプリの運用やメンテナンスのための様々な機能が実装されている。基本的な考え方はFCAPS (Fault management / Caonfiguration management / Accounting management / Performance management / Security management)となるが、近年はここにProvisioning + LCM (LifeCycle Management)やProve監視といった運用方法が追加されている。

EMのFCAPSの実装例

Open Sourceも含めて一般的にFCAPSは3つの機能とAPI GW(Gateway)で実装されていることが多い。
  1. Data Collection: 監視対象からLogや信号を集める
    • 通常のLinuxであればSyslogやSNMP、HW関連であればIPMIやRedfishなどを利用してDataを集めることが多い
    • 昔であればvmstat + tail -f /var/log/messageなどを利用することが多かったと思うが、最近はZabbix Agent / Prometheus Exporter / SNMP agentなどのツール、更にはiLoやiDracなどの管理用の専用HWなどを利用することが多い
    • 3GPP-SA5やNFVだとLog (FM/SM)やReport (PM/AM)と呼ばれ、実際にFM/PMなどで管理される情報の元ネタ相当となる
  2. Data Analysis: 集めた信号からコンポーネント単位の状態変化を判定し異常状態の有無を管理し、Alarm発生/回復を判断する
    • 各管理コンポーネント(Managed Object)とマッピングされ、各MOの状態を生成する。障害時は1のCollectionが情報欠損することが多いため、SynchronizationやAuditの機能を保持していることが多い。
    • MIB Treeや3GPP-SA5/NFVのようにMOの単位はある程度共通化し、実装自体は独自実装であることが多かったと思う。またはCongresのようなルールベースとして、状態を持たないケースもあると思う。最近は各種ライブラリやiLo/iDracが充実化し、共通フレーム枠が揃いつつあるように感じる。
    • 3GPP-SA5やETSI-NFVではState mgmtと呼ばれているが、基本的には実装依存になっているように思われる。ITUにおいてはX.731 State management function (日本語版)などで状態の定義が行われている。
  3. Data Store: 正規化された
    • 各インスタンス単位に正規化され、時系列に警報などの形で保存されていることが多い
    • 多くの場合は、標準化IFに合わせたSchemaでDBに保存されている。Zabbix Manager、Prometheus、SNMP Managerなどが該当したり、API GWとセットで実装されたりする。
    • 3GPP-SA5やNFVだと正規化された後に、Alarm(FM)やThreashold(PM)のように通知される。

API GWはこれらの情報をOSSなどに通知できるように3GPPやNFVの規定に合わせたREST  Serverになっていることが多い。Collection、Analysis、Data store、API GWは利用するOpen Sourceや監視対象項目/ポイントによって区分が異なるため、明確にこれら4つの機能が切れていることは無いように感じる。

NFVの標準仕様に従った実装例としてOPNFV Doctorがあるが、そのFaultの定義や、OpenStackのプレゼンテーション内容を見ると、概ね以下のようなことをやっていると思われる。


なかなか標準仕様の説明も実装例の情報も少ないEMについて、Open Sourceやプレゼンテーションから実装例を解説してみた。仮想化からクラウドネイティブ化の流れの中で、従来のEMの監視からサービス監視へとトレンドが移ってきているため、そちらの実装例も紹介していきたい。

コメント

このブログの人気の投稿

CISMとは?CCMとは?NFVでコンテナ管理はどうやるの?

モバイルネットワークの保守運用の基礎

VNFMとは?