#5 新人営業が、初めてサーバ監視・運用の設定をしてみた

こんにちは。IIJに最近入社した新人営業の高田 麻華(たかだ あさか)です。
クラウドサービス「IIJ GIO(ジオ)」の担当をしています。

お客様からよく相談をいただくサーバの監視。もっと詳しくなりたくて、監視・運用の設定に初めて挑戦してみました!

目次
  1. 今回のミッション
  2. IIJ統合運用管理サービス(UOM)とは
  3. 監視設定はUOMの「シンプルパック」でカンタンに
  4. 通知方法の設定(メール/自動電話/チャット)
  5. 自動オペレーションの機能と設定

今回のミッション

先日、お客様から「サーバの監視をしているんだけど、アラート通知が一晩で1,000通ぐらい来て、必要なアラートが埋もれて困っている」と相談を受けました。
IIJ統合運用管理サービス(UOM:ユーオーエム)で解決できると聞いたので、先輩Hさんに教わりながら設定してみます。

IIJ統合運用管理サービス(UOM)とは

(先輩H)「UOM」はSaaS型の監視サービスで、複数のシステムから発生するアラートを一元管理できるんだ。更に、アラートを自動集約するから、アラート数を削減できるんだよ。

どんな風に自動集約できるんですか?

重複するアラートは、5分単位でひとまとめにできるよ。
フィルタルールを設定できるから、運用に必要のないアラートは排除できるんだ。IIJが調べてみたら、アラートの97%は不要なアラートだったらしい。

自動集約で、今回のお客様のお悩みは解決できそうです!必要なアラートだけ通知されるのも、とてもよさそうですね。

監視設定はUOMの「シンプルパック」でカンタンに

じゃあ実際に、UOMの「シンプルパック」を設定してみよう。

「シンプルパック」??何がシンプルなんですか?

IIJおすすめの監視内容が設定された状態でデリバリされるから、お客様にはシンプルで手軽に使ってもらえるよ。例えば、リソース監視はメモリが何%超えたら見直す必要があるか分かる?

分からないです…

そうだよね、そういった閾値などの設定内容を一から考えるのは難しい。設定項目も多いし、サーバ台数が多いと大変だよね。 だから、IIJが長年の運用の実績から培ったノウハウを使って「シンプルパック」を作ったんだ。
お客様がよく設定している監視項目・監視方法・設定値をIIJがテンプレート化し、設定代行するんだ。月額1万円/1台で手軽に導入できるし、お客様は設定シートの項目をいくつか埋めるだけでいいんだよ。

監視項目

1台、1万円!価格もシンプルですね。これまで監視をしていなかった方でも安心して使っていただけますね。
設定シートに監視対象のIPアドレス/OS/サーバ名を入力して…できました!

これで設定されたよ。管理画面に入ってみよう。
ここからインシデント情報や対応状況を確認できるよ。

(クリックすると拡大表示します)

通知方法の設定(メール/自動電話/チャット)

アラートの通知方法も、設定シートやこの管理画面から設定するんだよ。
メールはもちろん、自動電話やMicrosoft Teamsなどのチャットにも通知できるよ。

自動電話ですか?

夜中にサービス断のような重要なアラートが発生した場合、メールやチャットの通知だと気付けないことも多く、対応が遅れることがあるよね。だから、アラートの種類によっては、電話で通知させる設定ができるんだ。

確かに、電話の方が通知にすぐ気付けますね。

しかも1人に電話するのではなく、出なかった場合は次の人に電話する、といった連絡先グループも作れるから、より安心して使っていただけるよ。
UOMを使う前は、アラートを電話通知させるために、多額のコストをかけて人を雇っていた、というお客様もいたよ。そういったお客様には、コスト削減になるぴったりな機能だよね。
(事例記事「700台を超えるサーバの監視アラート通知を自動化」

電話が、かかってきました!出てみます。

こちらはIIJサポートセンターです。[uomXXXXXXX]でアラートの発生を検知しました。障害が発生している可能性があります。

これで、いつでも重大なアラートに気付けますね。

自動オペレーションの機能と設定

だけど、この後の復旧作業も大変そうです。電話で通知が来ても、休日や夜中だとすぐには対応できないですよね…

復旧作業も自動化できるよ。事前にコマンドやスクリプトを設定しておくと、サーバ再起動/プロセス再起動/状態の確認/静観が自動的に実行されるんだ。このコマンドやスクリプトもIIJが設定するよ。

(クリックすると拡大表示します)

自動オペレーションの機能もあるんですね!自分では難しそうだけど、IIJが設定してくれるなら安心です。対応が遅れることもなく、運用が効率化できますね。

ここまでの監視~自動電話~自動オペレーションまでの流れは自動でチケット管理され、タイムライン化してくれるから、対応状況の管理もできるよ。

今回はIIJ GIOインフラストラクチャー P2 Gen.2のサーバに監視の設定をしましたよね。UOMは、IIJのクラウドサービス以外にも使えるんですか?

事前設定がいくつか必要だけど、IIJ以外のクラウドにも、オンプレミスのサーバにも使えるよ。どんなお客様にも使っていただけるサービスだよ。

初めてUOMを使ってみて

お客様のお悩みを解決できそうでよかったです。
UOMの「シンプルパック」では設定シートの記入だけでアラートの集約から自動電話、自動オペレーションまでやってくれるので、監視の知識が全然ない私でもできました。
アラート通知がたくさん来て困っている方、監視設定を手軽にしたい方にはぜひ使ってみていただきたいです。1台からでも、もちろん大丈夫です!(高田)