こんにちは。ES/1 Shelty担当の古澤です。
今回はリニューアルした閾値検査についてご紹介します。
V2.4.0では、下記の機能を持つ、新たな閾値検査を利用可能です。
1.より多くの閾値検査項目に対応
2.閾値設定をアシストする推奨セットを提供
3.通知先として、メールとTeamsに対応
これまで、選択可能な閾値検査項目が限られていましたが、お客様より、「JavaのGCに対して閾値検査をしたい」といった、対象外の項目に対する閾値設定の要望をいただくことがありました。
V2.4.0では対象項目を増やし、細やかな設定が可能になったため、上記のような要望を実現できます。
例えば、JavaのGCに対する閾値設定では、GCの種別まで選択可能です。
また、項目の追加とともに、閾値検査の粒度を1秒から1分に変更したことで、一時的なスパイクを検知しにくくなります。
閾値超過イベント一覧画面には、「ベータ機能」メニューよりアクセスします。
「カテゴリ」に含まれるメトリックに対して閾値を設定します。
ES/1 Sheltyの取り扱いデータ項目は上記以外にもありますが、それらの項目に対する閾値検査は今後のリリースにて対応予定です。
なお、「ベータ機能」は新機能をなるべく早く利用可能とするためにV2.4.0より新たに設けられたメニューです。
既存の閾値検査機能は後続バージョンにおいて、本記事で紹介する閾値検査に機能を統合しアップデートする予定です。
すべてを統合するとリリースまでに時間がかかってしまうため、ご要望に素早く応えるために「ベータ機能」としてリリースすることにしました。
まず、閾値検査を始めてみたいという場合に、IIM推奨の閾値セットを選択可能です。
こちらはカテゴリ毎に一般的な閾値をプリセットしているため、ボタン一つですぐに設定ができます。
運用を開始してみてあまりに閾値違反が多く発生する場合は、環境に合った閾値に変更してください。
閾値は一度設定したら終わりではなく、都度見直しをかけて更新していただくものですので、状況を見ながら更新していただければと思います。
閾値検査の結果を通知する場合、これまではSNMPトラップが利用可能でした。V2.4.0では新たに、SMTP (メール)とWebhook (Microsoft Teams)に対応します。
普段利用しているツールで通知を受け取ることができるため、閾値違反にすぐに気が付くことができ、その後の対応もスムーズになります。
これらの通知先は閾値検査の結果だけでなく、Sheltyの状態監視状況や製品ログの通知においても利用可能です。
閾値検査をより使いやすくするため、対象項目の更なる追加や実測値を見ながら閾値を設定するアシスト機能を検討中です。
実測値を見ながらの設定を検討している背景としては、お客様に、「閾値はどのように決めていますか?」と伺うと、複数のお客様から「過去の実績を見て決めています」という回答をいただいていたためです。
このアップデートが実現されると、グラフにて過去の実測値を確認しながら閾値を設定することが可能になります。
リニューアルした閾値検査は、今後も機能拡張を続けていきます。新しい閾値監視を運用の省力化にお役立ていただければ幸いです。