ベースラインアラート条件の作成

ベースラインアラートを使用すると、過去のデータの動きに合わせた閾値アラート条件を作成できます。この機能は、New Relic Alerts の New Relic APM および New Relic Browser 用のアプリで利用できます。また、NRQL クエリでも利用できます。可能であり、現在、限定リリースのため一部のユーザーのみ利用できます。

  • 週やある期間の周期性があるパターンのデータや傾向に適応するアラートを作成したい場合。
  • 動きがよく分からない新規のシステムにおいて、条件と閾値をすばやく設定したい場合。
  • データが予想の範囲外になった場合にのみ、通知するような、アラート条件を作成したい場合。

ここでは、以下の内容を説明しています。

ベースラインアラートとは

New Relic Alerts baseline alerting threshold preview chart
Alerts > Alert policies > Define thresholds:
上図は、ベースラインアラートのプレビューチャートです。点線の暗い線は、メトリクスのベースラインの値です。ベースラインを囲むグレー部分の範囲を調整して、アラート条件の感度を設定します。

ベースラインアラートの背景にある概念を一旦理解すれば、ベースラインの閾値でアラート条件を簡単に作成できるようになります。ベースラインを使用してアラートを作成する方法について簡単に説明します。

  1. アラート条件を作成するメトリックデータを指定します。
  2. New Relic Alerts は、過去のデータを使って、データの今後の動作を動的に予測します。この予測はベースラインと呼んでいます。ベースラインは上のチャートの黒い点線で表されています。
  3. アラート条件の感度を表す範囲(上の図のベースラインの灰色の帯)を調整します。ベースラインに範囲を絞ると、アラートはより敏感になります。ベースラインからさらに遠ざけると感度が低下します。
  4. Critical の範囲(上記のチャートの外側の薄いグレーの範囲)とオプションである Warning の範囲(内側の濃いグレーの範囲)の両方を設定できます。
  5. データが、予測した「通常」範囲から外れた場合、アラート通知が送信されます。

New Relic Alerts が採用しているベースラインのアルゴリズムは数学的に複雑ですが、予測は以下で紹介するルールに則って行われています。

データ特性 ベースラインのルール
データの一貫性 メトリクスの値が、一定の範囲内あったり、傾向が緩やかで安定している場合、予測可能な動作は、閾値がベースライン付近でより厳しくなることを意味します。多様で予測不可能なデータというのは、より緩やかな(より広い)閾値となるでしょう。意味がわからん。前者の場合は、ちょっとでもずれるとすぐにアラートとみなされるようになるってこと?後ろの文は何をいっているのか不明。データに一貫性がない場合は、閾値(グレー部分)を大きくしろってこと?
定期的な変動 (毎週水曜日の午後1時のデプロイや夜間のレポート処理などで起こる)一週間内の周期的な変動がある場合、ベースラインのアルゴリズムはこの周期的な変動を探し、それらに適用しようとします。
経年データ 短期間だけ存在するデータの場合、ベースラインはかなり変動し、あまり正確ではありません。通常発生する値とそれに適応した動作を決定するための十分なデータがまだないためです。過去のデータが多いほど、ベースラインと閾値はより正確になります。

ベースラインアラートのポリシーの作成

あるアラート条件にあるエンティティは全て、同じ閾値の設定を共有します。APM や Browser のエンティティに異なる閾値を設定したい場合は、ポリシーに複数の条件を作成する必要があります。

New Relic Alerts の1つのポリシーと1つ以上のエンティティにベースラインアラート条件を設定する手順は以下のとおりです。

  1. 標準のワークフローに従って、ポリシーを作成します。
  2. 条件の作成時点(ステップ 2)で、対象製品として、APM > Application metric baseline もしくは Browser > Metric baseline を選択し、対象のエンティティとして、1つ以上の APM、Browser アプリを選択します。
  3. ベースラインの閾値を設定します。
  4. UI の表示内容に従い、アラート条件の設定を行い、保存します。

ベースラインアラートの閾値の設定

効果的なベースライン条件の閾値を作成するには、以下のプロセスを試行錯誤して繰り返すこと が必要です。

  • 閾値の調整
  • 設定によって生成される違反のレビュー
New Relic Alerts: Baseline alert condition screen
Alerts > Alert policies > Alert conditions > Define thresholds: スライダバーを使用して、閾値を調整する際に、過去のデータに違反がどのように現れるかを確認します。プレビューチャートに表示される Critical(赤色)とオプションの Warning (黄色)違反の数は、現在の閾値の設定に基づき決まっています。三角マーカーは、違反が発生したときに表示されます。詳細はプレビューチャート上の任意の場所にマウスオーバーすると、表示されます。

以下は、APM > Application metric baseline または Browser > Metric baseline の条件用にベースラインアラートの閾値を作成する方法の例です。

  1. When any target application ドロップダウンから、モニターするメトリックを選択します。
  2. プレビューチャートに表示する時間範囲(2または7日*)を選択します。
  3. 必須: Critical(赤)の閾値を設定します。プレビューチャートに明るい灰色の帯として表示されます。スライダーバーの上にある頻度と時間の設定を行い、違反のトリガー対象を選択します。スライダーを使って、閾値を調整します。
  4. オプション: 同じ手順に従って、Warning (黄色)の閾値を設定します。この閾値は、プレビューチャートに濃い灰色の帯として表示されます。
  5. オプション: アラート条件が複数のアプリに適用される場合は、プレビューチャートの上にあるドロップダウンから項目を選択して、アプリごとにベースラインアラートの閾値がどのように表示されるかを調べます。
  6. 閾値の設定が完了したら、ベースラインアラート条件を保存します。
*プレビューチャートで指定する2日(since 2 days ago)や7日(since 7 days ago)は、プレビューチャートで表示する期間を意味します。つまり、指定した日付がベースラインの計算に使われる訳ではありません。(つまり、2日を選んでも、7日を選んでも予測の内容が変わる訳ではありません)。ベースラインは、数週間前までのデータを使って計算しています。

関連情報

関連する情報は以下のとおりです。