アラートのトリガーとなる閾値の定義

管理者 または オーナー

New Relic Alerts のアラートポリシーワークフローの一環として、ポリシー用のアラート条件を作成します。閾値は、違反が発生した際に、アラートを発行するかを判断するアラート条件の値や頻度を示すものとなります。以下はその例です。

  • アプリケーションが、閾値である 5秒を平均で、直近 15分間以上、超えている場合に、ウェブの応答時間について警告します。
  • 直近 60分以内の一度でも、エラー率が 10% になるとアラートを発行する。
  • 直近 8分以上、プラグインが平均 8ユニットより多い場合、Component/summary-metric をアラートする

必須の5分間の閾値

New Relic Alerts がインシデントレコードを生成するには、アラート違反は、少なくとも 5分以上定義した閾値を超えた状態が続いていなくてはなりません。例:

  • ブラウザアプリが、2分間 Apdex Critial の閾値の 90% を下回り、その後、96% に戻り、その後、再度、3分間 89% に低下した場合は、インシデントレコードの作成や通知の送信は行いません。
  • ブラウザアプリが、5分間連続で Apdex Critial の閾値の 90% を下回った場合は、インシデントレコードが生成され、通知が送信されます。

アラート条件への閾値の追加

管理者 または オーナー: 初めてアラートポリシー用の条件を作成する際は、選択したポリシーの Alert conditions ページ上に自動で Define thresholds セクションが表示されます。選択したターゲット用に少なくとも、Critical (red) [致命的] の閾値を設定する必要があります。

<

div class=”dnd-atom-wrapper type-image context-inline_image” contenteditable=”false”>

Alerts v3: Thresholds for conditions
Alerts > Alert policies > (選択したポリシー) > Alert conditions > (選択した条件) > Define thresholds: アラート条件のキーメトリクスの値と頻度を選択する。または、カスタムメトリックの閾値を定義する。Critical (赤色) レベルの指定は必須です。

アラート条件の閾値を定義する手順は以下のとおりです。

  1. New Relic のメニューバーから、Alerts > Alert policies > (選択したポリシー) > Alert conditions > (選択した条件) > Define thresholds へアクセスします。
  2. Critical (赤色) の閾値となるキーメトリクスの値と頻度を選択します。もしくは、カスタムメトリックの閾値を定義します。。
  3. オプション: Critical レベルに達する前に検知する Warning (黄色) 閾値を定義します。
  4. オプション: デフォルトで設定されている条件名を一部変更します。
  5. オプション: 状況への対策をとなるランブックの手順が記載の URLを入力します。
  6. Create condition [条件の作成]を押します。

一旦、条件を作成すると、条件名は、Thresholds 欄に表示されなくなります。条件名を変更したい場合は、ポリシーの Alert conditions ページから変更できます。

閾値レベルの選択

閾値には、重大度に合わせてレベルを定義できます。

閾値レベル コメント
Info (webhooks のみ) 通知チャネルwebhooks を使っている場合は、$SEVERITY の値に、一般的な通知 (INFO) を設定できます。
icon-alert-warning.png Warning (yellow)
オプション
通知なし

イベントがある閾値を超えるた状況を監視したいが、アラート通知は受信したいくない場合、アラート条件の Warning の閾値を設定します。通常、Warning の閾値は、Critical の閾値より低いを設定します。つまり、より致命的な状況になる前にトリガーされる警告を意味するものとなります。

使用例として、指定した期間中に CPU 使用率が 80% を超えた場合は、UI 上で Warning のイベント詳細を確認し、CPU 使用率が 95% を超える時は、ポリシーに設定した通知チャネル宛に重大(Critial)なアラートを送信するようしたい場合などです。

例外: Apdex 条件の場合、Warning 閾値は、Critical の閾値よりも高い値を設定してください。なぜなら、Apdex スコアというのは、高い値が、良い値だからです。使用例としては、アプリの Apdex レベルが、96% になると Warning をトリガーし、92% を下回ると Critical アラート通知をトリガーするなどです。

icon-alert-critical.png Critical (red)

必須

通知チャネルの利用あり

アラート条件に Critical の閾値を設定すると、指定した期間イベントが指定このレベルに指定した値を超えた場合に、ポリシーに設定した通知チャネルに送信します。また、UI上で Critical イベントの詳細の表示し、承認(所有権の取得)できます。

アラート条件の閾値の確認

アラートポリシーの条件の閾値を確認するには、New Relic のメニューバーから、Alerts > Alert policies > (選択したポリシー) > Alert conditions へアクセスします。Alert conditions ページには、既存の条件、製品ターゲット、その閾値の一覧が表示されます。

Alerts v3: Alert conditions-multiple
Alerts > Alert policies > (選択したポリシー) > Alert conditions: New Relic APM が監視するアプリ用の条件が2つ、New Relic Browser で監視するアプリ用の条件が1つ、New Relic Servers 監視するサーバー用の条件を1つ持つポリシーの例です。
Alert policies インデックスページとポリシーの Alert conditions ページでは、アラートポリシーにいくつ条件があるかを表示します。ポリシーあたり最大 100 個の条件を設定できます。

アラート条件の閾値の変更

管理者 または オーナー

アラートポリシーに条件を初めて追加する場合は、最低限、Critical (赤色)の閾値を設定する必要があります。このアラート条件用の閾値を後で変更する手順は以下のとおりです。

  1. New Relic のメニューバーから、Alerts > Alert policies > (選択したポリシー) > Alert conditions > (選択した条件) へアクセスします。
  2. 条件の Thresholds 欄から、Critical (赤色) アラート条件(必須) に設定した標準のキーメトリックの値を選択するか、カスタムメトリックの値を選択します。
  3. Warning (黄色) 閾値を利用する場合は、Add a warning threshold を押し、トリガー条件となる値をセットします。

    もしくは、

    Warning 閾値の変更もしくは削除(Remove))する場合は、既存の値を選択します。

  4. このアラート条件で発生するインシデントを処理するための手順などの情報を含めるには、Add runbook URL [ランブック URL の追加]を押します。

    もしくは、

    アラート条件から既存のランブックの URL を変更、削除するには、Remove を押します。

  5. Save condition [条件の保存]を押します。

関連情報

関連する情報は以下のとおりです。