Infrastructure “レポートしないホスト” 用の条件作成

New Relic Infrastructure の Host not reporting アラート条件 を使うと、New Relic が Infrastructure エージェントからデータを受信しなくなった時に通知を受け取ることができます。New Relic Server がもっていたレガシーな可用性監視機能 [英語]とは異なり、この Infrastructure の機能を使うと、ホストのグループに対して動的に警告したり、5分から60分までの時間設定が可能であり、そして、New Relic Alerts をフルに活用できます。

機能

New Relic Infrastructure では、重要なホスト群に対して条件を定義し、各フィルタセットに適したアラートの閾値を設定できます。Infrastructure エージェントが送信するデータが指定した時間内に New Relic コレクターが受信できない場合は、Host not reporting イベントがトリガされます。

この機能は非常に柔軟なので、監視対象や、通知対象への通気時期を簡単に設定できます。さらに、通知されるメールには、状況を把握できるページへのリンクが含まれています。

Host not reporting condition 機能
監視対象 フィルターセットを使うと、そこで絞り込んだホストに対してアラート条件を設定できます。また、一旦設定したアラート条件は、使用しているフィルターに一致した今後の追加されるホストにも自動的に適用されます。
通知方法 アラート条件はアラートポリシーに適用されます。既存のポリシーを選択するか、New Relic Infrastructure UI から新しいポリシーを作成できます。その場合は、デフォルトで通知チャネルは、メール通知となります。他の通知チャネルを使う新しいポリシーを作成したい場合は、New Relic Alerts を利用してください。使用します。
通知時期 適用したフィルターに合致するホストが閾値に違反した場合は、Infrastructure アラートポリシーで設定されているメールアドレスに自動的に通知されます。
トラブルシューティングする場所 メールの上部にあるリンクをクリックすると、ホストが切断された時間帯が選択された状態で Infrastructure Events ページに移動します。メール内の別のリンクをクリックすると、New Relic Alerts で詳細情報を確認できます。

“host not reporting” 条件の作成

Host not reporting アラート条件の作成手順は以下の通りです。

  1. 標準の手順に従って New Relic Infrastructure のアラート条件を作成します。
  2. Alert type として、Host not reporting を指定します。
  3. アラート通知の基準となる Critical の閾値を設定します。最小:5分。最大:60分。
New Relic Infrastructure: Host not reporting alert condition
New Relic Infrastructure UI でアラート条件を作成するには、チャートのベルアイコン [bell icon] を押します。すると、infrastructure.newrelic.com > Settings > Alerts に移動します。

アラートポリシーには、アラート条件に定義された Critical 閾値に達した場合の通知対象となる通知チャネルを定義します。「誤検知」を避けるために、ホストはアラートをトリガーする前の一定期間のレポートを停止した状態が必要です。

例: フィルターで絞り込んだホストのいずれかが、7分以上レポートをしなかった際にトリガーする条件を作成したとします。

  • いずれかのホストが5分間のレポートを停止し、その後、レポートを再開した場合、New Relic はアラートをトリガーしません
  • いずれかのホストが7分間の報告を停止した場合、他のホストが正常であっても、New Relic がアラートをトリガーします

問題を調査する

ホストがデータをレポートしていない理由を調べるには以下を見てみてください。

  1. アラートのメールにある詳細情報を確認します。
  2. メールにあるリンクから、New Relic Infrastructure の Events ページに移動し、環境内の現在の変更を監視します。たとえば、Events ページは、ルートユーザーがホストの構成を変更した直後に、ホストが切断されたかどうかを判断するのに役立ちます。
  3. オプション: メールにある Acknowledge リンクを使って、アラートのインシデント内容を把握し、所有権が取得していることを確認できます。
  4. メール内のリンクから、New Relic Alerts の Incident details ページに移動し、で詳細を確認してください。

意図的な停止

New Relic は、ホストがデータをレポートしない場合、以下のように、予期しない状況と計画された状況を区別しません。

  • ホストが意図的にオフラインにされている。
  • ホストはメンテナンスのための計画停止している。
  • ホストがシャットダウンもしくは、破棄された。

New Relic は、意図的にサーバーの停止していていも、Host not reporting 条件を適用します。イベントが計画されているか予期していないかを必ず確認してください。New Relic Alert の Incident details ページにアクセスして、手動でインシデントを閉じることもできます。