Infrastructure のプロセスに対するアラート

フィルタリングされたホスト上の一連のプロセスが設定可能な時間(分)実行されなくなったときに通知される、New Relic Infrastructure Process running [稼働プロセス]アラート条件を使うと、フィルタリングしたホストで動いているプロセスが、指定した時間(分)実行されなくなったときにアラートを通知できます。このアラート条件は、以下のような場合に便利です。

  • ホスト上のあるプロセスが New Relic への報告を停止した場合
  • ホスト(新しいプログラムなど)で開始すると期待したプロセスが実際に実行されていない場合

この機能の柔軟性により、監視するホストやプロセス、選択した個人やチームにいつ通知するかを簡単にフィルタリングできます。さらに、通知メールには、状況を迅速に解決するためヒントとなるリンクが含まれています。

New Relic Infrastructure のページでホストにフィルターを適用し、[bell icon] ベルアイコンを押して、アラート条件を作成すると、Settings > Alerts ページは現在の指定しているフィルターが自動的に適用された状態で表示されます。

ビジネスにとって重要なホストやプロセスにフィルターを適用し、アラートの閾値が定義され、アラートイベントがトリガされ、New Relic がメールを送信するタイミングを決定できます。以下では、Infrastructure の Process running 条件を使ってプロセスを監視する方法を紹介しています。

負荷を満たすために十分なプロセスが実行されていることを保証したい
課題: ロードバランサーやアプリケーションサーバーの中には、多くのワーカープロセスを並行して実行するものがあります。たとえば、gunicorn のようなサービスを実行しているプロセスが8つ以下の場合に、アラート通知がほしい時があります。

対策: 状況に応じて、以下を使って Process running 閾値を指定します。

  • More than: 定義した数以上のプロセスが実行されている場合にアラート通知したい
  • Exactly: 定義した数のプロセスが実行された場合にアラート通知したい
  • Fewer than :定義した数より少ないプロセスが実行されている場合にアラート通知したい
重要なサービスが常に実行されることを保証したい
課題: 特定のホストで、データベースやアプリケーションサーバーなどのサービスが実行されており、停止した時点で、その状況を把握したい。

対策: No processes are running [プロセスが実行されていない](デフォルト) 閾値を使って設定します。

特別重視したいプロセスの起動を監視したい
課題: セキュリティーやパフォーマンスの問題を鑑みて、あるプロセスは特に注意を払って監視したい。

対策: プロセスが実行されているときに Infrastructure が通知できるように、ユーザー名と実行可能ファイルを条件フィルタを設定して、At least one process is running [少なくとも1つのプロセスが実行]の閾値を使って設定します。

ジョブが長くかからないようにしたい
課題: 定期的に実行されるジョブがあり、予想時間(分)より長く実行されたときに通知を受けたい。

対策: At least one process is running 閾値を選択します。

サービスが正常に開始されたことを検証したい
課題: 新しくホストをプロビジョニングする際、必要なサービスが正常に起動した場合に警告を受けたい。

対策: No processes are running (デフォルト) の閾値を選択します。

暴走するプロセスや設定の問題を監視したい
課題: プロセスの問題は、設定変更をすることで解決できる場合があります。たとえば、Chef プロセスが複数稼働している場合、そのサービスの設定に関する問題に対処する必要があります。

対策: 状況に応じて、以下を使って Process running 閾値を指定します。

  • More than: 定義した数以上のプロセスが実行されている場合にアラート通知したい
  • Exactly: 定義した数のプロセスが実行された場合にアラート通知したい
  • Fewer than :定義した数より少ないプロセスが実行されている場合にアラート通知したい

Infrastructure 実行中のプロセス用の条件を作成する

New Relic Infrastructure: Process running alert
infrastructure.newrelic.com > Settings > Alerts: Process running のアラート条件を設定では、ホスト、プロセスの種類別にフィルタリングできます。ターゲットプロセスを選択した後、プロセスが多すぎると警告するか、少なすぎると警告するか、プロセスが存在している場合に警告するかを選択し、アラート通知をトリガーするまで待機時間(分)を選択します。

Process running アラートの設定手順は以下の通りです。

  1. 標準的な手順に従って、New Relic Infrastructure のアラート条件を作成します
  2. Alert type として Process running を選択します。
  3. アラート条件を適用するホスト、プロセスを絞り込みます。
  4. アラート通知をトリガーする Critical の閾値を定義します。最小1分、デフォルト5分、最大60分。

Infrastructure でアラート条件を直接作成した場合、アラート条件に定義した閾値が満たされると、New Relic はメールを送信します。また、アラートポリシーを使うと、通知チャネルを定義できます。