Infrastructure Processes ページ: プロセスパフォーマンスを詳しく調べる

New Relic Infrastructure にある Processes ページを使うと、お使いのインフラ内で実行しているプロセスに関する情報を把握できるようになります。さらに、プロセスのメトリクスに対してアラートを設定できます。Processes ページ にアクセスする手順: infrastructure.newrelic.com > Processes

UI 上からプロセスを開始したり、停止、再起動することはできません。Infrastructure エージェントを開始、停止、確認、再起動するには、標準の手順に従って行なってください。

Infrastructure Processes UI page

infrastructure.newrelic.com > Processes: Infrastructure Processes ページの例: どのホストのどのプロセスが最も多く CPU を消費しているか。

プロセスの調査とアラートの設定

Processes ページには、CPU の割合、I/O バイト、プロセス単体やグループ化しているプロセスに関するメモリ使用量などのデータがあります。この情報を使用して、パフォーマンスの問題を引き起こしているプロセスを特定できます。また、CPU の割合やメモリの使用率などの特定のプロセス条件に対してアラートを作成することもできます。

Processes ページには、CPU の割合、I/O バイト、プロセス単体やグループ化しているプロセスに関するメモリ使用量などのデータがあります。このページには、イベントのヒートマップもあります。これは、表示されているメトリクスと同じ時間帯に発生したイベントのスナップショットです。このページの情報を使って、以下のことができます。

  • パフォーマンスの問題を引き起こしているプロセスを特定できる。
  • CPU 使用率やメモリ使用量などの条件でアラートを作成できる。

以下は、問題を特定し、アラートを設定する方法の例です。

Compute ページを見ると、クラスターの CPU パーセンテージが通常よりもはるかに高いことがわかったとします。Processes ページに移動し、そのクラスターのプロセスにフィルターをかけます。すると、過大な CPU パーセンテージのあるプロセスと同じプロセスのインスタンスが複数存在することがわかります。問題を修正した後、同じプロセスのタイプの CPU パーセンテージが一定の閾値を超えた場合にトリガーするアラートを作成することにします。

  1. Infrastructure の Hosts ページをみて、通常よりも高い CPU 使用率のクラスターを見つけたとします。
  2. 次に、Processes ページに行き、そのクラスターのプロセスのみに絞り込みます。
  3. すると、同じプロセスのいくつかのインスタンスの CPU 使用率が非常に高いことが分かりました。
  4. 問題点を修正した後、(同じ問題がまた起きたときに気づけるように)そのプロセスのタイプの CPU 使用率が一定の閾値を超えた場合にトリガーするアラートを作成することにします。

Processes ページ機能

プロセスをフィルタリングし、グループ化して、プロセスの詳細を調べるには、以下の機能を使います。

したいこと やること
特定の基準に一致するホストのみを表示 フィルターセットを使う。
結果を集約したり、ホスト属性でグループ化 Group by を使って、チャートやリスト内のプロセスのグループ化ルールを変更する。このドロップダウンには hostIDentityName のようなホスト関連の属性があります。AWS EC2 インスタンスを監視している場合は、awsRegion などの EC2 関連属性も利用できます。
時間帯の指定 表示している時間の範囲を変更するには、右上のタイムピッカーを使います。チャートをクリックしてドラッグすると、任意(ドラッグで指定した範囲)の時間を選択することもできます。時間範囲が指定された状態で、Infrastructure ページから別のページに移動すると、指定している時間範囲は引き継がれます。
Docker のメトリクスの表示 Docker コンテナによるプロセスの使用状況を表示するには、Docker 計測をご覧ください。
チャートで表示しているメトリクスの変更 並び替えのドロップダウンを使うと、指定したプロセスグループのチャートが表示しているメトリックを切り替えることができます。選択項目として、Memory Resident Size(常駐メモリサイズ)、Memory Virtual Size(仮想メモリサイズ)、CPU %、Network I/O Received(受信ネットワークI/0)、Network I/O Sent(送信ネットワークI/0)、Disk I/O Read(読み取りディスクI/0)、Disk I/O Write(書き込みディスクI/0)があります。
リストの検索とフィルター Search interfaces 検索バーに入力すると、入力したテキストを含む対象のみのリストに絞り込まれます。

フィルタリングするリストの項目やユーザ名を選択するだけで、リストをフィルタリングすることもできます。選択しているフィルターはチャートの上のフィルタアイコンの横に表示されます。

メトリクス毎のアラート条件の設定 チャートにマウスオーバーするか、[ellipses icon] アイコンを選択し、[bell icon] アイコンを選択します。
ホストの アラートの閾値違反の表示 ホストの Critical times-circle-o アイコンや Warning exclamation-triangle アイコンを選択します。
データを共有したり、New Relic Insights でデータの表示 チャート上にマウスオーバーするか、[ellipses icon] アイコンを選択し、View in Insights を選択する。

チャートにあるデータ属性

Processes ページのチャートで使われている属性に関する技術的な説明を知りたい方は、ProcessSample 属性をご覧ください。