サーバーモニターのアラート

イベントがアラートをトリガーすると、アラートの要約情報が Recent events リストに表示されます。履歴やチャートなどのアラートの詳細については、該当するリンクを選択します。詳細ページ上でアラート通知の受信を確認できます。

ヒント: Recent events を特定のイベントタイプでフィルタするには、リストの上部にある対応するアイコンを選択します。

アラートのトリガー

New Relic Server モニターは、ダウンタイム、ディスクフルやメモリなど過度のリソース使用に基づきアラートを生成します。以下のサーバーのアラートを取得できます:

Threshold(閾値) 説明
CPU% CPU 使用率の閾値は、潜在的に持続不可能な負荷とみなさ永続的な CPU 使用率である。このレートは、サーバーの全 CPU の平均です。
Disk IO % ディスクIOは、サーバー上のディスクのビジー状態とアイドル時間の割合です。スループットの割合ではありません。
Memory % メモリ使用率の閾値は、持続不可能な負荷とみなす永続メモリの使用率です。
Fullest disk % ディスク容量とは、最大ディスクの時間以上使用されているディスク容量の割合です。
Downtime サーバーが一定期間、New Relic へのデータ送信を停止したとき、ダウンタイムは報告されます。

注:サーバーの監視の場合、致命的な条件よりも低い警告の閾値の条件を設定してください。警告イベントの大量通知を避けるには、致命的な条件より高い警告条件をアラート遅延時間に設定してください。

サーバーの問題(CPU、ディスク、メモリ)が発生するとポリシー1つに付き1度だけアラートを1つ生成します。同時に同じポリシーで複数サーバー上で複数の問題が発生した場合は、最初の問題が発生した時、アラートを1つ受信します。そして、致命的なサーバーの問題が全て対応終了したら、回復完了通知を1つ受け取ります。

問題がアラートを生成したかどうかに関係なく、問題は Servers の Recent Eventsリストに表示されます。Servers Overview ページは、適切な色を表示します。

New Relic Server のモニターUIは、サーバーリソースの現在の健康状態を示すステータスインジケータ(緑、黄、赤、灰色)が表示します。このインジケータにより、問題があるかどうかを判断できます。サーバーモニタのUIにアラートを表示したり、フィルタリングすることができます。

アラートの承認

オプション:アラートを承認すると、その他の人が既読済みのアラートかどうか判断できます。アラートの詳細において、Acknowledge alert [アラートの承認]を選択します。そうすると、イベントを承認するためにメールを送信します。アラートの詳細に承認者の名前が記録されます。

関連情報

関連する情報は以下のとおりです。