Infrastructure とアラート: ホストのアラート情報の追加、変更、表示

適切なアラートは、問題がエンドユーザーに影響を及ぼす前に、インフラの変更について個人やチームへの通知を行うものです。New Relic Infrastructure では、現在 New Relic が監視している文脈の情報で、アラート条件を直接作成できます。

たとえば、フィルターセットの監視中に問題が発生した場合は、New Relic Alerts からその条件を再作成する必要はありません。代わりに、すぐにフィルタセットを選択し、表示しているチャートからアラート条件を直接調整できます。そうすることで、インフラのアラートシステムを管理し、監視できるようになります。

infrastructure-screen-cpu-alert-page.png

infrastucture.newrelic.com > Settings > Alerts: Compute ページから、Create alert condition (アラート条件の作成)を選択したときに表示されるアラート条件ページの例。

ビジネスニーズに合わせたアラートを取得する

ビジネスニーズに合わせてアラートをカスタマイズする例をいくつか示します。

問題の例 New Relic Infrastructure の UI
CPU 使用率:

運用チームは、東部地域のフィルタリングされたホストのクラスタのセットを監視し、CPU 使用率が常に高いことに気づきます。

アラート条件を作成するにあ、New Relic Infrastructure の Compute ページ上の CPU チャートを使います。
仮想メモリの容量:

バックグラウンドワーカーの仮想メモリが、少なくとも2分間に平均 10G に達すると、夜間シフト中はアラートを出す必要があります。

New Relic Infrastructure のProcesses ページTop memory consumers (メモリ​​消費の高い順)チャートを使います。
限られた帯域幅:

受信や送信された平均エラー数に基づいてパフォーマンスを監視したい。

New Relic Infrastructure の Network ページ上の Top bandwidth チャートを使います。
I/O 読み取り/書き込み操作:

ステージング環境でホストの新しいセットをテストしており、読み取り/書き込み能力が、テストの閾値レベルを上回ったときに通知を受けたい。

New Relic Infrastructure の Storage ページ上の Top I/O operations チャートを使います。

簡潔で分かりやすい名前をつける

簡潔で分かりやすい名前は、メールの件名やオンラインチャットなど文字数が限られている通知メッセージにおいて役立つ情報を提供します。これにより、New Relic の UI のインデックスを簡単にスキミングできるようになります。

  • 推奨: New Relic Alert の最大64文字に従います。
  • 何に違反しているのか、本質を説明してください。

New Relic Infrastructure のアラート条件を作成する

アカウントの権限を持つ人は、New Relic Infrastructure ないでアラート条件を作成できます。しかし、New Relic Alerts 内でアラート条件を作成できるのは、オーナーと管理者だけです。

ホスト用に新規のポリシーを作成するには、New Relic Alerts を使います。そして、New Relic Infrastructure のアラート条件を既存の New Relic Alerts ポリシーの追加します。

  1. infrastructure.newrelic.com から、以下のいづれかの New Relic Infrastructure ページを選択します: ComputeProcessesNetworkStorage
  2. フィルターセットを適用し、フィルターを追加したり、削除して、アラートのシナリオの条件をカスタマイズします。
  3. 任意のチャート上で、ギア [bell icon] アイコン > Create alert condition を選択します。
  4. 新規条件ページから、分かりやすい条件名を入力します。
  5. 標準の手順に従って、Critical (必須) と Warning (オプション) アラート用の閾値を定義します。
  6. 新規条件を適用する既存のポリシーを選択し、Create を押します。
アラート条件を保存するが、この時点でアラートを受信しない場合は、Enabled (有効)チェックボックスをオフにします。これは、事前にアラート基準を定義しておく場合などに便利です。次に、アラート条件を再度有効にするには、infrastructure.newrelic.com から、Settings > Alerts を選択し、アラート条件を編集します。

ホストのアラートイベントを表示する

ポリシーの通知チャネルに含まれる人は、アラート通知を受信します。また、New Relic アカウントの権限を持つユーザーは、UI 上で、New Relic Infrastructure のアラートのインシデントや個々の違反を表示できます。

  1. infrastructure.newrelic.comから、Events を押します。
  2. ホストや指定時間帯を変更するには、検索窓を使って、Filter SetTime 機能を使います。
  3. Events リストから、アラートの違反を選択します。
  4. 選択された違反について New Relic Alerts 上で詳細な情報を表示するには、該当違反のリンクを押します。

ホストのアラート情報の更新や削除

アカウントのアクセス許可を持つユーザーは、New Relic Infrastructure のアラート条件の名前の変更、更新、削除が行えます。しかし、New Relic Alerts 上でアラート条件をメンテンナスできるのは、オーナーと管理者だけです。

ホストのアラート情報を編集、無効化(または再有効化)、削除する手順は以下の通りです。

  1. infrastructure.newrelic.com から、Settings > Alerts を選択します。
  2. オプション: 検索窓または、Select all チェックボックスを使って、複数のアラート条件を選択します。
  3. 選択した条件を [pencil icon] 編集、無効化、有効化、[trash can icon] 削除するには、利用可能な機能においてそれぞれ選択します。

インフラと New Relic Alerts を統合する

New Relic Alerts は、New Relic 製品全体に渡り調整された単一のアラートツールを提供します。これにより、Docker コンテナや、JVM など気になるエンティティのメトリクスに焦点を当てたアラートポリシーアラート条件を管理できます。

アラートの機能 New Relic Infrastructure との統合
アラートポリシーの条件
アラートに関する情報
アラートポリシー
  • 表示、追加、変更、無効化、削除: New Relic Alerts UI を使います。
  • ポリシーのホストの条件を追加: Infrastructure UI を使います。
通知チャネル