コレクターの監視

最終更新日: 07 年 2022 月 XNUMX 日

概要

LogicMonitor Collectorは、監視システムの心臓部です。 そのため、コレクターを監視して、パフォーマンスがデータ収集の負荷に追いついていることを確認することが重要です。 同様に重要なのは、コレクターがダウンしたときに可能な限り混乱を最小限に抑えることです。 これには、タイムリーな通知が適切な受信者に配信されるようにすることが含まれます。

ベストプラクティスとして、LogicMonitorでは、(1)コレクターの監視を設定し、(2)コレクターのダウンアラートの通知ルーティングを構成することをお勧めします。

コレクタホストのモニタリングへの追加

まだ監視操作に含まれていない場合は、コレクターがインストールされているデバイスを監視に追加します。 これにより、コレクターの操作をスムーズにするために重要なCPU使用率、ディスクスペース、およびその他のメトリックを監視できます。 監視にデバイスを追加する方法の詳細については、を参照してください。 デバイスの追加.

ホストでのコレクターデータソースの有効化

LogicMonitorは、コレクターの操作、パフォーマンス、およびワークロードに関する洞察を提供する一連の組み込みコレクターデータソースを提供します。 ほとんどの場合、これらのコレクターデータソースは、モニターに追加すると、コレクターデバイスに自動的に適用されます。 リソースツリーでデバイスを展開し、「コレクター」データソースグループを探すことで、これが当てはまることを確認できます。

リソースツリーでデバイスを展開し、「コレクター」データソースグループを探すことにより、コレクターデータソースがコレクターデバイスに適用されていることを確認します

コレクターデータソースがデバイスに自動的に適用されなかった場合は、「コレクター」の値をデバイスに追加することにより、手動で適用できます。 システム カテゴリ プロパティ。 プロパティの設定の詳細については、を参照してください。 リソースとインスタンスのプロパティ.

LogicMonitorは、このデバイスをコレクターのホストとしてインデックス付けし、コレクターデータソースを自動的に適用します。 コレクターデータソースを配置したら、コレクターのパフォーマンスが不足している場合に警告するアラートを構成できます。

注: コレクターデータソースは、(デバイスの構成で確立された)デバイスの優先コレクターのみを監視します。 優先コレクターは、そのデバイスにインストールされているコレクターである必要があります。 そうしないと、コレクターのメトリックが間違ったホストに表示されます。 たとえば、コレクターB(別のホストにインストールされている)を使用してコレクターAをモニターしようとすると、コレクターAのホスト上のコレクターAの代わりにコレクターBのメトリックが表示されます。

コレクターデータソース

レガシーデータソースからの移行

2019年XNUMX月、LogicMonitorは新しいコレクタデータソースのセットをリリースしました。 現在、従来のデータソースを使用してコレクターホストを監視している場合、このパッケージに新しいデータソースをインポートしてもデータが失われることはありません。 これは、モジュールの上書きを排除するためにデータソース名が変更されたためです。

ただし、データソースの両方のセットがアクティブである限り、重複データを収集し、重複アラートを受信します。 このため、従来のコレクタデータソースを無効にすることをお勧めします。 従来のデータソースは、名前の前に「LogicMonitor_Collector」が付いていないコレクターデータソースです。 プレフィックスが「LogicMonitor_Collector」の場合、それは現在のコレクターデータソースです。

データソースを無効にすると、ホストへのクエリとアラートの生成が停止しますが、すべての履歴データは保持されます。 ある時点で、レガシーデータソースを完全に削除したい場合がありますが、削除するとすべての履歴データが失われるため、この移動を慎重に検討してください。 データソースの無効化の詳細については、を参照してください。 データソースまたはインスタンスの監視を無効にする.

データソースの例のハイライト:コレクターデータ収集タスク

適用されるコレクターデータソースの10つは、「コレクターデータ収集タスク」データソースです。 収集時間、実行時間、成功/失敗率、およびアクティブな収集タスクの数に関する統計を監視します。 このデータソースで使用できる概要グラフのXNUMXつは、コレクターの負荷に寄与する上位XNUMXのタスクを特徴としており、CPUまたはメモリの使用量の原因を特定するのに非常に役立ちます。

トップ10の収集タスクの概要グラフは、CPUまたはメモリの使用量の原因を特定するのに非常に役立ちます

コレクターダウンアラートのルーティング

LogicMonitorのサーバーがコレクターからXNUMX分間応答しない場合、コレクターはダウンしていると宣言されます。 あなたはおそらく持っているでしょうが バックアップコレクター コレクターがダウンした場合に備えて、コレクターが予期せずオフラインになることは決して理想的な状況ではありません。 ダウンタイムを最小限に抑え、監視が中断されるリスクを軽減するには、「コレクターダウン」アラートが組織内の適切な個人に(電子メール、テキストなどとして)アクティブに配信されるようにします。 (これらのアラートは、LogicMonitorインターフェイスにも表示されます。)

重要: コレクターがダウンしていると宣言されると、コレクターがダウンする前にそのコレクターによって監視されているデバイスによってトリガーされたアラートはアクティブなままですが、コレクターがダウンしている間は新しいアラートは生成されません。 ただし、別のコレクターにフェイルオーバーしないデバイスは、アラート生成の抑制を無視し、コレクターのステータスがダウンしているときにホストステータスアラートを生成する場合があります。

コレクターのダウンアラートをルーティングするには、コレクターの構成を開きます(設定| コレクター| 管理する)そして以下を指定します:

  • コレクターダウンエスカレーションチェーン。 前述のように エスカレーションチェーン、エスカレーションチェーンは、アラートを通知する必要がある人またはグループを指定し、通知する方法と順序を指定します。
  • 再送間隔。 ノーザンダイバー社の コレクターダウン通知を送信する フィールドで、コレクターダウン通知の再送信間隔を設定します。 再送信しないことを示す(つまり、通知はXNUMX回だけ送信される)か、コレクターのダウンアラート通知がエスカレーションチェーンの次のステージにエスカレーションされるまでに経過する必要がある時間を示すことができます。 アラートが最終段階に達した場合、またはエスカレーションチェーンで指定された段階がXNUMXつしかない場合、この間隔が設定されると、確認またはクリアされるまでアラート通知が再送信される頻度が決まります。

注: デフォルトでは、ダウンしたコレクターがオンラインに戻ると、「アラートクリア」通知がすべてのエスカレーションチェーン受信者に自動的に配信されます。 コレクターの詳細を展開し、チェックを外すことで、このデフォルトをオーバーライドできます。 クリアに関するアラート 次に示すオプション。 ただし、コレクタの指定されたエスカレーション チェーンがアラート通知を LM 統合にルーティングする場合は、このオプションを無効にしないことをお勧めします。 詳細については、次を参照してください。 アラートルール & エスカレーションチェーン.

記事上で