重複アラート抑制(やったー!)

[クリスモーガンによって書かれた、 LogicMonitorのシニアソリューションエンジニア]

LogicMonitorでは、 私たちの監視哲学 顧客に提供することです 実用的なインテリジェンス。 実用的なインテリジェンスの優れた例は、ITインフラストラクチャのパフォーマンスの問題について送信するアラートです。 意味のあるパフォーマンスとヘルスメトリックを提供することは私たちの基本ですが、過負荷はしばしば無関心になり、監視の本来の目的を損なうため、アラートであなたを圧倒することは避けたいと思います。

SQLデータベースを実行しているWindowsServerが資格情報の変更を受け取った場合を考えてみます。 そのサーバーへの新しいクライアント要求はすべて失敗し、失敗するたびにウィンドウイベントがトリガーされます。 サーバーに問題があり、100の異なるクライアントがサーバーへのアクセスに失敗すると、次のイベントとアラートが表示されます。 それぞれ あらゆる 失敗。 これはすぐに圧倒的になり、アラートストームを回避するためにEventSourceアラートをオフにする可能性があります。 この場合のフラストレーションは理解できます。単一のWindowsServerが、非常に短い期間で何千ものイベントアラートを処理する可能性があります。 ただし、イベントアラートをオフにすると、悲惨な結果を招く可能性があります。実際にアラートをオンにする必要がある重要なイベントを見逃す可能性があるため、お風呂の水で赤ちゃんを捨てることになります。

これに対処するために、LogicMonitorは重複アラートを抑制する新機能を実装しました。 Windows(および歴史的にはLM)は扱います 各イベント 別のアラートとして。 この新機能を使用すると、特定のイベントについてアラートを出すことができますが、特定の期間の重複は抑制されます。 以前はアラートストームを受信して​​いましたが、今では指定した期間(デフォルトは1時間)に対してXNUMXつのアラートを受信するだけです。 アラートに注意を向けることができます あなたは嵐に雪が降っていないので必要です。

その結果、Windowsイベントアラートがアラートタブや受信トレイを圧倒することはなくなりました。 アラートが過負荷になるリスクなしに、イベントアラートを適切な場所に維持できます。 のオプションとして重複アラート抑制を構成する イベントソース。 これは、すべてのWindowsおよびLogWatcherEventSourceの新機能です。

この機能は、でデフォルトでオンになっています LogicMonitorの最新リリース(v.49)。 お客様の既存のEventSourceを上書きすることはありませんが、既存のEventSourceとLogWatcherに対してオンにすることを*強く*お勧めします。 オンにして、そのイベントアラートノイズが減少するのを監視し、インフラストラクチャ内のより重要な実用的な情報に集中できるようにします。