ネットワーク トラフィック フロー監視操作のトラブルシューティング (新しい UI)

最終更新日: 27 年 2023 月 XNUMX 日

LogicMonitor には、ネットワーク トラフィック フロー データを監視するときに発生する問題を特定して解決するのに役立つトラブルシューティング ツールがいくつか用意されています。

NetFlowヘルスウィジェット

ネットワーク トラフィック フロー監視操作の状態を一目で確認できるように、LogicMonitor は NetFlow Health ウィジェットを提供します。 から入手可能 トラフィック リソース レベルのタブで、このウィジェットは重要業績評価指標 (KPI) を最前面に表示し、迅速なトラブルシューティングと問題解決を実現します。 NetFlow ヘルス ウィジェットは展開または折りたたむことができ、ステートフルです。 ウィジェットのデータは XNUMX 分ごとに更新されます。


注:デバイスのネットワーク トラフィック フロー データを監視するために割り当てられたコレクタは、NetFlow ヘルス ウィジェットが表示されるようにコレクタ バージョン 30.100 以降である必要があります。

次の表では、NetFlow ヘルス ウィジェットに含まれる各カードについて説明します。

カード 説明 重大度レベル
全体的な NetFlow ヘルス
他のカードによって監視されているKPIのいずれかから発生する問題の重大度の最高レベルを反映します。
  • OK
  • 警告
  • エラー
  • クリティカル
テンプレートの健全性
NetFlow バージョン 9 テンプレートを受信して​​からの経過時間に従って、テンプレートの健全性を報告します。 通常、リソースは XNUMX 分ごとにテンプレートを送信します。
  • OK(<600秒)
  • 警告(600秒以上)
  • エラー(600秒以上)
  • クリティカル(900秒以上)
前回の受信フロー時間
最新のフロー データグラムがリソースから受信された時刻 (および経過時間) を表示します。 このカードは、関連付けられた重大度レベルを明示的に表示しませんが、それに関連付けられたしきい値は、全体的なNetFlowヘルスカードによって表示される重大度レベルに影響します。
  • OK (<600 秒) 警告 (≥600 秒) エラー (≥600 秒) 重大 (≥900 秒)
LogicMonitor を構成して、このデータについて警告することができます。 Netflow_デバイス_ハートビート 情報源。 見る NetFlowデータソース.
時刻同期ステータス
リソースの時計とコレクタ ホストの時計の時刻同期ステータスの状態を解釈します。
  • OK(≤1分の時間同期差)
  • クリティカル(> 1分の時間同期差)
破棄されたフロー
過去 XNUMX 時間に NetFlow Collector によって破棄されたフローの数と割合を表示します。 このカードは、関連付けられた重大度レベルを明示的に表示しませんが、それに関連付けられたしきい値は、全体的なNetFlowヘルスカードによって表示される重大度レベルに影響します。

  • OK (<10%) 警告 (≥10%) エラー (≥10%) 重大 (≥25%)
LogicMonitor を構成して、このデータについて警告することができます。 LogicMonitor_Collector_NetflowMetrics 情報源。 見る NetFlowデータソース.
XNUMX 秒あたりの平均フロー
過去XNUMX時間に受信されたXNUMX秒あたりの平均フロー数をグラフ化します。 このカードはデータのみを表示します。 重大度を割り当てることも、そのメトリックが全体的な NetFlow ヘルス カード ステータスに寄与することもありません。 ただし、LogicMonitor を構成して、このデータについて警告することができます。 LogicMonitor_Collector_NetflowMetrics 情報源。 見る NetFlowデータソース.

NetFlowデータソース

LogicMonitorには、NetFlowの状態を監視するXNUMXつの組み込みデータソースがあります。 これらのデータソースは、トラブルシューティングに役立つ情報を追跡し、監視するメトリックの潜在的な問題を警告するように構成できます。

注: 次の DataSource は、NetFlow ヘルス ウィジェットによって表示されるメトリックに寄与します。 ただし、DataSource によってデータが収集される間隔は、ウィジェット UI が更新される間隔 (XNUMX 分ごと) とは異なるため、ウィジェットの UI に表示されるデータを表示する場合と比較して、DataSource レベルでデータを表示する場合に時間の不一致に気付く場合があります。 )。

Netflow_Device_Heartbeatデータソース

  NetFlow_デバイス_ハートビート DataSource は、コレクタがリソースから最新のフロー データグラムを受信して​​からの経過時間を計算します。 この DataSource は、ネットワーク トラフィック フローの監視が ネットワークフロー分析を有効にする チェックボックスをオンにします。

アイドル間隔の条件はサイト固有であるため、この DataSource にはデフォルトのアラートしきい値が割り当てられていません。 経過時間が指定されたしきい値を超えたときにアラートを受け取りたい場合は、手動でアラートのしきい値を idleInterval データポイントに割り当てることができます。 見る データポイントの静的しきい値の調整.

LogicMonitor_Collector_NetflowMetricsデータソース

  LogicMonitor_Collector_NetflowMetrics DataSourceは、XNUMX秒あたりの平均フロー、処理時間、パケット処理の成功または失敗など、コレクターのNetFlow処理メトリックを監視します。 このデータソースは、さまざまなコレクタメトリックを監視するように設計された一連のデータソースの一部です。

このデータソースは、コレクターデバイスに自動的に関連付けられます。 と同じように NetFlow_デバイス_ハートビート データソース。このデータソースによって監視されている状態についてアラートを受け取りたい場合は、データポイントのしきい値を手動で設定する必要があります。

デバッグコマンド

  コレクターデバッグ機能 CollectorでNetFlowデバッグコマンドをリモートで実行するために使用できます。

コマンド/機能 説明
!netflow func = listDevices 現在 NetFlow が有効なリソース (ID、名前、IP アドレス、インターフェース) を一覧表示します。
!netflow func = query select * from raw 生のフローデータのテーブルを照会します。
!netflow func = diagnose [タイムゾーン] リソース上のクロックとコレクタ ホスト上のクロック間のクロック同期を確認します。
!netflow func = dump テンプレートの不一致、必須フィールドの欠落などの例外メッセージでフローの追跡が失敗しました。
!netflow func = debug log no | all | error NetFlowアクティビティのログレベルを更新します。
!netflow func = getWaitAggregateTables 現在 5 分間の集計を待機しているテーブルを一覧表示します。
!netflow func = getActiveTables

フローが挿入されている現在アクティブなテーブルを一覧表示します。
!netflow func = getDatasize HSQLDBファイルのサイズを返します。
!netflow func = getFlowMetrics 合計rawフロー、プロトコルごとの合計フロー、および合計集約フローの数を返します。

一般的な問題

次のトラブルシューティング手順を使用して、発生する可能性がある一般的なネットワーク トラフィック フロー監視の問題を解決してください。

問題:交通データがありません

  • リソースのネットワーク トラフィック フローが有効になっていることを確認します。
  • リソースが正しいコレクターに送信するように構成されていること、およびポートがファイアウォールによってブロックされていないことを確認してください。
  • Collector とリソースの間の時間が同期されていることを確認します。
  • パケット キャプチャを実行して、cflow パケットが Collector ホストのインターフェイスに到達しているかどうかを確認します。

問題:特定のインターフェースでトラフィックが欠落している

  • LogicMonitor で、インターフェースが「snmp64_if」で始まる DataSource 名または SNMP_ネットワーク_インターフェース.
  • コレクターデバッグ機能走る !netflow func=listDevices インターフェイス インデックスがリストされていることを確認します。
  • フィルタをに設定して、コレクタホストでパケットキャプチャを実行します。 cflow.inputint == 1 (ここで、1 は問題のインターフェイスのインデックスです) コレクターにフローが送信されているかどうかを確認します。
  • フィルタをに設定して、コレクタホストでパケットキャプチャを実行します。 cflow.direction == 1; パケットが見られない場合は、デバイスをチェックして、出力を提供するように構成されていることを確認してください。

問題:NBAR2データがありません

  • リソース構成に欠落がないことを確認します アプリケーションを収集する フロー レコードからの設定(シスコ)。
  • リソース構成に欠落がないことを確認します オプションアプリケーションテーブル フロー エクスポータ (Cisco) からの設定。

問題:NBAR2データにカテゴリデータがありません

  • リソース構成に欠落がないことを確認します オプションアプリケーション属性 フロー エクスポータ(Cisco)から。

問題:一貫性のないUDPポート構成

  • リソースで指定された UDP ポートがコレクタで指定された UDP ポートと一致することを確認します ( ネットフローポート 構成)。

問題:ブロックされた/ファイアウォールで保護されたUDPポート

  • 多くの UDP ポートは、Windows ファイアウォールまたは Linux iptables によって自動的にブロックされます。 Collector ホストで、インバウンド トラフィックの構成済み UDP ポートの例外を作成して、ネットワーク トラフィック フロー データが LogicMonitor アプリケーションに到達できるようにします。 リソースとコレクターの間にファイアウォールまたは ACL がある場合は、構成済みの UDP ポートのトラフィックが許可されていることを確認します。

問題:クロックの非同期

  • ネットワーク リソースのクロックがコレクタのクロックと同期していることが重要です。 リソース クロックがコレクタ クロックより進んでいるか遅れている場合、フローは破棄される可能性があります。 の !netflow func=diagnose [timezone] debug コマンドを使用して、クロックの同期を確認できます。 さらに、LogicMonitor は、最新のフロー更新のコレクタ タイムスタンプ (LastData ReceiveTime) と、エクスポートされたフローのリソース タイムスタンプ (Timestamp In Last RawData) を表示します。 これらの値が XNUMX 分以上ずれている場合は、クロックの同期に問題がある可能性があります。 NTP を使用して、クロックを標準の一貫した時間とタイムゾーンに自動的に同期させることを強くお勧めします。

問題: 一貫性のないフロー データまたは位置合わせされていないデータ (Cisco ASA)

  • Cisco ASA リソースは、NetFlow バージョン 9 のみをサポートします。ASA プラットフォームでの NetFlow エクスポートはイベント駆動型です (Cisco ルーティング プラットフォームとは異なり、Cisco ASA は増分更新を送信しません)。 NSEL レコードは、フローの作成、ティアダウン、または ACL 拒否イベント中にのみ送信されます。 Cisco ASA リソースは、ToS ビットまたは TCP フラグを設定しません。
記事上で