Dexda ユーザーのプロセス フロー

最終更新日: 22 年 2024 月 XNUMX 日

シナリオ: システムの健全性をチェックし、問題を管理する

以下では、システムの健全性をチェックし、重大な問題を監視、調査、および対処するための推奨ルーチンについて説明します。

  1. 概要を取得する
    • Dexda にログインし、Insights ダッシュボードを開いて概要を確認します。
    • 上部の主要な指標を確認してください。差分メトリックは、前の期間と比較したイベント数の変化を示します。ここで驚くべき変化が見られますか?
    • ServiceNow でインシデントにエスカレーションされた分析情報の数を確認します。

  2. アラートと洞察を確認する
    • インサイトとシングルトン (相関関係のない) アラートを参照して、新しいアラートやインサイトがあるかどうかを確認します。 
    • ダッシュボード ビューをフィルターし、重大度、テナント ID、または特定のリソースなどに基づいて問題を絞り込みます。
    • すぐに対応する必要がある重大な問題があるかどうかを確認しますか?
  3. 重要な問題を調査する
    • インサイトを右クリックして開きます インサイトの詳細、左側のパネルの情報を調べます。 
    • 関連する概要を見てください。 タグ, テナントID、および因果関係のあるリソースと影響を受けるリソース (CI)。問題の原因となったと思われるリソースを特定できますか?
    • クリック 機械学習の結果 タブをクリックして、洞察の相関関係が何に基づいているかを確認します。
  4. 問題のタイムラインを調べる
    • の右側のパネルにあるタイムライン ビューを確認してください。 詳細 ページで見やすくするために変数を解析したりすることができます。
    • アラートの開始時期、頻度、影響を受けたリソースを調査します。 
    • 下部のパネルで、インサイトに関連付けられたアラートとイベントを確認します。
  5. イベントの詳細を分析する
    • ソフトウェア設定ページで、下図のように イベント 詳細ページのタブで確認してください 説明 ServiceNow CMDB から追加のインフラストラクチャとイベント コンテキストを取得します。
  6. 問題の根本原因分析を行う
    • インサイト、アラート、イベントの詳細から得た情報に基づいて、問題の根本原因の分析を続けます。
    • クリック CI LM ポータル内のリソースの状態をさらに調査します。
    • クリック 名前 LM ポータルの問題に関連するデータソースを調査します。
    • クリック ソースID LM ポータルで関連するアラート情報をさらに調査します。
    • さらに詳しいコンテキストを取得し、問題の再発パターンを理解するには、 詳細 デクスダのページ。 
    • LM によって取り込まれたデータの生データ ストリームを調べて、調査している問題の特定の時間範囲にわたるパターンや異常を特定できるかどうかを確認します。
  7. 次のステップを決定する
    • 根本原因を特定したら、収集したデータを使用して、洞察をエスカレーションしてインシデントを作成するなど、次のステップを決定します。
    • 分析情報を右クリックして、ServiceNow インシデントを手動で作成します。 Dexda の設定に応じて、これを自動的に実行することもできます。
  8. 監視を続ける
    • Insight ダッシュボードでシステム メトリクスの変化や新しいアラートを引き続き監視します。
    • たとえば、カスタム ダッシュボード フィルターを設定して、潜在的な問題を示す可能性のある変更を監視できます。
記事上で