LogicMonitor + Catchpoint: 自律型ITの新時代へ

さらに詳しく
AIOpsと自動化

エージェント型自律型ITOpsによるインシデント解決のステップバイステップ解説

ツールとチーム間のコンテキストが失われると、インシデント対応は機能不全に陥ります。この記事では、エージェント型で自律的なITOpsが、検知から解決まで推論を行い、ノイズを削減して復旧を迅速化する仕組みを説明します。
所要時間
2026 年 2 月 11 日
マーゴ・ポダ
ニュースレター

最新情報のメール配信を登録

最新のブログ、ホワイトペーパー、電子ガイドなどを直接受信ボックスにお届けします。

シェア

クイックダウンロード

エージェント型の自律型 ITOps は、検出から解決までのコンテキストを伝達し、ノイズ、遅延、手動調整を削減することで、インシデント対応を改善します。

  • 現代のインシデント対応が困難になるのは、データが利用できないからではなく、ツール、チーム、引き継ぎ間で推論が断片化されているためです。

  • AI エージェントは、信号の相関関係を検証し、コンテキストを維持し、検出、トリアージ、修復、学習にわたる意思決定を導くことで、この問題に対処します。

  • Edwin AI は、専用のエージェントと管理された自動化を使用してこのモデルを本番環境に適用し、制御を犠牲にすることなくインシデントをシグナルから修正に移行します。

ITインシデントの多くは、データ欠落が原因では発生しません。監視システムは十分すぎるほどのシグナルを生成しています。問題は、これらのシグナルを理解し、どう対処すべきかを判断する作業が、断片的にしか行われていないことです。エンジニアはダッシュボード、ログ、チケット、チャットスレッドの間を行き来し、手作業でコンテキストをつなぎ合わせています。各ステップは、あるシステムから別のシステムへ状態を転送する作業に依存しています。

この断片化により、人間は調整役へと変貌を遂げます。時間は実行にではなく、何が起こったのか、どこで始まったのか、誰が責任を負うのか、そしてどのような行動が正当化されるのかを再構築することに浪費されます。

エージェントAIOps システムは、推論の責任を割り当てることでこのパラダイムを変えます。断片的な情報を提示するのではなく、作業の進行に合わせてコンテキストを伝達します。

LogicMonitorの エドウィン AI は、このアプローチに基づいて構築されています。インシデントライフサイクルのそれぞれの段階(検知、トリアージ、意思決定支援、修復)に特化したAIエージェントを活用します。これらのエージェントはコンテキストを共有し、意図を維持し、ハンドオフを削減することで、インシデントを各段階で再構築することなく、継続性を持って進めることができます。

このブログでは、Edwin AI がエージェント型の自律型 ITOps をインシデント ライフサイクル全体にわたってどのように適用するかについて説明します。

検出: イベントインテリジェンスエージェントが信号とノイズを分離

多くのIT環境では、 検出 個々の指標やイベントに静的な閾値を適用するという手法が主流です。システムの性能低下が発生すると、アラートストーム(同一の根本的な問題によって大量のアラートがトリガーされる現象)が発生します。チームは、インシデント発生後に手動でアラートを抑制したり、ルールを調整したりすることで対応します。そのため、検知は事後対応的になり、重要なシグナルが遅れたり、見落とされたりするケースが増えます。

このモデルは、アラートを推論への入力ではなくエンドポイントとして扱います。

イベントインテリジェンスエージェントの仕組み

イベントインテリジェンス システムは、相関問題として検出にアプローチします。専門のエージェントが、メトリクス、イベント、ログ、トポロジデータ、サードパーティのイベントなど、複数のソースからテレメトリを取り込み、各シグナルを個別に評価するのではなく、時間、インフラストラクチャ、サービス間の関係性を分析します。

これらのエージェント:

  • 重複した信号や冗長な信号を重複排除する
  • 価値の低いイベントや派生的なイベントを抑制する
  • 関連する信号を高レベルのパターンに相関させる

出力は個々のアラートからインシデント候補、つまり共通の原因を示唆するグループ化されたシグナルへと移行します。信頼度スコアは、データが各候補をどの程度強く裏付けているかを示し、チームが静的な閾値だけに頼ることなく、対応の優先順位付けを行うのに役立ちます。

このアプローチにより、アラートの量が削減され、検知までの時間が短縮され、信号の忠実度が向上します。オペレーターが受け取る通知の数は減りますが、それぞれの通知にはより多くのコンテキストが含まれ、対応が必要かどうかがより明確に示されます。

Edwin AIがイベントインテリジェンスを検知時に適用する方法

Edwin AIは、専用のイベントインテリジェンスエージェントを通じてイベントインテリジェンスを実装します。これらのエージェントは継続的にイベントインテリジェンスを取り込み、 可観測性 サードパーティのデータと相関関係と抑制ロジックを適用し、信頼性のあるシグナルを用いてインシデント候補を浮き彫りにします。目標は、既存の監視ツールを置き換えることではなく、生のテレメトリを実用的な検知へと変換する推論レイヤーを追加することです。

インシデントの作成: エージェントが信号を一貫したインシデントに変換

多くのツールでは、インシデントの作成はルーティングステップとして扱われます。アラートが閾値を超えるとチケットが発行され、コンテキストは後から追加されることが想定されます。検出とインシデント管理の間の連携は薄く、インシデント記録にはタイムスタンプと生のアラート参照情報しか含まれていないことがよくあります。

これにより、対応者はどのように行動するかを決定する前に、何が起こったかを再現する必要が生じます。

インシデント作成エージェントの仕組み

エージェントシステムは、インシデントの発生を推論ステップとして扱います。相関エージェントは、検知時に特定されたグループ化されたシグナルを伝達し、単一のインシデントとして形式化します。これにより、イベント間の関係性が維持され、リスト化されることはありません。

サマリーエージェントは、インシデントの初期説明を生成します。これには、明確なタイトル、発生状況の平易な説明、そして範囲と影響度に基づいたカテゴリと優先度の初期評価が含まれます。これは、単なる仮置きではなく、実際に利用可能な出発点を提供することを意図しています。

ITサービス管理システムが導入されている場合、統合エージェントは強化されたインシデントを次のようなツールに同期します。 ServiceNowインシデントはコンテキストとともに配信されるため、チームが事後に手動で入力する必要はありません。

このアプローチでは、インシデントは既に説明済みのシステムに入ります。対応者は、時間的な制約の中で解釈しなければならない空白の記録ではなく、問題に関する共通の理解に基づいて対応を開始します。

Edwin AIが相関信号からインシデントを生成する仕組み

Edwin AIは、専用の相関分析、サマリー分析、ITSMエージェントを活用し、インシデント作成を単一の連続ステップとして実行します。相関関係にあるシグナルは1つのインシデントにグループ化され、AIが生成したタイトルとサマリーで強化され、分類、優先順位付けされ、下流のシステムに同期されます。チケット作成を機械的なトリガーとして扱うのではなく、検知から対応までの引き継ぎ全体を通してコンテキストを維持することに重点を置いています。

トリアージ:AI捜査エージェントが高度な認知作業を担う

インシデントが発生すると、トリアージが最も時間のかかる段階となることがよくあります。対応者はダッシュボードを確認し、ログを検索し、最近の変更を確認し、過去のチケットを精査して、実際に何が問題なのかを把握します。各ツールは部分的な情報しか提供せず、結論は個人の経験と対応能力に依存します。このステップに時間がかかるのは、分析が複雑だからではなく、コンテキストが散在しているからです。

AI調査エージェントの仕組み

調査エージェントは、生のテレメトリではなく、相関関係のあるインシデントに基づいて作業を行います。イベントの関係性、トポロジの依存関係、履歴パターンを分析し、原因と影響に関する実用的な説明を作成します。

これらのエージェント:

  • 相関信号とシステムトポロジに基づいて、考えられる根本原因を特定します。
  • 現在の事件を過去の類似の事件とその結果と比較する
  • 影響を受けるサービス、リソース、またはユーザーをマッピングして影響を評価する

出力は構造化された推論です。対応者は生データではなく、問題領域を絞り込み、どこに注意を集中すべきかを明確にする統合分析を参照します。

自律的AI AIエージェントトリアージは、手作業による再構築から情報に基づいた検証へと移行します。チームは証拠収集に費やす時間を減らし、結論の確認と次のステップの決定に多くの時間を費やすことができます。

Edwin AIによるインシデントの調査とトリアージの方法

Edwin AIは調査に重点を置いた AIエージェント インシデントを統合されたエンティティとして分析します。これらのエージェントは、考えられる根本原因を明らかにし、過去の類似インシデントをハイライト表示し、インシデントビュー内で直接影響のコンテキストを提供します。このシステムは人間の判断に取って代わるものではありませんが、判断に至るために必要な分析負担を軽減します。

AI エージェントについて混乱していますか?

推奨: 意思決定エージェントが最善の次の行動を提案する

トリアージ後、チームは通常、何が問題なのかを理解しますが、どのように対応すればよいのか依然として不確実性に直面します。複数の修正方法が存在する場合があり、ランブックは存在するもののそれを見つけるのが難しい場合もあり、状況を悪化させるリスクがあるため対応が遅れます。意思決定は、共有された状況ではなく、個々の判断に委ねられます。ここで少しでも躊躇すると、根本的な問題が理解されていても、解決までの時間が長引いてしまいます。

意思決定エージェントの仕組み

意思決定エージェントは、生データからではなく、調査結果に基づいて行動します。インシデントの状況、考えられる原因、過去の結果、環境上の制約を評価し、状況に適した修復オプションを提案します。

これらのエージェント:

  • 特定された原因に関連した具体的な改善策を推奨する
  • 必要なときに、関連するランブックや文書化された手順を表示する
  • 過去の成功と既知のインシデントとの類似性に基づいて自信を示す

目標は、デフォルトで決定を自動化することではなく、トレードオフを明示的にし、証拠に基づいたものにすることです。

チームは分析から行動へとより迅速に移行できるようになりました。推奨事項によって曖昧さが軽減され、意思決定サイクルが短縮され、対応者はシフトやチーム全体で一貫した行動をとることができます。

Edwin AIが次のアクションを推奨する方法

Edwin AIは、意思決定重視のエージェントを用いて、調査結果を実用的な推奨事項へと変換します。システムは、インシデントの状況に応じて、推奨される修復手順、関連するランブック、そして信頼性シグナルを提示します。オペレーターは実行を制御できますが、次のステップを一から決定する必要がなくなります。

エージェント AI がインシデント対応を自動化する方法をご覧ください。

解決:エージェント誘導実行による意思決定から行動へ

正しいアクションがわかっていても、実行するとリスクが生じます。 スクリプトは手動で実行されますプレッシャーの下で手順が省略され、修正方法はオペレーターやシフトによってばらつきがあります。自動化は存在しますが、インシデントの状況とは切り離され、別のワークフローで管理されていることが多く、インシデント発生中の使用が制限されます。この切り離しにより、何をすべきかを知ることと、それを安全に実行することの間にギャップが生じます。

執行代理人の働き

実行エージェントは、修復の決定を運用ワークフローに結び付けます。構造化されたインシデントコンテキストを使用してアクションをパラメータ化し、ガードレールを適用し、実行がポリシーと変更管理に準拠していることを保証します。

これらのエージェント:

  • インシデント固有の入力を使用して修復アクションを準備する
  • 信頼度とポリシーに応じて、人間による承認、段階的な実行、または自律的なアクションをサポートします。
  • 実行結果をキャプチャし、インシデント記録にフィードバックします

自動化は、脆弱または不透明なものではなく、条件付きで監査可能なものになります。

修復はより迅速かつ一貫性のあるものになります。アクションは繰り返し実行可能で、統制され、正当化された根拠に直接結び付けられます。チームは運用リスクを増大させることなく、手作業の労力を削減できます。

Edwin AIによる修復の実行方法

Edwin AIは実行エージェントを統合し、 AIの自動化 Red Hat Ansibleなどのプラットフォーム。インシデント コンテキスト 承認済みのプレイブックに直接渡されるため、手作業による翻訳を必要とせず、対象を絞った修復が可能になります。ガバナンス管理、承認、監査ログはそのまま維持されるため、チームは信頼と説明責任を維持しながら、段階的に自動化を強化できます。

LogicMonitor、IBM、Red Hatが自己修復型ITを提供

コンテキストなしで実行される自動化はリスクを増大させます。スクリプトは正しく実行されますが、タイミングが悪かったり、対象システムが間違っていたり、あるいは間違った理由で実行されたりすることがあります。同時に、自動化されていないコンテキストは対応を遅らせ、チームが分析結果を手作業でアクションに反映させざるを得なくなります。

エージェント主導の自動化は、可観測性と実行を単一のフローに統合することで、このギャップを解消します。インシデント推論に基づいて修復を行い、修復結果をシステムにフィードバックします。

ご予約の流れ

Edwin AIエージェントは、構造化されたインシデントコンテキスト(根本原因指標、影響を受けるリソース、推奨アクション)をRed Hat Ansible Automation Platformに直接渡します。これにより、手作業による情報の解釈や再入力が不要になります。

プレイブック実行エージェントは次のことができます。

  • インシデントのコンテキストに一致する既存の Ansible プレイブックを推奨する
  • リアルタイムのインシデントデータを使用してプレイブックを動的にパラメータ化する
  • 定義されたガードレールに応じて、人間の承認を得て、または自律的にアクションを実行します。

実行は意図的かつ追跡可能であり、それを正当化する論理に結びついています。

IBM watsonx Code Assistant と Red Hat Ansible Automation Platform を使用したプレイブック生成

IBM watsonx コード・アシスタント このモデルは、自動化の作成と維持に必要な労力を削減することで拡張されます。根本原因分析によって再現可能な修復パターンが特定された場合、Edwin AIはwatsonxを使用して、その分析に基づいて新しいAnsibleプレイブックを生成することができます。

このアプローチにより、洞察から自動化までの道のりが短縮されます。チームはスクリプトの作成と更新に費やす時間を減らし、インシデント間で安全に再利用できる修正の標準化に多くの時間を費やすことができます。

重要なのは、企業全体の統制が維持されることです。変更管理ワークフロー、ロールベースのアクセス、承認要件、監査ログは引き続き適用されます。エージェントは、確立されたガバナンスの境界を迂回するのではなく、その境界内で動作します。自動化は拡張可能ですが、アカウンタビリティは失われません。

LogicMonitor、IBM、Red Hat の協力のもと、エージェント AIOps が自己修復型 IT を実現する仕組みをご覧ください。

インシデント後の学習: エージェントがコンテキストを保存し、将来の対応を改善する

インシデントが解決すると、注目は別の場所に移ります。チケットはクローズされ、メモは不完全で、インシデント後のレビューは不均一であったり、省略されたりします。たとえ教訓が文書化されていたとしても、それが検知ロジックや対応ワークフローにフィードバックされることはほとんどありません。同じパターンが再び現れ、チームはプレッシャーの中で同じ教訓を再び学びます。これはプロセスの欠陥というよりも、ツールのギャップによるものです。ほとんどのシステムでは、インシデントのクローズをエンドポイントとして扱っています。

学習エージェントの仕組み

学習エージェントは、解決状況を別のシグナル源として扱います。何が起こったか、どのような行動が取られたか、そしてその行動が効果的であったかどうかを記録します。この情報は、単にアーカイブされるだけでなく、再利用できるように構造化されています。

これらのエージェント:

  • 簡潔なインシデントの概要と解決記録を生成する
  • 結果を根本原因、修復手順、信頼レベルにリンクする
  • 結果を相関、推奨、実行モデルにフィードバックする

システムは、手動の文書化に依存せずに組織の知識を保持します。

それぞれのインシデントは、将来の対応を改善します。時間の経過とともに、検知精度は向上し、推奨事項はより明確になり、実行はより安全になります。チームは過去の失敗を再学習する労力を減らし、より価値の高い作業に注力できるようになります。

Edwin AIが解決結果をシステムにフィードバックする方法

Edwin AIは、インシデント後エージェントを用いてインシデントを自動的に要約し、結果を捕捉し、その学習結果をイベントインテリジェンスおよび意思決定エージェントにフィードバックします。目標は、あらゆる問題に対する正式な事後分析ではなく、日々の業務に直接組み込まれた継続的な改善です。

AIエージェントの協調システムとしてのインシデント対応

インシデント対応 各フェーズが個別に機能すると、システムは機能不全に陥ります。検知によってノイズが表面化し、トリアージによって状況が再構築され、意思決定は停滞し、実行は個々の判断に委ねられます。エージェントシステムは、インシデントを断片的なステップではなく、継続的なワークフローとして扱うことで、この問題に対処します。

検知、インシデント作成、トリアージ、推奨、解決、そして学習に至るまで、AIエージェントはコンテキストの維持と作業の調整を担います。人間は引き続き責任を負いますが、各段階でインシデントを再構築する必要はなくなります。これが自律型ITOpsの実践的な基盤です。無制限の自動化ではなく、ハンドオフを削減し、意思決定サイクルを短縮し、時間の経過とともに一貫性を向上させるシステムです。

Edwin AIは、現在このモデルを本番環境に適用しており、 専門エージェント インシデントのライフサイクル全体にわたって、観測可能性、推論、アクションを結び付けます。

Edwin AI がエージェント型の自律型 ITOps を使用して、コンテキストを維持したままインシデントを検出から解決へと移行する方法をご覧ください。

マーゴ・ポダ
マーゴ・ポダ
シニアコンテンツマーケティングマネージャー、AI
LogicMonitorでEdwin AIのコンテンツ戦略を率いるMargo Poda氏。エンタープライズテクノロジーとAIスタートアップの両方での経験を持つ彼女は、複雑なトピックを明確かつ関連性が高く、読む価値のあるものにすることに注力しています。特に、似たようなコンテンツが溢れている分野において、その重要性は増しています。彼女はAIを誇大宣伝するためではなく、AIが実際に何ができるのかを人々に理解してもらうためにここにいます。
免責事項: このブログで述べられている見解は著者の見解であり、LogicMonitor またはその関連会社の見解を必ずしも反映するものではありません。

14日間フルアクセス LogicMonitor プラットフォーム