皆さん、こんにちは。ようこそ。私はLogicMonitorのシニアプロダクトマネージャー、ステラ・キムです。
私は昨年6月、LogicMonitorに入社しました。ちょうどIT運用向けAIエージェント「Edwin AI」のリリースに合わせてのタイミングでした。これは、製品マーケティングをリードするIT運用向けAIエージェントです。今日はSarah Lunaが同席しています。彼女はまさに私たちのチームの中核を担う頭脳であり、製品の形作りの中核を担っています。そこで本日は、AI運用を担当したエージェントとその選定理由、そしてEdwin AIの概要についてお話しできることを大変嬉しく思っています。その後、Sarahがデモの詳細を説明し、Edwinと、Edwinがチームにもたらす価値についてお話しします。
AIの重要性や、それが私たちの日常生活をいかに急速に変えつつあるかについては、今さら言うまでもないかもしれません。しかし現実には、多くの企業が成功するためにAIや最新ツールを本格的に導入できていないのが現状です。今年初め、アメリカの大手銀行が5日間にわたるサービス停止を経験しました。これは本当に衝撃的なニュースですが、現代のAIや利用可能なツールを導入していないことが、まさに今の私たちの現実なのです。これは、サードパーティベンダーによって引き起こされた混乱の結果であり、信用を大きく失墜させ、多くの顧客が不満を抱き、おそらくその銀行を去り、二度と戻ってこないでしょう。ITチームにとって、これは非常にストレスの多い経験だったに違いありません。では、あなたのチームでこのようなことが起こらないようにするにはどうすればよいでしょうか。
ご存知の通り、従来はそれがAI運用の一種であり、多くのチームにとって約束されたソリューションでした。しかし現実は、AI運用はAIそのものではありません。そうでしょう?多くの作業は手作業で、アラートやイベントのトリアージ、そしてチームによるメンテナンス作業が大量に必要になるのです。
2つ目のポイントは、チケットメモ、ナレッジベースの記事、あるいは戦略会議で行われていることなど、多くの非構造化データソースに、洞察や解決策といったものが大量に存在し、それらはSlack、Teams、Zoomといったツールでは収集・共有されていないということです。そのため、従来のAI運用ツールでは、こうしたデータにアクセスできず、その割合は約70%に上ります。戦略会議について言えば、これが最後のポイントですが、あるお客様から、これまで経験した最大の戦略会議は従業員1,000人規模だったという話を聞きました。
1000件という数字は本当に衝撃的ですが、多くの場合、これが私たちが生きている現実です。なぜなら、こうした情報はすべてバラバラの場所に存在し、それぞれ異なるチームがそれを所有しているからです。そのため、解決するには多くの人々が協力しなければなりません。まさにその通りです。だからこそ、AI運用を再起動する時が来たのです。
従来のAI運用を見てみると、大きく3つの点を変える必要があります。まず、まずはエージェント型AIへと進化し、従来のルールベースのAI(これは非常に時間のかかる)から脱却する必要があります。エージェント型AIを使えば、お客様に代わってアクションを実行し、チームの時間を大幅に節約できます。
次に必要なのは、データの統合です。そうすることで、AIは入力されたデータの品質に応じて進化します。そのため、可観測性、テレメトリ、ログなど、あらゆる場所に散在するあらゆるデータを統合し、AI運用のための統合されたナレッジグラフを作成することが非常に重要です。そして、3番目に重要なのは、成果重視であることです。
ご存知のとおり、従来の AI オペレーションでは、多くの場合、チームによる消火活動が必要になります。
エージェント型AIオペレーションズでは、多くの問題を発生前に発見できるようになります。そのため、午前3時に起きて何が起こっているのかを把握し、トラブルシューティングする必要がなくなります。むしろ、そもそも問題が発生するのを防ぐことができます。そこで私たちは、オブザーバビリティ、AIオペレーションズ、GenAI、そして非構造化データという4つの要素を組み合わせ、エージェント型AIオペレーションズと名付けたシステムを構築しました。
ここで、あなたのエージェントであり、IT オペレーションの AI エージェントであり、24 時間 365 日対応してくれるチームメイトである Edwin AI に会うことができます。Edwin AI のおかげで、あなたは火消しやトラブルシューティング、反復的な単調な作業に追われることなく、元気を取り戻し、家族と過ごし、より戦略的な仕事に集中することができます。
それで、なぜこの製品を Evan AI と名付けたのかご存知の方はいらっしゃいますか?
いいえ。誰かの子供にちなんで名付けたわけでも、偶然に選んだわけでもありません。ハッブル望遠鏡の名の由来となったアメリカの天文学者、エドウィン・ハッブルにちなんで、意図的にこの名前を選びました。
エドウィン・ハッブルが宇宙に対する私たちの理解と限られた見方を変えたのと同じように、エドウィン AI は現代のエンタープライズの可観測性への道を切り開き、顧客が複雑な観測可能なデータを認識し、推論し、それに基づいて行動する方法を変革するでしょう。
それでは、Edwin AI を紹介する短いビデオをご覧いただき、その後 Sarah にバトンタッチして、Edwin AI についてもう少し詳しく説明してもらいます。
いつもの月曜日の朝、突然、組織の重要なシステムが停止してしまいました。何百万台ものデバイスが影響を受け、ITチームは復旧のために根本原因の特定に奔走しています。あらゆる方面から重要なアラートが殺到します。アプリケーションパフォーマンスツール、ネットワークモニター、クラウドサービス、そしてアプリケーションオーナー。それぞれが独自の専門用語を使い、最優先事項を主張しています。
チームは圧倒されており、作戦会議はまだ始まったばかりです。アラートを精査しようとすると、複雑さは増すばかりです。
データベースの問題なのか、ネットワークの問題なのか、それとも単なる誤報なのか?何十人ものスタッフが作戦会議で調査にあたるたびに、ビジネスに大きな損失が生じます。
しかし、もしあなたの傍らに疲れ知らずのインテリジェントAIエージェントがいたらどうでしょう?LogicMonitorのEdwin AIは、次世代のアラートおよびインテリジェンス管理に革命を起こす、最先端のAI搭載エージェントです。Edwin AIは、数秒でノイズを除去し、数百万のデータポイントを分析し、イベントを相関させ、アラートノイズを驚異的な90%も正規化・圧縮します。Edwin AIの優れた点は、クロスドメイン、ハイブリッド監視プラットフォーム、そして主要なITSM、通知、自動化ツールとシームレスに統合することで、ITエコシステム全体を統合的に可視化できる独自の機能です。しかし、Edwin AIの機能はそれだけではありません。生成AIの力を活用し、インシデントサマリー、根本原因分析、そして実用的な推奨事項を提供します。
会話型AIアシスタントにより、チームはEdwin AIと自然なやり取りができ、数秒で回答を得ることができます。Edwin AIの力で、ITサポートを事後対応型からプロアクティブ型へと変革しましょう。従来のソリューションを凌駕する存在を目指してゼロから開発されたEdwin AIは、常に警戒し、常に学習し、指示があればいつでも行動を起こすAIエージェントです。
この動画は、Edwin AIで私たちが何を実現したいのかを非常によく表しています。私たちは、Edwin AIを、トラブルシューティングと自動化を支援するイベントインテリジェンスを一元管理できる、エージェント型AI運用ソリューションにしたいと考えています。
これが実際に意味するのは、ログやメトリック データなど、ロジック モニターから取得した豊富な情報をすべて組み合わせ、それを APM ベンダー、New Relic、Dynatrace などの他のツールからの情報や ITSM からの情報と組み合わせるということです。
BitbucketやGitHubのようなツール、MS Teamsのようなコラボレーションツール、あるいは様々なナレッジベースなどを活用しましょう。インシデント発生時に必要な情報は、オブザーバビリティツールの枠を超えたところにたくさんあることを私たちは理解しています。そして、それらはすべて、インシデントのトラブルシューティングを行う際に重要になります。
GenAI エージェントを活用し、その情報を誰でも理解できる形で公開することで、その情報を ITSM にプッシュし、トリアージ チーム、L1、L2 がより迅速に作業できるようにして、ダウンタイムを減らし、重要なことに集中できるようにします。
Edwin AIのビジョンを見てみると、多くの人が遭遇する一般的なシナリオが浮かび上がってきます。何かが起こり、何かが変化し、問題を解決するには多くの裏付け情報が必要であることがわかります。
ですから、私たちの目標は、例えば「最近、この障害に影響を与えている可能性のある何かが起こったか?」といった質問に事前に答えることです。もしそうであれば、誰かが読み上げ、常に監視することで、この問題を自動的に解決できるプレイブックはありますか?
しかし、これにより、AI エージェントがバックグラウンドで動作し、右側に表示される一般的なユースケースに沿って、インシデントの影響の概要の特定、考えられる原因の特定、修復アクションの提案、定義したプレイブックの実行、再発防止のための事後分析レポートの作成など、チームが他の作業に集中できる時間が大幅に増えます。
では、これはバックグラウンドでどのように動作するのでしょうか?まず、ITオペレーターエージェントがあり、その配下で様々なサブエージェントを呼び出します。インサイトエージェント、メトリクスエージェント、ナレッジベースエージェントなど、様々なツールセットと連携し、様々なソースから情報を取得することに特化したエージェントです。そのため、ナレッジベースでキーワードを検索する必要はもうありません。エージェントが代わりに処理を行い、インシデントに関連付け可能な関連ナレッジベースを見つけてくれるのです。
Edwin AIは3つの異なるユースケースに対応しています。Edwin AIの真髄とも言えるイベントインテリジェンスは、アラートノイズを削減することでビジネスに真に影響を与える単一のイベントに集中できるようにします。また、Gen AIエージェントを活用して生産性を向上させ、自動化によって時間のかかる反復作業をなくします。それでは、イベントインテリジェンスをダブルクリックして、Edwinの動作を確認してみましょう。
ロジック モニター ポータルから、Edwin AI を有効にすると、オレンジ色の四角で示されるように、左側にこの中性子アイコンが表示されます。
クリックするとダッシュボードページに移動します。これはEdwin AIが何をしているかを如実に表しています。約5万5千件のイベントを取り込み、約5千件の実用的なインサイトに絞り込んでいることがわかります。
つまり、チームが心配しなければならないノイズが大幅に減り、以前は5万5千件ものインシデントを処理しなければならなかったのに対し、今では5千件しか処理されません。約5万5千件のインシデントを処理済みであることがわかります。
そして、Edwin AI を使用することで、それを約 5,000 件のインシデントに絞り込むことができました。
つまり、チームは 55,000 件のインシデントへの対応に費やす時間が短縮され、Edwin dot ai が作成する実用的なインシデントだけに集中できるようになります。
これらのいずれかをクリックすると、LMアラートページに似たExploreページに移動します。上部には、何が起こっているかの内訳が表示されます。取り込んだアラートの数、重複排除したアラートの数、そして形成された相関分析の数を確認できます。
ページの下部には、実際のインサイトの詳細が表示されます。これらのうちの1つをクリックすると、チームが実際に取得した詳細情報が表示されます。
上部には、どのような環境で何が影響を受けているかを示す、わかりやすい Gen AI タイトルが表示されます。
さらに、これを拡張した概要では、感染の影響を受けている場所やアプリケーション、そして根本原因が示されています。これは、相関分析で使用したすべての情報を活用して、これらすべてを明らかにしています。
私たちの目標は、Edwinに提供されるあらゆる情報を組み合わせて、EdwinのAIを充実させることです。そのため、Edwin AIを長く運用すればするほど、より環境への適応性が高まるでしょう。
しかし、AIはまだ新しい技術であり、情報を信頼しつつも検証する必要があることは承知しています。そうすることで、詳細情報が失われることはありません。このページをさらに下にスクロールすると、影響を受けたすべてのCIと具体的なアラートメッセージがハイライト表示されていることがわかります。また、右側には、何がいつ発生したか、そしてこの相関関係で使用された具体的なアラートの内訳も表示されます。
つまり、これらの情報は一切失われません。右にスクロールすると、Logic Monitor の情報だけでなく、Splunk と Dynatrace の情報も統合していることがわかります。これは、この洞察を形成するために、サードパーティ製ツールで利用できる関連情報が豊富だからです。
詳細ページでは、発生状況をより詳しくご確認いただけます。ページ上部にインシデントIDが表示されています。これはITSMに直接リンクしており、チケットをご確認いただけます。アラートメッセージに基づいて情報を抽出するタグが表示されるため、チームはより迅速にトリアージを行うことができます。また、影響を受けるCIをハイライト表示することで、影響範囲を把握できます。
そして最も重要なのは相関モデルです。これらのアラートがどのように相関しているのかという質問をよくいただきます。そのため、モデルを可能な限り透明化し、可視性を高めたいと考えています。このページでは、クリックしてモデルを確認できます。このケースでは、これらのアラートはすべて同じSD WANハブに関連しているため、グループ化されています。
モデルをクリックすると、複数のモデルが同時に実行されていることがわかります。これは、お客様の環境で確認されている内容に基づいて、可能な限り最適な相関関係を形成できるようにするためです。
すぐに使えるモデルが多数用意されています。Edwin AI を有効にするとすぐに、事前学習なしで相関関係が形成され始めます。例えば、この場所のモデルに変更を加えたい場合や、まったく新しいモデルを作成したい場合は、「モデルの作成」をクリックすると、このページに移動します。必要に応じて設定できることがおわかりいただけると思います。エンリッチメント情報(基本的にはアラートのプロパティ情報)を選択できます。
必要に応じて情報を除外できます。
たとえば、一般的なユースケースとしては、開発環境や UNT 環境を除外することが挙げられます。
これらは知っておくと便利ですが、相関関係に含めたくない場合もあります。必要に応じて除外できます。変更を加えると、右側に視覚化の更新が表示されるので、グループ化がどのようになるかを確認できます。
デッド Edwin が何を実行し、どのような価値を提供しているかについて、10,000 フィートの視点に戻ると、重複排除が約 90% 完了していることがわかります。これは、同じ問題について同じアラートが何度も表示されることがあるため重要です。
そして、私たちはこれを Edwin 内の単一のアラートにまとめ、ノイズを約 91% 削減しました。
また、何度も発生する同じアラートの重複を排除するだけでなく、問題のコンテキスト内の他のアラートを 1 つの分析情報に取り込むことができるかどうかも重要です。
さらに、モデルに調整を加えたい場合に備えて相関率も表示され、私たちがどれだけ適切に洞察を形成しているかがわかります。
それでは、話をステラに戻して、お客様が行っているさまざまなユースケースについて説明してもらいます。
サラさん、ありがとうございます。Edwin AIの実際の動作をご覧いただいたところで、Edwin AIがチームにもたらす価値について少しお話ししましょう。まず、Edwinの高度な相関モデルにより、アラートやイベントのノイズ量が即座に減少し、ITサポートコストの削減につながります。次に、GenAIを使用すると、まるでチームメイトがいるかのように、多くの質問に答え、トラブルシューティングや問題の診断を支援し、より迅速な解決へと導いてくれます。これにより、チームの生産性も向上します。
3つ目は、先ほどもお話ししたように、多くのチームが数千人の従業員を抱える非常に大規模な作戦会議(ウォールーム)を抱えています。私たちは、そうした事態を回避できるよう支援することで、大幅なコスト削減にもつながります。4つ目は、こうしたシステム停止を回避できれば、お客様のビジネスと顧客満足度の維持に貢献できるということです。そして最後に、Edwin dot aiをすぐに使い始められるため、ライセンス費用やトレーニング費用も削減でき、短期間で価値を実感していただけます。
初期のお客様の多くは、導入直後から非常に素晴らしい成果を実感されています。典型的な統計データとしては、箱から出してすぐにアラートノイズが約80%削減されるという結果が出ています。これは非常に大きな削減効果です。また、先ほどGenAI機能について少しお話ししましたが、迅速な解決、迅速な診断などにより、MTTRが約60%短縮されます。
また、ITSMインシデントも約30%削減される見込みで、これは非常に大きな改善です。そして最後に、運用効率も約20%向上します。先ほどの製品基調講演で、Karthikが素晴らしい成果を上げている多くのお客様についてお話ししましたが、私は特に素晴らしい成果を上げている2社のお客様に焦点を当てたいと思います。
では、最初の企業はシンジェンタです。
彼らはヨーロッパに拠点を置く、農業科学技術の世界的リーダーです。クリス・マニング氏がここで述べているように、Edwinは彼らにとって画期的なソリューションであり、導入から1時間以内にその価値を実感できたという点を強調したいと思います。
先ほど少しお話ししましたが、多くのお客様が価値実現までの時間が非常に短いことを実感しており、すぐに素晴らしい成果を得られるようになります。そして、私たちがモデルとお客様の環境を継続的に改良・調整していくことで、この成果はさらに向上していきます。お客様が目にした素晴らしい成果としては、MTTRが約30%短縮され、手作業も約20%削減されました。これは本当に素晴らしい結果です。
ここで注目したい 2 番目の顧客は Nexon です。
彼らはオーストラリアを代表する MSP です。
ジョシュがここで述べているように、GenAI機能によって非常に素晴らしい成果が得られ、アラートノイズが91%以上、ITSMインシデントが67%削減されました。これは導入直後から非常に素晴らしい成果です。つまり、Edwin dot AIは多くのMSPだけでなく、他のエンタープライズ顧客にも大きな効果をもたらしているということです。
弊社の機能と、それがお客様のチームにどのような価値をもたらすかをまとめると、まず、豊富なコンテキスト情報を備えた非常にリッチなハイブリッドデータセットを保有していることです。先ほどもお話ししたように、AIの性能は、入力されたデータに左右されます。ハイブリッドな可観測性データやテレメトリログなど、分散した場所に分散している可能性のある多くのデータを統合することで、優れたコンテキストを提供し、チームが問題をより迅速に特定し、解決できるようにします。
2つ目は、AI運用プラットフォーム向けにネイティブに構築され、専用に設計されていることです。ご存知のとおり、ChatJPTラッパーは数多く存在します。一般的なモデルではなく、お客様の特定の環境に合わせてカスタマイズされた製品を構築することが非常に重要です。そうすることで、一般的なチャットGPTやLLMモデルでは理解できないような、業界特有の重要な用語を理解できるようになります。
そして3つ目は、AIは多くの人にとってブラックボックスになりがちです。そのため、当社の製品はオープンで設定可能なアプローチを採用しています。そのため、何が起こったのか、AIがなぜその決定を下したのかを正確に把握でき、それに基づいて設定変更を行うことができます。そして4つ目は、先ほども何度もお話ししましたが、非常に迅速な価値実現です。Alwin AIなら、他の製品のように数か月かかることなく、数週間で稼働させることができます。そして、先ほどChris Manning氏の発言にあったように、稼働開始からわずか1時間以内に価値を実感できます。非常に素晴らしい結果が得られます。最後に、データについて少しお話します。
最後に、当社にはすぐに活用できる非常に広範なサードパーティ製およびクロスドメイン コネクタがあります。
これでセッションは終了です。Edwin AIブレイクアウトセッションにご参加いただき、誠にありがとうございました。楽しんでいただけたでしょうか?ぜひまたお話させていただければ幸いです。さらに詳しく知りたい方は、ロジックモニターチームまでお問い合わせください。喜んでお手伝いさせていただきます。ありがとうございました。
.
デボンさん、この最新のデータセンターのグラフで、イェール大学にとって関連性が高いと思われる分野について、改めて説明していただけますか? また、右側のテレメトリについては、ロジックモニターからどのような種類のデータを取得されているのでしょうか?
はい、もちろんです。そのため、現代のデータセンターでは、メトリクスの収集にオンプレミスのインフラストラクチャに大きく依存しています。
当社のコア インフラストラクチャの多くはオンサイトで物理デバイスを使用しているため、そのデータのメトリックを収集するには、SNMP MIB の両方に大きく依存しています。
当社もクラウド インフラストラクチャに大きく依存しており、少なくともクラウド部門はそうしています。
先ほど言ったように、ロジック モニター内に AWS 環境と Azure 環境の両方があります。
そして、彼らは、トランジットゲートウェイだけでなく、仮想パロアルトも監視していると思います。
テレメトリ側に関しては、イベント部分を使用して、Cisco DNA Center ソリューションで発生するすべてのイベントを監視しています。
トポロジにも大きく依存しています。ネットワークのトポロジをある程度簡略化して把握している環境もいくつかあります。また、先ほども申し上げたように、構成情報にも大きく依存しています。コアインフラストラクチャの構成を24時間ごとに収集することで、状況を把握し、トラブルシューティングに役立つ変更が加えられていないかを確認できます。
素晴らしいですね。なるほど。先ほどおっしゃったメトリクスと構成に加えてですね。つまり、このテレメトリスペクトルのほぼすべてに対応しているということですね。素晴らしいですね。それでは、Devinさん、お時間をいただきありがとうございました。本日はご参加いただき、Yale での Logic Monitor の活用方法、そしてハイブリッド環境のより包括的な分析とトラブルシューティングの迅速化において、チームにどのようなメリットがもたらされたかについてお話いただき、本当に感謝しています。
では、この図をもう少し詳しく見ていきましょう。左側、真ん中の機能、そして右側のソリューションについて詳しく説明したいと思います。まず左側から見ていきましょう。これは、現代の企業が複雑なハイブリッド環境全体で備えるべき機能です。Devonのケースでは、オンプレミスとクラウドを併用するだけのシンプルな構成でしたが、Logic Monitorでアプリケーションを監視しているお客様もいらっしゃいます。IoTも検討しており、AIの導入も開始し、LLM(論理リソース管理)の監視も行っています。つまり、私たちは現代のデータセンターを、ElementVisionプラットフォームで可視化したいと考えているのです。
この最新のデータセンター環境全体で収集しているテレメトリの種類についてですが、メトリクス、ログ、イベントに注目しています。アプリケーションのトレースを取得し、自動化されたトポロジマッピングで、監視対象のインフラストラクチャとアプリケーションをマッピングしています。さらに、Devinが述べたように、構成データについては、ネットワークデバイスやクラウドベースの構成駆動型インフラストラクチャから定期的に構成データを取得しています。
そして、真ん中のほうに移ると、Element Vision プラットフォームとそれを構成するさまざまな機能があり、これによって顧客はトラブルシューティングを迅速化し、環境に対するプロアクティブな洞察を得て、最終的にはダウンタイムを防ぐことができます。
サービスインサイトは、サービスレベルのビューを可能にします。リソースエクスプローラー、カスタマイズ可能なダッシュボード、そしてレポートは、監視対象データをお客様にとって有意義なビューにするために役立ちます。さらに、動的なしきい値設定を中心としたAIとインテリジェンス機能スイートも備えており、異常検出を用いてインテリジェントなアラート、予測、予測を行い、インフラストラクチャの規模や容量ニーズの予測を支援します。さらに、Edwin AIによる根本原因分析とイベントインテリジェンスは、プラットフォーム内で発生するアラートノイズを大幅に削減し、インシデント対応を効率化します。
そして、右側には、これらの機能で提供しているソリューションがあります。Edwin 側の AI エージェントから、ハイブリッド エンタープライズ環境に提供している完全なインフラストラクチャの可観測性、クラウド監視、クラウド コストの最適化 (後ほど説明します)、さらに持続可能性監視やアプリケーションの可視性など、あらゆるものが含まれています。
これを少し異なる文脈で示すと、この図は非常に似ています。左側には、オンプレミスかパブリッククラウドかを問わず、お客様の環境があります。中央にはロジックモニタープラットフォームがあり、お客様はダッシュボードやレポートを取得し、環境から自動的に取得される豊富なモニターデータや、構築されている自動トポロジビューを理解できます。
そして右側には、既存のITエコシステムへのより適切な統合について記載します。つまり、アラートが適切な担当者に、適切なタイミングで、適切な場所に、チームが使い慣れたツールで確実に届くようにしたいのです。また、自動化のために何かツールをご利用の場合は、それらとも連携できるようにしたいと考えています。
最後に、Edwin AIの概要を簡単にご説明します。Edwin AIはLogic Monitorを基盤として、プラットフォームのインテリジェンスを次のレベルに引き上げ、アラートノイズを削減します。左側では、まずオブザーバビリティスタックから始めます。これはLogic Monitorのみの場合もあれば、セキュリティ関連やAPM関連などと組み合わせた場合もあります。そして、包括的なオブザーバビリティ製品スイートからイベントをEdwin AIプラットフォームに取り込みます。
そこから、下部に沿って、統合されたナレッジ グラフを使用して、ServiceNow CMDB などのソースからのデータを強化していることを確認しています。このデータを使用して、可観測性スタック全体で取り込んだイベント間で提供している相関関係を強化できます。
そして右側では、これらの相関分析情報が、ServiceNow やその他の適切なプラットフォームに出力されていることを確認します。
では、ロジックモニタープラットフォームのデモを見てみましょう。
これは、ハイブリッド企業が規模拡大と成長を目指し、営業部門、財務部門、運用部門といった特定の部門に注力したい場合に活用できるダッシュボードです。上部には、各部門のステータスと各部門が依存するインフラストラクチャを示す包括的なビューが表示されています。下にスクロールしていくと、Logic Monitor が構築した自動トポロジビューが表示されます。これらはここにマッピングされており、右側にはデバイスの物理的な位置も表示されています。
このダッシュボードを進んでいくと、エンドユーザーエクスペリエンスに関する洞察が得られます。例えば、世界中からアクセスしているエンドユーザーの給与計算アプリケーションの利用時間はどれくらいでしょうか?これらのグラフは、合成トランザクションとウェブサイト監視によって生成されています。さらに下に進むと、各部門のサービスベースのビューが表示されます。営業部門を見てみると、CRMへのアクセスが非常に重要であることがわかります。そのため、ここに表示されている統計情報や健全性データを使って、CRMへのアクセスを監視しています。財務部門を見ていくと、給与計算へのアクセスは非常に重要です。ネットワーク共有も同様に重要です。そこで、Azureベースの環境の監視も行われ、すべてがこの統合ダッシュボードにまとめられています。
運用面では、お客様をあるVPNから別のVPNに移行しています。その際には、ファイアウォールセッションを常に監視する必要があります。そのため、Logic Monitorsの異常検出機能を使用して、何か異常なアクティビティがないか確認します。Logic Monitorsによって異常なアクティビティとしてハイライト表示された赤いスパイクがいくつかあるのがわかります。VPN移行が正常に進んでいることを確認するために、これらのアクティビティを調査する必要があります。
スクロールダウンしていくと、この組織を支えるAzure環境について、パフォーマンスデータから正常性データ、そしてサービス制限まで、より詳細な情報が得られることがわかります。Azureがサービスごと、リージョンごとに設定しているデフォルトの制限にはどのようなものがあるか、注意が必要です。アラートも用意されています。これらのアラートについて詳しく説明する前に、少し視点を変えて、リソースエクスプローラーを使ってこのエンタープライズ環境を見てみましょう。
リソースエクスプローラーを使用して、Logic Monitorが環境から取り込む豊富なメタデータを活用します。今回は、インフラストラクチャが部門別にタグ付けされているため、タグを使用します。ここでは、財務部門と営業部門の詳細な内訳を確認できます。アラートステータスがオーバーレイ表示されているので、財務チームが抱えている問題の1つを、Tomcatサーバーのレポートと一緒に確認してみましょう。メタデータとアラートの詳細が表示されています。アラートの詳細をクリックして、Logic Monitorがトラブルシューティングにどのように役立つかを見てみましょう。
Tomcatサーバーの状態が良好から悪化していることがわかります。以前は200エラーを返していたのに、今は400エラーに近いエラーコードを返しています。Logic Monitorはこれを赤くハイライト表示し、異常としてフラグ付けしています。これは調査が必要な兆候であり、動的なしきい値に基づいてアラートが発せられています。下にスクロールすると、応答時間などの追加の指標が表示されます。これはそれほど異常ではないように見えますが、ログも表示されており、特にログ内の異常がハイライト表示されています。アラートが発生した直後に、いくつかの異常がフラグ付けされていたことがわかります。
では、異常なログを詳しく調べてみましょう。特定のパスが存在しないことがわかります。「web」は「b」が2つ使われているようです。
これはタイプミスのようですので、調査が必要かもしれません。つまり、これがTomcatサーバーがダウンして応答しなくなった原因である可能性があり、年末報告を修正する解決策にもなりそうです。
これは非常にシンプルなシナリオで、メトリクスとログを使うだけで、Logic Monitorが適切な方法で答えを導き出してくれたため、すぐに答えが見つかりました。しかし、大量のアラートが発生し、どのアラートから分析を始めれば良いのかさえ分からないようなアラートストームが発生した場合はどうなるでしょうか?まさにここでEdwin AIの出番です。Edwin AIは、オブザーバビリティスタック全体からイベントとアラートを取り込み、相関分析を行います。このアカウントでは、実際に3,000件以上のアラートを処理し、それらを相関分析して41件のインサイトにまとめ、ServiceNowに送信したことがわかります。
シングルトンまたは相関関係のないアラートがないことがわかりますが、もしあったとしても、システムは時間の経過とともに継続的に学習しており、その数はかなり低いままになるはずです。
それでは、これらのインサイトの1つとアラートの数を見てみましょう。ここでは13件のアラートが表示されています。
まず最初に目につくのは、タイムラインビューと詳細情報です。これらの詳細情報には、Edwin AIによって自動生成されたタグが含まれています。
ServiceNow CMDBから影響を受けるCIを取得しています。また、このCMDBを使用してメタデータを取得し、相関分析に使用しています。
タイムライン ビューでは、特定の Meraki の問題が環境全体にどのように影響を及ぼし、実際に配送および支払いサービスに影響を与えたかが表示されます。
下の方では、Edwin AIがLogic Monitor、Splunk、そしてこの場合はDynatraceからのアラートを相関させているのが分かります。つまり、3つの異なるオブザーバビリティツールからのアラートが統合されているということです。
AI分析により、人間が読みやすい非常に分かりやすいビューが提供され、Merakiセキュリティアプライアンスのトンネル問題が決済サービスと配送サービスに支障をきたし、データベース同期のタイムアウトなどを引き起こしていることが分かります。さらに、トラブルシューティングや問題解決に必要な修正点の特定に役立つ根本原因情報も提供されます。
では、これらのアラートの1つ、理想的にはロジックモニターにあった発生元のアラートを見てみましょう。ここにあるソースIDリンクをクリックします。すると、ロジックモニターに戻り、先ほどTomcatサーバーで確認したアラートの詳細ページが表示されます。ここでも、メトリックがプロットされていますが、特に注目すべき点はありません。しかし、ログの異常もすぐに取得でき、構成テンプレートが変更されたことが分かります。おそらく、これがMerakiアプライアンスで最初に発生した問題の原因であり、配送および支払いサービスに混乱を招いたのでしょう。これは、Edwin AIが適切なアラートを絞り込み、ロジックモニターが持つ豊富なデータを活用してトラブルシューティングを迅速化する方法を示すもう1つの例です。
次に、プラットフォームのもう一つの側面、昨年リリースした新しいコスト最適化製品についてご紹介します。この製品には大きく分けて2つの側面があります。1つ目は課金機能で、複数のクラウドの課金情報を単一のダッシュボードに表示します。リソースタイプ、リージョン、そして下の表にある詳細な内訳など、様々なディメンションで内訳を確認できます。
これらのデータは、細かく分析したり、ドリルダウンしたりすることができます。また、環境のメタデータに基づいて内訳を絞り込むこともできます。例えば、特定の事業部門だけを見たい場合、IT運用チームと製品開発チームに焦点を絞り、それぞれの支出を具体的に確認することができます。
週ごとの傾向を見れば、支出がどのように変化しているかが分かりますよね?増えているのか?減っているのか?月末にはどうなるのか?予算内に収めるために何か変更する必要があるのか?
また、プロバイダーなどのビューでは、使用している複数のクラウド プロバイダー (この場合は AWS と Azure) 全体での支出状況がわかります。
右側にタブが追加され、アカウントとリージョンのビューが表示されます。ここでも、クラウドインフラストラクチャが稼働しているリージョンや、クラウドプロバイダー間で使用しているリソースの種類など、様々な要素ごとに内訳が表示されます。これにより、非常に詳細なビューを取得し、支出状況を細かく分析できます。
「推奨事項」タブでは、クラウド支出を実際に最適化するための具体的な推奨事項が表示されます。ここでは、Logic Monitor が保有するパフォーマンスデータと支出データを組み合わせて、コスト削減の機会を特定しています。
クリーンアップできるアイドル状態の ec 2 インスタンスがいくつかあるようです。また、サイズを変更できる ec 2 インスタンスもあるかもしれません。
ここには、アクションを実行するための AWS コンソールへの直接リンク、このアクションを提供している理由を説明するデータ、このリストが長期にわたって関連性を保つように実行できるさまざまなライフサイクルアクションなどの情報があります。
これは、ロジック モニターがパフォーマンスと可用性の監視だけにとどまらず、クラウド支出などのビジネス メトリックの最適化を通じて価値を提供できることを示した例です。
このプラットフォーム概要がお役に立てば幸いです。特に、先ほどDevinがYale社がロジックモニタープラットフォームをどのように活用してきたかについてお話しいただいたことと合わせて、より深くご理解いただけたかと思います。そして、皆様がElement Visionについてより深くご理解いただけたと感じていただければ幸いです。