課題: レガシー監視により稼働時間、コンプライアンス、顧客の信頼が損なわれる オンライン取引のグローバルリーダーであるIGは、世界で最も規制が厳しく、変化の激しい環境の一つで事業を展開しています。1974年に設立され、ロンドン証券取引所に上場しているIGの取引インフラは、15,000以上の市場へのアクセスを支えています。つまり、わずかな盲点であっても、顧客体験、運用のレジリエンス、そして規制上の地位に影響を及ぼす可能性があるのです。
2020年までに、IGのレガシー監視プラットフォームはますます不安定になっていました。SolarWindsの導入環境は、データベースの破損、手動更新の必要性、信頼性の低いアラート、そして一貫性のないデバイスカバレッジといった問題を抱えていました。チームは監視されていないインフラストラクチャを頻繁に発見し、重要なシステムにリスクをもたらすギャップを生み出していました。
また、データ保持期間が限られているため容量計画が困難で、ログの一元的な可視性がないため、FCA、MAS、EU で新たに制定されたデジタル運用レジリエンス法 (DORA) などの規制当局へのコンプライアンスを証明することが困難でした。
ソリューション: 稼働率を向上させ、運用リスクを軽減する単一の真実の情報源IG は概念実証に成功した後、SaaS 配信、コレクターの自動更新、柔軟性、そして会社の進化するインフラストラクチャに合わせて拡張できる能力を求めて LogicMonitor を選択しました。
LM Envision と LM Logs により、IG は次の成果を得ました。
ネットワーク、ストレージ、仮想化、ロードバランサーにわたる統合された観測可能性
アラートノイズが39%削減され、チームは実際のインシデントに集中できるようになります。
取引インフラを一目で確認できる信頼性の高いダッシュボード
より迅速な対応のためのリアルタイムのPagerDutyによるアラート
12か月以上のデータ保持により、正確な容量予測をサポート
ログの集中管理により、履歴の追跡とコンプライアンスレポートが可能になります。
カバレッジギャップを解消するためのカスタムスクリプトベースの監視
これらの改善により、仮想化計画の改善とツールメンテナンスの削減による推定 2 万ポンドのコスト削減など、測定可能な影響がもたらされました。
「ダッシュボードだけでも、業務は劇的に変わりました。キャパシティの傾向を把握し、問題をより早く発見し、より迅速に対応できるようになりました。」
将来への展望:自動化、より広範な可視性、そしてより強力なコンプライアンス体制 統合オブザーバビリティ基盤の構築により、IGは運用のレジリエンスと自動化の次の段階に向けた基盤を構築しています。インフラストラクチャチームは以下の点に注力しています。
ThousandEyesとNS1のデータを統合し、エンドツーエンドの可視性をさらに向上
LogicMonitorの洞察を活用した障害解決ワークフローの自動化
APM を再評価してインフラストラクチャからフルサービス提供までの可視性を拡大
事後対応型のトラブルシューティングから事前対応型の観測可能性に移行することで、IG は DORA に基づく規制の期待に応え、世界中のトレーダーの稼働率を強化し、長期的なビジネス成長をサポートできるようになります。
シュレーダーズ 英国ロンドンに本社を置く多国籍資産運用会社であるシュローダーは、顧客の資産を7,780億ポンド運用し、6大陸に6,000人以上の従業員を擁しています。このような規模には、顧客、規制当局、そして事業そのものに対する計り知れない責任が伴います。セキュリティエンジニアリング、インフラストラクチャ自動化、オブザーバビリティ担当責任者のマリオ・フォンセカ氏が、フォレンジックサイエンスからIT業界へ転身した経緯、シュローダーがLogicMonitorを活用して可視性とレジリエンス(回復力)を高めた方法、そしてオブザーバビリティが金融サービス全体で重要な機能になりつつある理由について語ります。
要約: シュローダーは自動化と信頼できる唯一の情報源を通じて回復力を強化しました。
スリムなチームが、オペレーションをコードとして扱い、ガードレールを自動化し、信頼性と回復力によって成功を測定することで、500 を超えるサービスを監督しています。
LogicMonitor Envision は、断片化されたツールをエージェントレス コレクター、プログラムによるダッシュボード、拡張可能なデータ ソースに置き換え、地域全体の監視を標準化しました。
監査ログは SIEM に送られ、容量と稼働時間のレポートは FCA や MAS などの規制当局をサポートします。インシデントが減ると顧客の信頼が強化されます。
推奨事項:可観測性を付加価値として活用しましょう。信頼できる唯一の情報源を標準化し、修復を慎重に自動化し、Edwin AIを活用してノイズを排除しましょう。
Q: 大変興味深いキャリアを歩んできましたね。法医学のバックグラウンドをお持ちだというのは本当ですか? マリオ ええ、でももう20年近く前のことですね。年齢を思い出させてくれてありがとう。 [笑い] 私は神経薬理学を学び、その後法医学の修士号を取得しました。ところが、ある友人が「ねえ、お金になるのは法医学じゃなくてITだよ」と言ったんです。その会話が全てを変えました。
方向転換して、しばらく地方自治体で働き、その後旅行をし、金融サービス業界に転身しました。私のルーツはUnixとLinuxにあり、常に自動化に重点を置いていました。変わった名前のツールを片手で操作し、その仕組みを解読するよう求められることがよくありました。振り返ってみると、オブザーバビリティへの転向は自然な流れでした。
Q: シュローダーズに入社して10周年を迎えられましたね。現在、どのような役割を担われていますか? マリオ シュローダーは200年の歴史を持つ金融機関です。私たちはあらゆる業務において顧客中心主義を貫き、模範的なアクティブ運用とアドバイザリーサービスの水準を常に確立しています。
私のチームは500もの異なるサービスを統括しています。サイト信頼性エンジニアリング(SRE)チームのような運営をしており、運用をコードとして扱い、可能な限り自動化し、信頼性と回復力で成功を測るという考え方です。実際には、スピードと安全性のバランスを常に取る必要があります。迅速に行動する必要がありますが、常に適切なガードレールを敷いた上で進めています。
Q: シュローダーが観測可能性プログラムを構築したきっかけは何ですか? マリオ LogicMonitor導入前は、状況が非常に断片化していました。自社インフラの可視性は限られており、運用もサイロ化していました。私たちは6大陸にまたがるグローバル組織であり、地域ごとにツールが異なり、ニューヨーク、ロンドン、シンガポールはそれぞれ独自の監視システムを使用していました。標準化も、信頼できる唯一の情報源もありませんでした。
LogicMonitorのエージェントレス・コレクターベースの可観測性プラットフォームは大きな決め手となりました。私たちはこれをオーバーレイとして使い始め、ベンダーツールと並行して運用することで、すぐにその価値を実感しました。各地域で導入が進み、プラットフォーム統合が進む中で、最終的にLogicMonitorは私たちのグローバル監視ソリューションとなりました。その拡張性も非常に重要でした。標準でカバーされていない機能があれば、独自のデータソースを作成できたのです。
Q: 金融サービスは常に悪質な攻撃者の標的となっています。こうした脅威にどのように対処していますか? マリオ: 運用のレジリエンス(回復力)とセキュリティはミッションクリティカルです。数十億もの資産を管理する上で、リスクは膨大です。私たちは常に攻撃対象領域を削減し、「最小権限」原則(サイバーセキュリティのベストプラクティス)を適用し、監視によって新たな脆弱性が生じないように努めています。 可観測性とは、単に問題が発生した時にそれを確認するだけではありません。インシデントを予防することも重要です。自動化もここで重要な役割を果たします。安全性を維持しながら、問題を自動的に修復するにはどうすればよいでしょうか?常に、スピードと安全性のバランスを取ることが重要です。
Q: シュローダーは厳しい規制を受けています。それが特有の課題を生み出しているのでしょうか? マリオ: 英国では金融行動監視機構(FCA)の監督を受けていますが、シュローダーが事業を展開する他の地域でも、シンガポールのシンガポール通貨庁(MAS)など、規制当局の監督を受けています。 さらに、GDPR(一般データ保護規則)やDORA(デジタル運用レジリエンス法)などのフレームワークもあります。
LogicMonitorは信頼性の高い監査ログを提供し、セキュリティ情報およびイベント管理ツールに取り込みます。また、キャパシティ管理と稼働時間レポートもサポートしています。停止が減れば、規制当局との面倒なやり取りも減ります。
Q: LogicMonitor のどの機能が最も役立ちましたか? マリオ: チームによって答えは異なります。 ダッシュボード プログラムで構築できることは大きなメリットです。私にとって、拡張性は鍵でした。アラートのペイロードをカスタマイズし、多くのプロセスを「コードとして」自動化できます。 当学校区の リソースエクスプローラー 素早いサニティチェックに最適です。また、 LMログ 異常検知や、私たちが興味を持っているのは エドウィン AI 全体像を把握するのに役立つものは何でも非常に貴重です。
Q: 今後、最も重要な業界のトレンドは何だとお考えですか? マリオ AIについては言うまでもなく、これまで本当にうまくやってきました。AIはどこにでもあります。AIとLLMは、あらゆる製品の基本、つまり一部になるでしょう。 課題はデータです。データが多いからといって、必ずしも有用であるとは限りません。良いデータとはどのようなものか、そしてそれをコスト効率よく実現するにはどうすればよいかを考え出す必要があります。もう一つの課題は、考え方です。開発者は監視を後回しにしがちです。可観測性を単なるチェック項目ではなく、付加価値として捉える必要があります。
Q: 個人的に、LogicMonitor はあなたにとってどのような意味がありますか? マリオ 正直に言って、安心です。以前、段階的なアップグレードの展開を提案したところ、LogicMonitorはそれを受け入れてくれました。今ではアップグレードは自然に行われるので、心配する必要がありません。すべてのSaaSベンダーがそうであるとは限りません。 話を聞いてくれる信頼できるパートナーがいることは重要です。そうすれば、問題解決に費やす時間を減らし、仕事でもプライベートでも本当に大切なことに集中できるからです。
Q: 金融サービス業界の同僚に最後にアドバイスはありますか? マリオ 誇大広告に惑わされてはいけませんが、無視するのもいけません。AIと自動化は私たちの業務を変革しますが、その基本は変わりません。それは、回復力、セキュリティ、そして顧客の信頼です。可観測性はこれらすべての中核を成します。適切に活用すれば、問題を解決するだけでなく、問題を未然に防ぐことができます。
LogicMonitor の Inner Circle に参加しましょう!
ストーリーを共有し、仲間とつながり、認められたいと考えているビジョナリーのための顧客擁護コミュニティです。
Edwin AI は、隠れたインフラストラクチャ障害が深刻化する前にそれを検出し、ダウンタイムを削減して稼働時間を保護します。
DNS、ネットワーク、システム全体のテレメトリをリアルタイムで相関させます。
意味のある異常のみを表示して調査時間を短縮します。
推奨事項: Edwin AI を導入すると、隠れたリスクを明らかにし、インシデントをより迅速に解決し、中断のないデジタル パフォーマンスを維持できます。
当学校区の 最近のAWSの障害 インターネットがいかに脆弱であるかを露呈した。Amazonは、数時間にわたる混乱の原因をDNSエラーと特定した。これは、広範囲に及ぶ小さな障害である。
ほとんどの組織では、DNSはバックグラウンドで静かに動作しています。DNSに障害が発生すると、DNSに接続されているすべてのデジタルサービスが停止します。
LogicMonitorの大切なお客様の1社である IGグループ Edwin AI を有効化してから10時間も経たないうちに、同様の事象が発生しました。午前0時30分、シニアネットワークエンジニアのスティーブ・バンフォード氏が30分間のネットワーク事象の調査に呼ばれました。ダッシュボードでは明確な原因は示されませんでした。
エドウィンはそれを突き止めました。DNS、ネットワーク、インフラ層にわたるテレメトリを相関分析した結果、DNSサーバーのCPU使用率が通常の2倍にまで上昇していることが分かりました。これは、プロバイダーの最近の設定変更によるものでした。このシグナルから、スティーブのチームはDNSプロバイダーの破損したセキュリティフィードファイルを発見しました。このファイルが、意図せずして正当なトラフィックをブロックしていたのです。
イベントはすぐに終了し、顧客への影響はまったくありませんでした。
点と点をつなぐAI Edwin AIは、従来の監視ツールが個別に扱う信号を結び付けることで、DNSの異常を正確に特定しました。DNSサーバー全体のCPU使用率の急上昇と下流のトラフィック障害を相関させ、プロバイダーのアップデート中にプッシュされた破損ファイルに障害が起因していることを突き止めました。このパターン認識、つまりシステム間の因果関係をリアルタイムに結び付けることが、Edwin AIの真価を決定づけるのです。 インテリジェンス .
LogicMonitorの AIファーストの可観測性プラットフォーム Edwinは、ネットワーク、インフラストラクチャ、アプリケーション全体にわたる数十億のテレメトリポイントから継続的に学習します。わずかな逸脱を検知し、トポロジと変更データでそれらを強化することで、重要なイベントを少数分離します。
その結果、相関関係の高速化、根本原因の正確な特定、ノイズを追跡する無駄なサイクルの削減が実現します。
Edwin AIにアクセスしてからわずか数時間で、当初ダッシュボードには明確な兆候が見られなかった30分間のネットワークイベントの解決に役立ちました。EdwinはDNSサーバーのCPU使用率が異常に高いことを検知し、根本原因を特定しました。DNSプロバイダーがセキュリティフィードを破損させ、正当なトラフィックをブロックしていたのです。Edwinの洞察によってDNSへの誘導がなければ、手作業によるネットワーク分析に何時間も費やしていたでしょう。Edwinプラットフォームの直感的なナビゲーションとインテリジェントな根本原因分析により、調査時間を2~3時間短縮し、対応を迅速化できました。既に実運用でその真価が実証されています。
スティーブ・バンフォード
IGグループのシニアネットワークエンジニア
大規模な運用予測 DNS障害は 一例 隠れた依存関係が重要なシステムをどのように破壊するかについて。Edwin AIは、混乱を引き起こす前に、こうした依存関係を可視化します。
Edwin AIは継続的な学習を通じて、監視対象のあらゆる環境に対する理解を深めます。イベントパターン、トポロジデータ、最近の構成変更を相関させ、不安定性の兆候を早期に検知します。アラートを発するだけでなく、各シグナルを履歴や依存関係マップと照らし合わせて文脈化し、リスクが蓄積される場所を予測します。
複雑なハイブリッド環境を運用している企業にとって、その先見性は、停止の減少、回復の迅速化、サービスの継続性の強化に直接つながります。
予測的レジリエンスの実践 Edwin AIは、LogicMonitorのミッションである「複雑さを管理可能にし、レジリエンスを予測可能にする」を実現します。これは、AIファーストのハイブリッド・オブザーバビリティ・プラットフォームを支えるインテリジェンスであり、稼働時間、効率性、そして成長という最も重要な成果を推進します。
LogicMonitor の 4 つの中核を基盤とする Edwin AI により、企業は次のことが可能になります。
予測: 隠れたリスクを早期に特定し、障害が発生する前に防止します。
統合: オンプレミス、クラウド、エッジ環境全体のテレメトリを単一の真実のソースに統合します。
実行: リアルタイムの洞察を、利益を守りイノベーションを加速する、データに裏付けられた決定的なアクションに変換します。
再生: パフォーマンスとリソースを最適化して、長期的な効率性と持続可能性を高めます。
スティーブの場合、これらの機能は時間の節約、コストの回避、顧客エクスペリエンスの維持に直接つながりました。これは、業務をリアクティブからプロアクティブに変革する予測的レジリエンスの明確な例です。
一分一秒が大切 障害や同様の混乱を引き起こすイベントは、今後もデジタルインフラの試練となるでしょう。Edwin AIを活用することで、チームは問題を早期に検知し、迅速に解決し、分析されるインシデントごとにシステムを強化するためのインテリジェンスを獲得できます。
予測的なレジリエンスはもはや幻想ではありません。LogicMonitor を利用する組織にとって、測定可能な現実です。
LogicMonitorとEdwin AIが、グローバル企業の一貫性と信頼性のあるデジタルパフォーマンスの実現にどのように貢献しているかをご覧ください。
LogicMonitorの統合型可観測性プラットフォームにより、Oracle Cloud Infrastructure(OCI)環境を完全に可視化できます。組織が重要なワークロードの運用にOCIを利用するようになると、断片化された監視ツールによってパフォーマンスと信頼性に影響を与える盲点が生じる可能性があります。LogicMonitorは、OCI、オンプレミス、マルチクラウド環境全体にわたって自動検出、詳細なテレメトリ、AIを活用したインサイトを提供し、ITチームとCloudOpsチームに、稼働時間の確保、パフォーマンスの最適化、トラブルシューティングの迅速化に必要な透明性を提供します。
コンピューティング、オブジェクトストレージ、ネットワーク、Autonomous Databaseといった重要なOCIサービスを、ネイティブサポートとガイド付きセットアップで監視できます。すぐに使えるダッシュボード、異常検出、インテリジェントアラート機能など、ハイブリッドスタック全体のパフォーマンスを可視化し、すべて単一のプラットフォームから実行できます。LogicMonitorは、運用を簡素化し、ツールの分散化を解消し、Oracle環境をモダナイズします。
このソリューションの概要をダウンロードして、このセクターの変化をすでに推進しているトレンドのいくつかと、パンデミックおよび消費者行動の変化によってもたらされる課題のいくつかについて学びます。
このソリューションの概要では、次のことを検討します。
金融サービスの動向
finserv組織が直面する一般的な課題
最新の監視ソリューションがどのように役立つか
トータルB2B決済ソリューションであるVPayについて VPayは、特許技術を使用して不正行為を防止し、100,000回限りのクレジットカードの発行を通じて毎年数十億ドルの支払いを促進します。 彼らのソリューションは、ヘルスケア、自動車保険、住宅保証など、いくつかの業種にわたるクライアントのために、毎日XNUMXを超えるトランザクションを処理します。
クイックインパクトの可能性 シェーン・カーデンがVPayに上陸したとき、彼は自分が大きな影響を与えることができることを知っていました。 組織は、成長に追いついておらず、手動プロセスが必要なレガシーシステムに依存していました。
LogicMonitorが登場する前は、VPayのIT運用チームは、基本的なCPUモニタリングと144行のチェックリストの毎日の完了をZabbixの組み合わせにほぼ完全に依存していました。 XNUMX人の運用管理者は、レガシーシステムと最新システムの両方で構成される複雑なインフラストラクチャが稼働していることを確認するために、このチェックリストを毎日XNUMX時間かけて確認しました。
ITチームは、ネットワークとサーバーの稼働時間をまったく把握していませんでした。 支払いの処理と配信で停止または問題が発生した場合、顧客の苦情を通じてそれについて知ることになります。 その結果、シェーンのチームは月に30ものP1号を発行していました。 VPayの既存の監視システムの信頼性の低さは持続可能ではありませんでした。
そして、特にVPayがサービスを提供している多くのヘルスケア企業に関しては、リスクは高かった。 HIPPAに準拠するには、給付金と送金のすべての指示を、郵送またはファックスでハードコピーで提供する必要があります。
郵便料金はファックスされたドキュメントの最大14,000倍の費用がかかるため、VPayは、100,000時間に最大XNUMXのファックスを送信する仮想化されたファックスサーバーのクラスターに依存しています。 ファックスが失敗した場合、文書を郵送する必要があり、送料はすぐに加算されます。 毎日XNUMXを超えるFAXを正常に完了することに依存している企業にとって、数万ドルが危機に瀕しています。
LogicMonitorを導入してからわずか1週間で、PXNUMXの問題を半分に減らしました。 その数ヶ月後、それは実質的にゼロにまで下がりました。
シェーン・カーデン
VPay、開発オペレーションマネージャー
LogicMonitorソリューション シェーンと彼のチームの選択は簡単でした。彼は前の仕事でLogicMonitorを導入し、数年間大きな成功を収めました。
VPayによるLogicMonitorの実装は単純で簡単でした。 XNUMX段階の計画は、仮想化されたFAXサーバーのFAX配信とスループットの監視のセットアップから始まりました。 VPayによって処理されるFAXの量と、代替郵便料金の比較的高額な費用を考えると、VPayが成功したHIPPA準拠の通信を追跡できることが非常に重要でした。
この重要なコンポーネントを配置すると、ITチームはVPayによって管理される複雑なトランザクションフロー全体の監視を設定できます。 これは、月に500億ドル近くを処理し、迅速なトランザクションのターンアラウンドに結びついたタイトなSLAに基づいて価値を提供する企業にとって重要です。 VPayによるLogicMonitorの展開のXNUMX番目のステップは、システムを維持し、問題を迅速に解決するために必要な知識を民主化することでした。
LogicMonitorの柔軟なアラートにより、シェーンと彼のチームは、ドキュメントをサポートするためのリンクをアラートメッセージに直接埋め込むことで、アラートをカスタマイズできました。 つまり、アラートを受信した個人は、問題にすぐに気付くだけでなく、その場で問題を解決するための情報も備えているということです。
目に見える影響 LogicMonitorがVPayの内部運用に与える影響はすぐに現れました。 LogicMonitorのおかげで、VPayは最初の30か月で1のP60問題を半分に減らすことができました。 XNUMX日後、ITチームは週にXNUMX回だけフィールドに参加していました。 展開からXNUMXか月後、VPayはシステムの管理に非常に積極的になり、緊急の問題を実質的にゼロに削減しました。
VPayは、かつては異種だったすべてのシステムで統合された監視を利用できるようになりました。 数十万の毎日のトランザクションの流れは、無数のシステムにわたって簡単に監視されます。 LogicMonitorは、XNUMX枚のガラスの下にすべてをまとめるプロセスをシンプルかつ簡単にしました。
さらに、アラートメッセージングへの思慮深いアプローチのおかげで、システムのメンテナンスは、高度なスキルを持つ運用管理者の仕事ではなくなりました。 シェーンは現在、チームメンバーを配置して、ビジネスを推進する重要なプロジェクトを監視し、彼の優秀な人材に再び焦点を合わせることができます。
改善されたパートナーエコシステム おそらく、VPayによるLogicMonitorの実装の最も影響力のある結果は、VPayのシステムの外部であっても、発生した問題についてパートナーに事前に警告する新しい機能です。 「LogicMonitorを使用すると、アラートと通知をパートナー自身に直接ルーティングできます」とシェーン氏は言います。 VPayパートナーはこの情報を高く評価しているため、エンドユーザーへのアプローチを積極的に行うことができます。 VPayとそのパートナーの間で育まれた信頼とコラボレーションは成長を続けており、LogicMonitorはこれらの関係の主要なプレーヤーになっています。
1年後に LogicMonitorを導入してからXNUMX年後の今日、VPayの内部運用はスムーズかつ効率的に実行されています。 戦略的プロジェクトに焦点を当て、全国の消費者のトランザクションを迅速に処理するITチームによって、毎日数万ドルの節約が保証されています。
ああ、その144行のチェックリスト? LogicMonitorの導入からわずかXNUMX週間で廃止されました。
LogicMonitor は、ハイブリッド環境全体でリソースの健全性、パフォーマンス、可用性を監視することで、AWS 移行を順調に進め、ワークロードを最新化するのに役立ちます。LogicMonitor は、AWS 上に完全にプラットフォーム化された SaaS ベースの可観測性ツールです。LogicMonitor は、API 統合を介して Amazon CloudWatch データに接続し、顧客の AWS 環境を監視してメトリクスを収集します。より詳細な OS レベルのメトリクスとログデータについては、LogicMonitor は顧客の AWS 環境でエージェントレス収集テクノロジーを使用します。追加のメトリクスが必要な場合は、顧客が Amazon CloudWatch DataSource をカスタマイズできます。さらに、LogicMonitor は、S70、EBS、Lambda、Bedrock など、3 を超える AWS サービスへの監視範囲と統合を提供します。