LogicMonitor + Catchpoint: 自律型ITの新時代へ

さらに詳しく

スピーカー

チャーリー・ウルフ

Charlie WolfeはLogicMonitorのシニアプロダクトマネージャーであり、マルチクラウド環境におけるコスト最適化とクラウドオブザーバビリティソリューションを専門としています。FinOps認定プラクティショナー兼エンジニアとして、クラウド支出を数百万ドル削減したコスト最適化戦略を実践しています。

Expediaグループでは、チャーリーは20のブランド間でデータを統合しながら、クラウドとSaaSのコストを22%削減しました。彼の製品開発への取り組みにより、FinOpsの原則に基づき、数千ものアプリケーションのコストとパフォーマンスが向上しました。

FinOps コミュニティで著名な Charlie は、FinOpsX (2023 年) を含む複数のイベントで講演を行っており、SaaS および AI コストへの FinOps の適用に関する議論の先駆者となり、クラウド コスト予測 (2024 年) に関するチョーク トークを主導しました。

テクノロジー業界に入る前、チャーリーは海軍情報部に20年間勤務し、直近では海軍特殊戦グループXNUMXに所属していました。ノースウェスタン大学ケロッグ経営大学院でビジネスデータ分析のMBAと製品戦略の資格を取得しています。

ビデオトランスクリプト

こんにちは。LogicMonitorでコスト最適化ツールを担当するプロダクトマネージャーのチャーリー・ウルフです。
今日は、LogicMonitor を使用して、パフォーマンスに影響を与えずにコストを削減できるように設計された信頼できる推奨事項を活用しながらクラウド コストを最適化する方法について説明します。
月末にクラウドの請求書を見て驚いたり、現在インフラストラクチャ上で実行しているワークロードをまったく理解せずに CFO からクラウドの支出を減らすように言われたりしたことがある人は、世の中に何人いるでしょうか。
Expedia グループにいたころ、私はそのような経験を何度かしました。
組織が大規模にクラウドを導入すると、コストが制御不能になる可能性があります。
稼働時間とパフォーマンスは成功の指標として依然として非常に重要ではあるものの、もはやそれだけではありません。今やコストも重要な指標の一つとなっています。
しかし、ここに落とし穴があります。やみくもにコストを削減すると、パフォーマンスの低下につながることが多く、真の課題は、支出を最適化しながら運用の卓越性を維持することです。そこで、ロジックモニターとFinOpsが役立ちます。
FinOpsとは2016年頃に造られた用語で、その根底には文化的な実践が存在します。クラウドのビジネス価値を最大化するために、チームが協力して取り組むことを意味します。
それは5つの基本原則に基づいています。エンジニアリング、財務、製品、運用の連携、所有権、各チームが自らの業務内容に責任を持つこと、正確なデータを可能な限りリアルタイムで提供すること、ビジネス価値の整合を図る意思決定はインパクトを反映すること、です。資金がどこに使われているのかを理解し、さらになぜ使われているのかを理解する必要があります。
そして最後に、クラウドの変動コスト モデルを効果的に活用します。
これはもはや財務部門だけの仕事ではありません。エンジニアとオペレーターがクラウドコストの直接的な責任を負うようになりました。コストが急増した場合、最初に問われるのは運用チームです。
サイロ内での作業をやめる必要があります。
パフォーマンスとコストは共有 KPI として扱う必要があります。
そして、部門間の連携が、この新しい環境での成功の鍵となります。
運用部門は他のチームと連携して、リソースの使用率を最適化し、パフォーマンスを確保し、支出を管理する必要があります。
FinOps はコスト最適化のプロセスを 3 つのフェーズに分割します。
最初の段階は、支出がどこで発生しているか、どのサービスが、誰がコストを生み出しているか、どのチームがリソースを活用しているかを把握し、情報を提供することです。
次の段階は最適化に移行することです。
その場合、アイドル状態、十分に活用されていない、あるいはサイズが大きすぎるリソースを特定し、適切なサイズに調整してリソースを再利用します。パフォーマンスに影響を与えることなく、リソースを停止または縮小できます。
そして最終段階は運用段階です。ここでは継続的なガバナンスを実施し、予算を監視し、増額を検証し、支出をビジネス目標と整合させます。
ロジック モニターはこれらの各ステップを有効にします。
ロジック モニターはどのようにしてこれを実現するのでしょうか。まず、情報提供フェーズで、LogicMonitor には、開始するための専用のコスト最適化ダッシュボードが用意されています。
次に、円グラフ、棒グラフ、面グラフを使用してコスト データを既存のダッシュボードに統合し、そのコスト データをパフォーマンス データと並べて分析できます。
次に最適化に移ると、アイドル状態のコンピューティング、接続されていないストレージ、その他の十分に活用されていないリソースが明らかになります。
そして最後に、運用では、ダッシュボードを使用して作成し、財務、開発、または運用チームに合わせてカスタマイズできるエクスポート可能なレポートが提供され、アラートは今年後半に通常の LM アラート ワークフロー経由で提供される予定です。
どうやってやるの?
まず、非常にシンプルなオンボーディングフローをご用意しています。非常にスムーズです。LogicMonitorでクラウドアカウントを既に監視されている場合は、モニタリングとコストの推奨事項がすぐに表示されます。
コストに特化したウィザードも用意されており、請求データをツールに簡単に接続できます。既存のお客様の多くは、数週間や数か月ではなく、数時間以内に有用な分析情報を入手できるようになります。
コスト最適化の請求を初めて開いたときには、関連データはありません。そのため、まず「請求データを追加」をクリックする必要があります。
次にプロバイダーを選択します。この場合は、Azure、AWS、またはGCPです。
AWSを選択します。
請求書の表示名と説明データを入力します。
権限については、既存の AWS リソースからコピーするか、AWS 環境に新しいロールを作成するかを簡単に選択できます。
AWS I'm ページに移動し、この関連情報を使用してそこでロールを作成します。
AWS でロールを作成したら、ここに戻って、ロール ARN をロジック モニター環境に追加します。
そして、AWS 内で現在のエクスポートを設定した後、エクスポートの 3 つの場所を入力し、ここにエクスポート データを追加します。
プロパティの正規化をチェックして、すべてのタグが適切に取り込まれ、環境内で正規化されていることを確認できます。
そして、検証してエクスポートを追加します。
そして、1 ~ 3 時間以内に、すべての課金データが分析のためにロジック モニターに直接取り込まれ、表示されるようになります。
最適な推奨事項を得るには、データが完全である必要があります。また、コスト削減を最大限に高めるために、お客様の環境のヘルスチェックを実施します。
EC2メモリなどの主要なメトリクスの存在を検証し、不足している点があればそれを指摘し、チームにその不足点を補う方法を指導します。これにより、すべての推奨事項が安全かつ高い効果を発揮することを保証します。
推奨事項が表示されていますが、明らかに何かがおかしいようです。Azure の推奨事項が表示されません。
しかし、ヘルス チェックでは、画面の右上にセットアップがエラー状態になっていることが表示されます。
クリックすると、エラーがデータ ポイントの欠落であることがわかります。
そして、ロジック モジュールに直接移動して、そのロジック モジュール内で必要な変更を加えることができます。
降りる。
データポイントを確認してください。今は変更を加えませんが、変更が必要な場合はここで行ってください。ツールに戻り、ステータスチェックを再実行して、変更が機能しているかどうかを確認するオプションがあります。または、そのまま先に進んで、明日ヘルスチェックを再度実行することもできます。ヘルスチェックは24時間ごとに自動的に実行されます。
次に、コスト意識を高めることです。最大の成果の一つは、チームが使用量の影響を把握できるように支援することです。
クラウド課金をダッシュ​​ボードに直接統合することで、パフォーマンスや信頼性データと合わせてコストを直接可視化できます。これにより、アカウンタビリティと対応が格段に容易になります。EC2やEC3などのサービスへの支出をリアルタイムで追跡し、パフォーマンスや使用状況の指標と直接比較することで、よりスマートな意思決定が可能になります。
ウィジェットを追加するのがいかに簡単かをお見せしましょう。
コストの最適化から、ダッシュボードに移行することを選択します。
そして、課金と呼ばれる新しいウィジェット タイプが追加されました。
ウィジェットを作成したら、名前を選択します。この場合は非常に単純な名前にします。
視覚化の種類については、様々な視覚化の種類から選択できます。現在提供されているのは、面グラフ、縦棒グラフ、積み上げ縦棒グラフ、ドーナツグラフ、グループテーブルです。
ここに積み上げ縦棒グラフを追加します。
請求データに含まれるあらゆるディメンションデータでフィルタリングできます。ここではAWSで支出している金額のみをフィルタリングすることを選択します。
プロバイダーを選択し、AWSでフィルタリングします。次に、分析で使用する課金ディメンションを選択します。
同様に、請求データ内の任意の請求ディメンションを選択できます。ただし、ここではリージョンのみを選択します。
次に、ズームインしてそのリージョン内のリソースタイプを確認できるようにし、リソースタイプの詳細も確認します。次に、期間を選択します。ダッシュボードで通常提供している期間に加えて、いくつか新しい期間が追加されました。
この場合は 3 月である前の暦月が表示されます。
集計の粒度を選択してください。選択した期間内で有効なオプションのみが表示されます。この場合、週次が最も適切だと思います。
そして私は常に残りのものを他のすべてと同じようにグループ化することを好みますが、それはあなたにお任せします。
ウィジェットを保存すると、ダッシュボードに表示されます。
これをもっと広げてみましょう。棒グラフはこれよりもう少し幅広のほうが好みです。
チャートの各部分にマウスオーバーすると、実際の基礎データを確認できます。さらに、リソースタイプにドリルダウンすることもできます。今回はリソースタイプを選択します。米国西部2地域のみです。そして、米国西部2地域内の詳細を把握したいのです。
そこで、AWS クラウド WAN のリソースタイプと詳細を選択します。
そして、そこから抜け出したいと思ったら、パンくずをたどるだけです。
さあ、家に帰りましょう。
また、そのすぐ横におすすめウィジェットを追加して、どこでコスト削減が可能かを確認することもできます。また、請求ディメンションごとにフィルタリングすることも可能です。すべてが1つのダッシュボードに集約されたので、絞り込みも自在です。
この場合、フィルターは追加しませんが、ダッシュボード フィルターに移動できます。
そして、それを、たとえば 1 つのアカウントだけに絞り込むことができます。
そして、それはダッシュボード上のすべてに適用されます。
すべての推奨事項が同等ではないことを理解しています。そのため、ライフサイクルアプローチを採用することで、ユーザーはすべての決定を記録しながら、準備が整った時点で柔軟に行動を起こすことができます。これにより、監査可能性とチーム内のコミュニケーションが向上します。
表示される推奨事項はそれぞれライフサイクルを経ます。新しい推奨事項から開始し、パフォーマンスデータと照らし合わせて検証します。その後、対応予定のRexについては承認するか、後で対応予定のRexについてはスヌーズするか、対応予定のないRexについては無視するかを選択します。
メモを追加すると、決定が透過的に追跡されるため、監査やコラボレーションに役立ちます。
簡単ですね。サンプルのレコメンデーションフローをご案内します。
こちらは推奨事項のページです。デフォルトのページでは、推奨事項はアイドル状態のAWS EC 2、十分に活用されていないAWS EC 2、未接続のEBSボリューム、未接続のAzureディスクなどのカテゴリに分類されています。
したがって、今回は、十分に活用されていない AWS EC の 2 つのインスタンスについて見ていきます。これは、通常、推奨事項の種類の中で最も複雑なためです。
それを拡張してください。
ご覧のとおり、最初のプランでは、T3 ラージから XNUMX ラージに切り替えるように求められています。これにより、年間約 XNUMX ドル節約できます。
この推奨事項を信頼できる場合は、ここにあるアイコンをクリックしてAWS環境に直接移動できます。推奨事項をさらに検証したい場合は、展開すると、推奨事項タブにCPU使用率とネットワークスループットのグラフが表示されます。この2つのデータだけでは不十分な場合は、他のリソースグラフに移動できます。
さあ、始めましょう。EC2のリソースを掘り下げてみましょう。ほら、これで完了です。
これで、そのリソース上のすべてのグラフにアクセスできるようになりました。
データを確認して決定したら、推奨事項に戻って行動に移すことができます。この場合、今後対応する予定の推奨事項を承認するか、今後対応する予定のない推奨事項を無視するかを選択できます。ここでは、後で対応する可能性の高い推奨事項をスヌーズすることを選択します。
推奨事項をスヌーズすることを選択した場合は、選択した期間にわたって推奨事項をスヌーズし、その後スヌーズの理由を選択できます。
この場合は「その他」を選択し、これをスヌーズした理由をメモに追加できます。
はい、これで上に移動して確認し、アクティブな推奨事項をすべて選択解除できます。
そして、それがスヌーズされた推奨事項の範囲内にあることがわかります。
さらに詳しい情報が必要な場合は、ステータスをクリックすると、推奨事項をスヌーズしたユーザー、スヌーズの開始日時、終了日時、合計期間、理由、追加されたメモを確認できます。
しかし、この場合は、実際にこれをアクティブにすることにしたので、戻ってステータスをアクティブに戻すと、既存のメモが取り込まれ、そのメモを修正するか、削除して完全に新しいメモを追加するかを選択できます。変更を確認し、アクティブな推奨事項を再びオンにすると、アクティブ ステータスに戻っていることがわかります。
そこで、LogicMonitor では独自のツールを導入しました。
このツールを導入した最初の1年間で、LogicMonitorは75万ドル以上のコスト削減を実現しました。これは、定価で計算すると、ツール本体価格の5.5倍に相当します。つまり、投資額を上回るかなりの額のコスト削減を実現できたことになります。
インライン パフォーマンス検証により、私たちは非常に迅速に行動する自信を得ることができました。また、誰かが来て質問を始める前に、早い段階で急増を捉えることで、私たちのチームは実際に 20 万ドルの請求額の予想外の打撃を回避することができました。
先ほど申し上げたとおり、私たちは年間 75 万ドル以上の節約を達成しました。また、先週実行した別の 15 万ドルの節約も最近発見しました。
私たちのオペレーション部門は、コストの急上昇を監視し、予期せぬ事態が発生する前にそれを捕捉できるようになりました。
これまでに行った最も強力な機能強化の 1 つは、AWS の API 経由の他のツールでは利用できないメモリ使用率の統合です。
そのため、ローカルコレクターを搭載していないツールでは、この要件を満たすことはできません。このコンテキストにより、当社の推奨事項はコスト効率が高いだけでなく、運用上の安全性も確保されます。これがフルスタック・オブザーバビリティの真髄です。
この最近の機能強化は画期的なものでした。EC2のメモリ使用率を組み込んだことで、デモ環境では推奨事項の増加、年間コスト削減率の2.4倍、そしてデフォルトのメモリ使用率に基づく潜在的に安全でない推奨事項によるリスク回避の減少を確認しました。これは、ベータ版の優れたデータからだけでも、価値が242%向上し、より安全な推奨事項が提示されることを意味します。つまり、メモリコンテキストは、より優れた推奨事項、そしてより安全な意思決定につながるのです。
では、次のステップは何でしょうか?まず、LogicMonitor の現在のお客様であれば、CSM に依頼して、バックグラウンドで推定節約額を生成してもらうことができます。
お客様の資産全体における年間の推定節約額を正確に算出できます。
その後、プレビュー モードでデモをリクエストすると、ポータルで推奨事項タイプごとに 1 つの推奨事項が表示され、アクションを実行して推奨事項を検証する方法を確認できます。
ありがとうございました。"

こちらもおすすめ

ITコスト最適化による支出管理

AWS、Azure、GCP のコストを詳細に把握しながらハイブリッド環境全体の支出を最適化できるため、ITOps チームは予算を管理し、無駄を削減し、AI 主導のワークロードを自信を持って拡張できます。

コスト最適化

パフォーマンスとクラウド コストのバランスを同時に取り、詳細なマルチクラウド課金の可視性を実現し、AI を活用した推奨事項を使用して AWS と Azure のコストを削減します。常時監視に裏打ちされた高いサービス レベルを提供します。LogicMonitor が、ハイブリッド観測性にコスト管理を組み込んで ITOps チームと CloudOps チームが自信を持って意思決定できるようにする方法をご覧ください。

コスト最適化:6月のプロダクトパワーアワーのまとめ

6月のProduct Power Hourでは、実務担当者がクラウド環境全体で効果的なコスト最適化を実現する方法について深く掘り下げました。ライブデモ、新機能のハイライト、そして活発な質疑応答セッションを通して、可視性と制御性を高めながら支出を削減するための実践的な戦略に焦点を当てました。このセッションは、利用状況を最適化し、コスト要因に関するより明確なインサイトを得たいと考えているチーム向けに設計されました。

今すぐ始めましょう

14日間フルアクセス LogicMonitor プラットフォーム