監視を超えて:ビットとバイトからビジネスレベルのKPIまで

監視を超えて:ビットとバイトからビジネスレベルのKPIまで

When discussing monitoring with IT and technical operations teams, it comes as no surprise that every team has its own parameters and requirements for their particular environment. Some teams just need an up-down of specific devices or interfaces, and others need more granular metrics like JVM or database performance.  At the end of the day though, everyone is responsible for a service. Your service might be a public-facing website, it could be internet access at a remote location, or it might be an internal tool, like a support ticketing system.

監視への統一されたアプローチ

最近、開業医と経営幹部が同様に、彼らのサービスの「健康」について統一された見方をする傾向があります。 ただし、一般的に見られるのは、サービスの全体的なステータスまたは状態に関するレポートは簡単ではないということです。 これは、多様なインフラストラクチャまたは一時的なインフラストラクチャによってサポートされている環境に特に当てはまります。 ほとんどのチームは、サービスが正常であるために良好な状態である必要がある主要なメトリックを定義できますが、ツールが異なるか柔軟性がないため、この目標を達成できません。

私たちが話している技術チームの大多数は、通常、今日のインフラストラクチャスタックのXNUMXつの層のために特別に構築された監視ソリューションを組み合わせて使用​​しています。 彼らは、ネットワークを監視するためのツール(またはモジュール)、サーバーを監視するための別のツール、およびアプリケーションとデータベースを監視するためのさらに別のツールを使用しています。 これらのツールとモジュールの一部は、各レイヤーのメトリックを含むダッシュボードを提供するために統合できますが、実際には統合されていないため、個々のコンポーネントのパフォーマンスをサービス全体の状態と相関させるのに役立ちません。

統合された監視およびレポートシステムが導入されたときに回復される無数の時間に加えて、インフラストラクチャとチームレベルまたはビジネスレベルのKPIの間の点を接続することも同様に不可欠です。

ビジネスインテリジェンスの監視方法 

Teams are frequently asked to diagnose or report on the overall health of their service, and for most, this is a daunting task.  Let’s take a true-to-life example. At LogicMonitor, the Business Systems team maintains a business intel portal that is consumed by numerous cross-functional teams throughout the company. For us, this portal is our service. To accurately report on the successful delivery of our service, we must have visibility into metrics that range from infrastructure performance to consumer-grade KPIs. 

LogicMonitorのビジネスインテリジェンスサービスマップダッシュボード

このポータルが効果的に機能するには、いくつかのコンポーネントが最適に動作している必要があります。データベース抽出アプリケーションはデータをAmazonのS3に送信する必要があり、サードパーティのETLサービスはデータをS3からデータウェアハウスにプッシュし、内部的には次に、ビルドおよびホストされたアプリケーションがデータをポータルに移動します。

当然のことながら、LogicMonitorを使用して、ETLパイプラインと、ポータルが(内部の)「顧客」に正常に配信されているかどうかを監視しています。 S3バケットのスループットから、ビジネスインテリジェンスポータルにアクセスする毎週のアクティブユーザーの数まで。 

すべてが言われ、行われるとき、これはエンジニアから管理者まで、チームの共同責任です。 ポータルが正常に機能していないと、サービスへの信頼が低下し、アクティブユーザー数が減少することがわかっています。

LogicMonitorの顧客は、まさにこの方法でプラットフォームを使用しています。ミッションクリティカルなアプリケーションをサポートするインフラストラクチャと、これらのサービスの成功を評価するために使用されるメトリックとの間のギャップを埋めるためです。 これは、LogicMonitorのようなツールでのみ可能です。これは、インフラストラクチャのすべてのレイヤーを包括的に可視化し、サービスの状態に関連すると見なされるメトリックを無制限に監視できるようにゼロから構築されているためです。

LogicMonitorは、TedBakerを許可したものです ERPの洞察を抽出する エグゼクティブとITチームの両方に関連します。 TedBakerのIT責任者であるStuartCarrison氏は、次のように述べています。「LogicMonitorを使用することのユニークな点は、ビジネスのパフォーマンスに関する情報をビジネスに提供できることです。」

監視に対するサービス中心のアプローチのより抽象的な例を提供するために、ITチームが担当する一般的なサービスであるJiraのような内部ITSMツールを見てみましょう。

LogicMonitorのJIRAサービスヘルスダッシュボード。

この場合、ダッシュボードは、基盤となるインフラストラクチャコンポーネントと、Jiraポータルに関連するチケットのカウンターで構成されます。 前述のように、LogicMonitorは、ハードウェアの状態からチームレベルの目標に至るまで、サービスの全体像を提供します。

主要な取り組み

ツールと監視へのサービスベースのアプローチを構築しようとしている人のために、ここにいくつかの推奨事項と持ち帰り用の食べ物があります。 

  1. サービスのKPIから開始し、逆方向に作業します。 これは、監視セーフティネットを強化するだけでなく、ビジネスと技術をつなぐ会話を開始する傾向があります。 LogicMonitorのようなツールを使用すると、関連するすべてのメトリックをカバーするための統一された一貫した方法が提供されます。
  2. 次に、特にダッシュボードとレポートに関しては、サービス自体を見失うことなく、サービスを構成するすべてのコンポーネントを含めることの間の適切なバランスを見つけます。 ITで一般的であるように、「木から森を見失う」可能性があります。
  3. 最後に、それは人々に関するものです。プラットフォームを使用して、技術的な運用を容易にし、ビジネス全体のすべての利害関係者に明確さをもたらします。

LogicMonitorのビジネスインテリジェンス機能について詳しく知りたい場合は、カスタマーサクセスマネージャーに連絡するか、 毎週のデモに参加する LogicMonitorの動作を確認します。