ベストプラクティス

ビジネス継続性のための AWS 分析とサービスのモニタリング

ウェビナーのカード画像

Amazon Webサービス(AWS) 製品は無数に感じることができ、LogicMonitor では、できるだけ多くの製品に監視サポートを提供するためにたゆまぬ努力を続けています。 非常に多くの製品とツールがすでに手元にあるため、監視が面倒ではなく、信頼できるパートナーであることを確認したいと考えています.

AWS は、アプリケーション管理、機械学習、エンドユーザー コンピューティングなどに役立つツールを提供します。 AWS が提供するツールのリストは増え続けていますが、LogicMonitor はこれらのサービスからのデータを統合し、クラウドかオンプレミスかに関係なく、ユーザーがインフラストラクチャの残りの部分と並べて監視できるようにします。 LogicMonitor がビジネス継続性のために分析ツールとサービスをどのように使用しているかをご覧ください。

にジャンプする:

  • AWSAnalyticsのモニタリング
    • AWSAthena
    • AWSグルー
  • AWSアプリケーション関連サービスのモニタリング
    • ドキュメントDB
    • RDS サービスの制限
    • MQ
    • コードビルド
  • ビジネス継続性のためのAWSサービスのモニタリング
    • AWSOpsworksスタック
    • AWS AppStream 2.0
    • AWS コネクト
    • AWS セージメーカー

AWSAnalyticsのモニタリング

AWSAthenaサクセスダッシュボード

AWSAthena

Amazon Athenaは、標準SQLを使用してAmazon Simple Storage Service(S3)に保存されているデータを分析するインタラクティブなクエリサービスです。 Athenaを監視することで、失敗したクエリと実行時間の長いクエリに関する洞察をユーザーに提供します。 これにより、問題をより早くキャッ​​チしてより迅速に解決できるため、稼働時間とパフォーマンスを最大化できます。

データは、データ定義言語(DDL)とデータ操作言語(DML)のXNUMXつのクエリタイプに収集されます。 抽出された各メトリックは、クエリの状態(キャンセル、失敗、成功)によって識別されます。 そのインジケーターを使用すると、タスクに関連するメトリックに注意を集中できます。 失敗したクエリ専用のダッシュボードを作成することもできます。これはトラブルシューティングに役立ち、成功したクエリ用の別のダッシュボードを作成して、より正確なしきい値の許容可能なベースラインを考え出すのに役立ちます。 トラブルシューティング中に、実行時間を追跡する必要があります。 クエリキュー、クエリプランニング、エンジン実行、サービス処理などのすべての時間メトリックをXNUMXつの場所にまとめることで、ボトルネックや問題が発生した場所をすばやく特定できます。 定常状態にあり、物事が順調に進んでいると感じたら、必ず戻って時間メトリックに適切なしきい値を設定してください。 これにより、動的しきい値機能とともに、重要な場合にのみ通知が届くので安心できます。

AWSグルー

AWS Glue は、お客様が分析用にデータを準備してロードするのに役立つ、完全マネージド型の抽出、変換、ロード (ETL) サービスです。 このサービスは、企業の構造化データまたは非構造化データが、Amazon Simple Storage Service (S3) のデータレイク、 Amazonレッドシフト、および Amazon Relational Database Service の一部であるその他のデータベース。 これらはすべて LogicMonitor で監視できます。 測定可能なデータを持つ AWS Glue の唯一のオブジェクトはジョブであるため、この DataSource はジョブを自動的に検出します。

ジョブを正確に監視するには、エグゼキュータ、ステージ、およびタスクを追跡する必要があります。

アクティブに実行されているジョブエグゼキュータ、「アクティブエグゼキュータ」の数は、ストラグラーシナリオによる遅延を特定するのに役立ちます。 より多くのデータ処理ユニット(DPU)をプロビジョニングする時期を知るために、アクティブなエグゼキューターと最大エグゼキューターのメトリックを監視します。 アクティブなエグゼキュータメトリックが最大エグゼキュータ値に近づいたときに、アラートと警告を作成してください。 

ジョブがさまざまな段階を経るとき、進行状況を監視するためにダッシュボードに完了した段階のメトリックを表示すると便利です。 一部のステージに時間がかかりすぎることに気付いた場合は、CPU負荷、メモリ、経過時間のメトリックを相互に関連付けて、問題を切り分け、リソースを追加する可能性があります。 または、負荷を再パーティション化して経過時間を短縮することもできます。 ステージ内に並列処理がある場合は、完了したタスクと失敗したタスクを追跡することが不可欠です。 ジョブのワークフローに応じて、失敗したタスクに適切なしきい値を設定する必要があります。 これらの失敗したタスクは、データ、クラスター、またはスクリプト内の異常を判別するのに役立ちます。

AWSアプリケーション関連サービスのモニタリング

ドキュメントDB *(データベース)

Amazon DocumentDB(MongoDB互換性あり)は、MongoDBワークロードをサポートする、高速でスケーラブルな高可用性のフルマネージドドキュメントデータベースサービスです。 私たちのユーザーはすでに伝統的な MongoDBの ワークロード、およびこのデータソースを使用して、LogicMonitorのプラットフォーム内でAWSDocumentDBワークロードを監視できるようになりました。 従来のMongoDB環境からDocumentDBへの移行を計画している組織の場合、LogicMonitorは、移行を綿密に監視し、問題が発生した場合に警告するためのメトリックを提供します。

CPU、メモリ、ネットワークアクティビティ、データベース接続、およびIOPSメトリックを監視することにより、クラスターを正常に保ちます。 ノードがダウンした場合、レプリケーションラグメトリック(instanceReplicaLag)を監視できます。 ラグが大きすぎると、データが正しく同期されない可能性があるため、このメトリックに注意してください。 

保存期間またはスナップショットのいずれかを介してバックアップを保持することは重要ですが、これらのバックアップが使用しているストレージ容量を知ることも重要です。 クラウド環境でストレージを見落とすと大きな頭痛の種になる可能性があるため、より大きなバックアップファイルを追跡して、ストレージの予算内に収まるようにしてください。 これらのメトリック、backupRetentionPeriodStorageUsed、およびsnapshotStorageUsedを追跡することにより、予期しないスパイクを確認し、すぐにアクションを実行できます。

RDSサービス制限*(データベース)

LogicMonitorには、有用な監視メトリックを処理するRDS固有のデータソースがすでにあります。 この新しい拡張機能は、RDSサービス制限を監視するための独自のメトリックを追加しています。 Amazonは、AWSアカウントで作成できるRDSリソースの数にサービス制限を設定します。 これらのリソースのいくつかには、データベースクラスター、インスタンス、パラメーター、スナップショット、および割り当てられたストレージの数が含まれます。 このデータを使用すると、AmazonがRDSリソースに対して持っている制限/割り当てを超えることができます。 重要なリソースが割り当てに近づいたときに、不意を突かれることはなく、それに応じて対応することができます。

MQ(アプリケーション統合)

多くの場合、ユーザーは、部分的にMQに依存し、部分的にオンプレミスまたはクラウドのいずれかで実行されている他のインフラストラクチャに依存する可能性のある複雑なサービスを利用します。 LogicMonitorの集中監視により、可視性が向上するため、ハイブリッド環境でのこれらの複雑なサービスの問題を予防的に防ぐことができます。 Amazon MQは、ApacheActiveMQのマネージドメッセージブローカーサービスです。 LMは、これらのマネージドブローカーの可視性を提供するため、アプリケーションチームは、メッセージ数、CPU、メモリ、ストレージ、ネットワーク使用率などのメトリックを使用して稼働時間とパフォーマンスを最大化できます。

LogicMonitorのAWSMQダッシュボード

アクティブ/スタンバイ展開の場合、LogicMonitorにはスタンバイリソース専用のデータソースがあります。 アクティブメトリックとスタンバイメトリックを分離すると、より明確になり、データの一貫性が保たれます。

Codebuild(開発者ツール)

AWS CodeBuildは、ソースコードをコンパイルし、テストを実行し、デプロイの準備ができているソフトウェアパッケージを生成する、フルマネージドの継続的インテグレーションサービスです。 ビルドプロジェクトを監視して、ビルドが正常に適切なタイミングで実行されていることを確認できます。 最終的には、インフラストラクチャデータとともにパフォーマンスと稼働時間を最適化するための情報を提供します。 

アプリケーション開発チームは、ビルドが失敗したときに注意する必要があります。 このデータソースには、ビルドが失敗した場合に通知を自動的にトリガーする事前定義されたしきい値があります。 ビルドは迅速に行う必要があり、ビルド時間の内訳を使用して、遅延の原因となっているビルドのステップを特定し、場合によってはリソースを追加してプロジェクトのビルド時間を最適化できます。

ビジネス継続性のための AWS サービスのモニタリング

AWSOpsworksスタック

クラウドベースのコンピューティングには通常、ロードバランサー、アプリケーションサーバー、データベースなどの多くのコンポーネントが含まれます。元のサービスであるAWS OpsWorks Stacksは、スタックとアプリケーションを作成および管理するためのシンプルで柔軟な方法を提供します。 AWS OpsWorks Stacksを使用すると、スタック内のアプリケーションをデプロイおよびモニタリングできます。 CloudWatchを介して、スタックの集計メトリックスを取得できます。これは、スタック内のリソースの全体的な状態を理解し、問題を防ぐのに役立ちます。 収集されたメトリックは、次のように分類できます。

  • CPUパーセンテージ
    • エントルピー
    • ユーザー
    • 入出力操作
  • メモリ
    • トータル
    • キャッシュされた
    • 無料
    • 緩衝
  • 平均負荷
    • 1 minute
    • 5 minutes
    • 15 minutes
  • プロセス
    • トータルアクティブ

同じリソースのスタックはレイヤーと呼ばれます。 たとえば、レイヤーは、アプリケーションの提供やデータベースサーバーのホストなど、特定の目的を果たすEC2インスタンスのセットを表します。 これらのレイヤーは、LogicMonitor内で監視することもできます。 LogicMontorのAWSの堅牢なカバレッジにより、サービスのすぐに使用可能なデータソースを介してレイヤーの個々のリソースメトリックを表示することもできます。

AWS AppStream 2.0

Amazon AppStream 2.0を使用すると、組織はデスクトップアプリケーションを管理し、それらを任意のコンピューターに安全に配信できます。 このサービスは、ユーザーが電力不足のマシンでリソースを大量に消費する可能性のあるプログラムを実行するのに役立ちます。 AppStreamは、CitrixまたはMicrosoftのリモートデスクトップに似ています。 フリートの容量と使用率を監視することが不可欠になります。 シンプルなダッシュボードを使用して、現在の容量と残りの容量、および容量の使用率を追跡できます。 容量不足エラーが発生すると、LogicMonitorは自動的にアラートを送信します。

LogicMonitorでのAppSteamフリートステータスの概要。

AWS コネクト

カスタマーサービスはかつてないほど重要であり、人々は迅速で質の高い対応を望んでいます。 Amazon Connectは、企業が低コストで優れたカスタマーサービスを提供するのに役立つ、使いやすいオムニチャネルクラウドコンタクトセンターです。 このサービスを利用する場合は、サービスのステータス、通話量、割り当て、不在着信などの指標を追跡すると便利です。

不在着信、電話番号の設定ミス、同時通話の割合、アップロードエラーの記録に関するすぐに使用できるアラートにより、問題のある状況を常に把握できます。

AWS セージメーカー

AWS SageMakerは、すべての開発者とデータサイエンティストに、機械学習モデルを迅速に構築、トレーニング、デプロイする機能を提供するフルマネージドサービスです。 ユーザーは、特にSageMakerモデルが本番環境で使用されている場合に、複雑なインフラストラクチャ全体で稼働時間とパフォーマンスを確保するために、既存のインフラストラクチャとともにこのサービスを監視したいと考えています。 SageMakerエンドポイントは、LogicMonitorのリソースとして検出されます。

各エンドポイントには、独自のCPU、メモリ、およびディスク使用率のメトリックがあります。 これらはすべて、自動アラートと通知の事前定義されたしきい値を持っています。 LogicMonitorは、呼び出されたHTTPリクエストの総数を追跡し、5XXエラーがある場合にアラートを出します。 モデルのレイテンシーとSageMakersのオーバーヘッドをベースライン化できます。 これらのベースラインを使用すると、新しいモデルがデプロイされたときの変更を把握したり、A / Bデプロイメントを実行したときのレイテンシーの違いを確認したりできます。

まとめ

私たちは最近、私たちへのコミットメントを強調しました AWSパートナーシップ、および当社の開発者は、新しいAWSモニタリング統合を開発し続けています。 これが以前のブログのハイライトです AWS分析サービスアプリケーション開発サービス。 これらの新しい統合はすべて、 LMクラウド 募集。 LM Cloudをご利用で、すでにこれらのAmazonサービスのいずれかを利用している場合、LogicMonitorはこれらの指標の収集を自動的に開始します。 

これらの新しい監視統合に関して質問がある場合は、CSMに連絡するか、詳細についてお問い合わせください。 またはあなたはすることができます LogicMonitorを無料でお試しください

私たちのブログを購読する

このような記事をあなたの受信箱に直接お届けします