November 2, 2012

SaaSアドバンテージ#46としての監視–常にベストプラクティス

LogicMonitorのようなSaaSが提供する監視サービスの顧客であることの素晴らしい点のXNUMXつは、スタッフにその技術の専門家がいなくても、あらゆる種類の技術の監視のベストプラクティスを取得できることです。

LogicMonitorがVMwareモニタリングに使用されるCPUデータポイントの一部を更新した最近の例。

お客様に自動的にプッシュされる更新の60つは、ESXiホストのCPU負荷の測定に使用されるAPIオブジェクトをcpu.usage.averageからcpu.utilization.averageに変更することでした。 現在、これら100つのカウンターは非常に似ているように聞こえますが、ほとんどの場合は似ています。 ただし、cpu.utilizationは、負荷に応じてCPUが実行されている頻度を増減する可能性のある電源管理テクノロジがある場合に、ホストのCPU負荷のより正確なビューを提供します。 ハイパースレッディングが存在する場合は、より正確なビューを表示することもできます。 Cpu.usageは、CPUの公称周波数に関連しており、CPUがビジーであった時間ではなく、一般により関連性があります。 (例として、熱の問題のためにCPUが抑制されている場合、cpu.usedはXNUMX%のCPU使用率を報告できますが、cpu.utilizationはXNUMX%を報告できます。)

では、なぜLogicMonitorは最初にcpu.usageメトリックを使用したのでしょうか。 vSphereバージョン4では、それが存在した唯一のカウンターだったからです。 cpu.utilizationカウンターは、以降のリリースでのみ追加されました。

最近モニタリングに追加したもうXNUMXつのVMware固有のメトリックは、cpu.costopモニタリングです。 これは、SMP仮想マシン内のvCPUの実行が停止され、同じ仮想マシン内の別のvCPUが追いつくために実行される可能性がある時間の割合です。 XNUMXつの仮想プロセッサ間のスキューが大きくなりすぎると、オペレーティングシステムはそれを嫌います。 CPU間のクロックが大きくなりすぎると、VMwareは高速のCPUを停止し、低速のCPUが追いつくようにします。 CPUに十分な作業がない場合、CPUが遅れる可能性があるため、タスクはスケジュールされません。 したがって、この場合、作業を行っていたCPUは作業を実行できなくなり、アイドル状態のCPUが追いつく可能性があります。つまり、過剰なCPUを使用して仮想マシンを過剰にプロビジョニングすると悪影響が生じる可能性があります。

VMwareCoStopおよびCPUReady

これは、VMwareの初期の化身では利用できなかった別のメトリックですが、現在は利用可能であるため、LogicMonitorによってデフォルトで監視および警告されます。

前提ベースの監視システムとは異なり、SaaSベースの監視は、現在のベストプラクティスを反映するように常に更新できます。 したがって、最高の人材を更新に専念させることなく、利用可能な最高の監視を取得できます。