ITのための目的のある電力監視

ITのための目的のある電力監視

サーバーの電源を失ったことはありますか? 単独で再起動したことはありますか? IT機器の停電を防ぐのはいいことではないでしょうか。 これが過去に経験したことである場合は、電力監視を簡素化し、電力の問題によって引き起こされる可能性のあるいくつかの停止を回避する方法があります。 この記事では、ラック配電ユニット(rPDU)からの電力消費データの使用とプロセスを簡素化する方法に焦点を当てます。

多くのことが電源の問題を引き起こす可能性があります。 自宅でブレーカーが落ちて停止したことはありますか? ある暑い夏にブレーカーが落ちたファンを接続して、照明とコンピューターの電源を切ったのを覚えています。 この問題はすぐに解決されました。 電気パネルのブレーカーをリセットし、長い延長ケーブルを使用してファンを別の部屋のソケットに差し込む必要がありました。

想像してみてください ITインフラストラクチャで発生している。 それは多くの理由で悪夢であり、修復は自宅ほど簡単ではありません。 データセンターははるかに大きく、遠くにあり、データセンターのすべての部屋に多くのブレーカーがあります。

データセンターの電力システムを監視することは難しい場合がありますが、そうである必要はありません。 科学と魔法の一部だと言う人もいます。 電気を議論するときは物理学が関係しているので、説明するのは難しいです。 物理学を省略し、電力システムを監視することの利点を得る方法を論理的に説明します。 達成できる主な利点はXNUMXつあります。

  1. 稼働時間の改善
  2. 電力費の削減
  3. より多くのIT機器をサポートすることによる効率の向上

他のメリットを実現する前の基盤であるため、稼働時間の改善に焦点を当てます。 結局のところ、オンプレミスのデータセンターには最も重要なアプリケーションが格納されているため、停止を防ぐためにすべてを行う必要があります。 

電力システムの概要

ITデバイスの稼働時間を増やすには、電力システムに関するある程度の知識が必要です。 これは、単純化された非冗長の概要です。

非冗長電源システム。

ITデバイスが常に接続され、どこからでも利用できるアプリケーションを実行してデジタルの世界に提供するには、すべての電力機器が適切に機能する必要があります。 すべてが組み込みの冗長性であるため、実際の図ははるかに複雑になるはずです。 

冗長電源システム図。

ご覧のとおり、ITデバイスはラック配電ユニット(rPDU)から電力を取得します。 最も単純な形式では、それらはあなたがあなたの机の上に持っている電源タップのより大きなバージョンです。 電源に接続し、ITデバイスに多くのコンセントを提供します。 彼らは電力を供給し、ITデバイスを保護する必要があります。 最新のITデバイスは、電力を大量に消費し、デバイス内に冗長性を提供するために、複数の電源接続を必要とします。 そのため、通常、ITデバイスに電力を供給するXNUMX〜XNUMXつのrPDUがあります。 XNUMXつの電源システムの何かに障害が発生した場合に備えて、冗長性のためにXNUMXつのrPDUが使用されます。 

私たちの目的のための1つの主な電力属性は、2)アンペア(Aまたはアンペア)で表される「電流」と、XNUMX)同じ用語である電圧(Vまたはボルト)を使用して表される「電圧」です。  

プロビジョニングの推奨事項

電力属性:アンペア数電圧ワット電力=電圧電流単位電圧単位電力単位

ITデバイスが電源システムにどのように接続されているかについての基本的な理解ができたので、少し数学について説明する必要があります。 rPDUをプロビジョニングするときに従うべきXNUMXつのルールがあります。

  1. 冗長ペアに障害が発生したときに50つのユニットが全負荷をかけることができるように、最大​​XNUMX%までのみプロビジョニングします
  2. 使用量の急増に対応するために、容量の20%を予約します。たとえば、最初の電源投入時(ファンノイズの増加は良い指標です)
  3. 実際の電力使用負荷(導入部でファンを接続したときに起こったこと)を知らずに、rPDU内の開いているコンセントに接続しないでください。

アンペア

上記のルールでは、rPDU容量の40%のみを現実的にプロビジョニングする必要があります。 アンペア数で測定される電力電流は、電力システムをプロビジョニングするときに最も使用される属性です。 たとえば、30アンペアのrPDUの場合、ほとんどの場合、12アンペア未満を処理する必要があります。

多くのrPDUは、ユニット内でさらにセグメント化されます。 各セグメントは一般に分岐回路として知られています。 通常、ユニット内には16〜80個の分岐回路があります。 各分岐回路には、ある回路を別の回路から保護するためのブレーカーも含まれています。 これらのブレーカーの定格は20アンペア(13アンペアの19%)です。 この定格は、多くのITデバイスが使用するC-XNUMXおよびC-XNUMXコネクタの機能と一致します。

推奨事項1-分岐回路レベルで電流を監視する

分岐回路ブレーカーは、次のXNUMXつの条件下で作動(トリップ)します。

  1. 接続されたデバイスのいずれかによって引き起こされたシステムの電力サージ
  2. 接続されたITデバイスがrPDUが処理できる以上のものを必要とする場合の過剰消費

ブレーカーのトリップを回避するために、次のアラートしきい値設定の電力電流をお勧めします。

  • 30%を超える警告
  • 35%を超えるエラー
  • 38%を超えるクリティカル

警告アラートが表示されたら、それを注意深く監視して、消費電力が時間の経過とともに増加していないことを確認する必要があります。 クリティカルアラートを受け取ったら、ITデバイスの一部をその分岐回線から再プロビジョニングまたは移動することを検討してください。 履歴データがあると、移動先を特定するのに役立ちます。

電圧

これまでは、主に電力電流属性について説明してきました。 もうXNUMXつの重要な属性は、電圧(V)で測定される電源電圧です。 電力電流と電圧は連携して機能しますが、動作は異なります。 ほとんどのITデバイスは、アンペア数と電圧の両方で表される独自のパフォーマンス要件を持つ電源を使用します。 供給不足の場合、電源装置はITデバイス内のコンポーネントに十分な電力を供給できず、停止を引き起こす可能性があります。

注:多くのITデバイスは消費電力を報告します。 rPDUからの電力測定値と比較するために、電源の入力(出力ではない)を必ず探してください。

推奨事項2–電圧の監視

電源電圧はrPDU内で大きく変化しません。 電圧を監視し、それを電源の要件と比較することが重要です。 ほとんどのITデバイスの電源装置の範囲は208V〜240Vです。 アンペア数とは異なり、電圧が最小要件を下回らないように監視する必要があります。

デバイスの電源に関する問題を回避するために、電源電圧の次のアラートしきい値設定をお勧めします。

  • 最小電圧要件(例:210V)未満での警告
  • 最小電圧要件(例:5V)を205V未満下回る場合のエラー
  • 最小電圧要件(例:10V)より200V未満低い場合にクリティカル

電源とベンダーからのその要件は異なる動作をします。これを感度と呼びましょう。 電源が故障する原因となる可能性のある実際の電圧の感度は、ユニットやモデルによって異なりますが、これは良い出発点です。

アラートのいずれかがトリガーされた場合は、それを監視し、定期的に発生する場合は、電気技師に連絡して問題を解決してください。 低電圧は一般に、rPDUが電力を得るソースの問題です。 通常、フロアスタンドPDUがソースです。 それはより高い電力を処理するので、問題を調査するために電気技師が必要です。 

簡易ネットワーク管理プロトコル(SNMP)

監視機能を備えた多くのrPDUはSNMPをサポートしていますが、これは素晴らしいニュースです。 悪いニュースは、私の推奨事項を実装するために必要なObjectIDが標準化されていないため、使用するOIDを決定するために少し調査する必要があることです。 

一部のベンダーのSNMPOIDのサンプルを次に示します。

ベンダー分岐回路電流電圧
APC(シュナイダーエレクトリック).1.3.6.1.4.1.318.1.1.15.4.2.3.1.5.a
a = xPDUBranchBreakerTableIndex
.1.3.6.1.4.1.318.1.1.15.3.1.4.1.2.a
a = xPDUMainInputVoltagePhaseIndex
イートン
.1.3.6.1.4.1.534.6.6.7.5.4.1.3.ab
a =ストラップインデックス
b = グループ インデックス

.1.3.6.1.4.1.534.6.6.7.5.3.1.3.ab
a =ストラップインデックス
b = グループ インデックス
Geist(Vertiv)
.1.3.6.1.4.1.21239.5.2.3.3.1.4.a
a = ブレーカーインデックス

.1.3.6.1.4.1.21239.5.2.3.3.1.8.a
a = ブレーカーインデックス
ラリタン(ルグラン)
.1.3.6.1.4.1.13742.6.5.3.3.1.ab1
a = プディッド
b =ブレーカリッド

.1.3.6.1.4.1.13742.6.5.3.3.1.ab4
a = プディッド
b =ブレーカリッド
サーバーテクノロジー
.1.3.6.1.4.1.1718.3.2.7.1.7.abc
a = TowerIndex
b = インフィードインデックス
c = ブランチ インデックス
.1.3.6.1.4.1.1718.3.2.2.1.11.ab
a = TowerIndex
b = インフィードインデックス

注:詳細については、ベンダー固有の管理情報ベース(MIB)を参照してください。

LogicMonitorを使用する利点

LogicMonitorは、電力システムの監視を簡素化できます。 自動化と電力消費データへのより深い洞察により、適切なタイミングで適切なアクションを実行することで、電力問題に関連する停止を回避できます。 電力監視に直接影響する機能のハイライトは次のとおりです。

  • 消費電力を自動的に監視
  • より深い洞察に基づいて行動を起こす
    • 動的しきい値 rPDUの機能内で消費されている場合でも、ベンチマーク帯域外(下の灰色のバー)に表示されると、各ユニットの通常の動作消費量とアラートを学習します
警告可能なしきい値を示すLogicMonitor動的しきい値。
  • 予測分析 rPDU容量の上限に達する潜在的なリスクを早期に可視化します
LogicMonitorの予測ダッシュボード

ご覧のとおり、電力システムによって引き起こされる潜在的な停止の防止は、LogicMonitorを使用して意図的に簡単に実装できます。 監視対象リソースとしてrPDUを簡単に追加し、アラートを適用して収集されたデータを分析します。 ことわざにあるように、 あなたはそれを設定し、それを忘れます。 LogicMonitorの機能について詳しく知りたい場合は、カスタマーサクセスマネージャーに連絡するか、 毎週のデモに参加する LogicMonitorの動作を確認します。