ソリッドステートドライブ(SSD)を監視するための鍵

近年、ソリッドステートドライブまたはSSDはデータセンターアーキテクチャの標準的な部分になっています。 従来のディスクよりも多くの同時読み取り/書き込み操作を処理し、電力の一部を使用します。 もちろん、主要なインフラストラクチャとして、ソフトウェアと サーバー監視 プラットフォームベンダーである私たちは、SSDの監視に非常に興味を持っています。それは、支払った金額を確実に受け取れるようにするだけでなく、午前3時の実稼働マシンでのディスク障害を回避したいからです。朝…そしてシャキールオニールサイズの頭痛が続きます。 しかし、SSDが希望どおりに動作しているかどうかをどのようにして確実に知ることができますか? 私たちの技術運用チームの最新メンバーの00人である私が、この質問に答える任務を負ったのは当然のことでした。

では、SSDは実際にどうなりますか?

ソリッドステートドライブは、従来のスピニングプラッターとは異なります。 可動部品がなく(ドライブヘッドがプラッターに衝突することはありません)、消磁するものもありませんが、それはそれらが故障の影響を受けないという意味ではありません。 それどころか、NANDベースのフラッシュメモリテクノロジー(データを保持するために電力を必要としないタイプのストレージテクノロジー)という同じテクノロジーが原因で、これらは完全に失敗します。 ソリッドステートドライブ内のファイルを削除または書き込む場合、古いデータは無効としてマークされ、新しいデータはNANDの新しい場所に書き込まれます。 ドライブがより多くのスペースを必要とするとき、古いデータは後で消去されます。 SSD上のフラッシュセルは、信頼性が低下する前に限られた回数しか書き込むことができません。 簡単に言えば…鉛筆で一枚の紙に連続して書き、それを消していくようなものです。 紙がすり減って使用できなくなるまで、何度も書き込みと消去を行うことができます。

もちろん、ディスクを監視する方法はいくつかあります。 ディスクの読み取り/書き込みを監視し、時間の経過に伴う傾向に基づいてパフォーマンスの低下を事前に監視できます。 LogicMonitorでは、IO完了時間、IOPSの読み取りと書き込み、要求サービス時間、キューの深さなど、すべての基本事項をすでに測定して警告しています。ただし、これらすべてでは、SSDディスクのハードウェアの状態を可視化することはできません。自体。

SSDの消耗に関するリアルタイムのメトリックを確認する方法があった場合はどうなりますか?

SSDベンダーが SMART(自己監視、分析、およびレポート技術) ドライブの現在の状態に関する情報を提供するためのカウンターまたは属性。 次の質問は、この特定のデータにアクセスする方法です。 ありがたいことに、「ctrl、alt、delete」で私たちを祝福してくれた神々も私たちに与えてくれました smartmontools。 このツールは、smartctlとsmartdで構成されています。 Smartctlは、ドライブをテストし、ハードウェアのSMART統計を読み取って報告するためのアプリケーションです。

ライトアンプリフィケーション、予約済みスペース、温度など、ディスクを監視する際に考慮すべき重要なカウンターがいくつかあります。特にディスクの寿命に焦点を当てたいと思いました。 たとえば、IntelSSDのMediaWear-Out Indicatorは、正規化された値100(SSDが新しい場合)を報告し、最小値1に低下します。

データソースを作成する!

新しいMediaWearout IndicatorデータソースはLogicMonitorによって作成されました。現在、運用チームは本番マシンのSSDを監視するために使用しています。 データソースを作成するために、さまざまなsmartctlコマンドを利用しました。 たとえば、コマンド smartctl -l devstat -i -A -d sat + megaraid、0 / dev / sda  RAIDコントローラーの背後にある物理ディスク0のSMARTヘルス統計を識別するために使用されます。

私たちは今、行うオプションがあります SNMP拡張 使用可能なすべてのディスクをループするスクリプトを実行するか、各コマンドを個別のsnmp extendsoidとして使用します。 後者を採用することにしたのは、個別のコマンドを使用すると、ディスク上の統計情報をさらに取得できるようになるだけでなく、各マシンで外部スクリプトを管理する必要がなくなるためです。

ディスク寿命のためのsmartctlコマンド

LogicMonitorデータソースのアクティブな検出部分は、使用可能なすべてのディスクを検索し、それぞれのデータを効果的に収集できるようになります。 その後、メディアの消耗データをリアルタイムで確認し、アラートを設定して、いつ交換するかを知ることができます。

SSD摩耗インジケーター

あなたは顧客ではありませんが、ソリッドステートドライブ(SSD)やその他のITインフラストラクチャを監視する必要がありますか? LogicMonitorを無料でお試しください.

インフラストラクチャを監視するためのデータソースを作成しましたか? コメントを投稿して、作成したものをお知らせください。