NVIDIA SMI モニタリング
最終更新日: 28 年 2025 月 XNUMX 日LogicMonitor は、NVIDIA GPU の監視をサポートします。LogicMonitor の Nvidia-SMI 監視は、高速で効率的な解析に最適化されており、コレクター全体のパフォーマンスへの影響を最小限に抑えながら、単一のコレクターでより大規模なセットアップに拡張できます。
LogicMonitor の GPU モジュールは、次の方法で NVIDIA GPU の監視を強化します。
- 効率を向上させます–最適化されたリクエスト フィルターにより、SSH データ転送とデバイス パフォーマンスへの影響が最小限に抑えられ、コレクターへの影響を最小限に抑えながら、より大規模なセットアップへの拡張が可能になります。
- 安全なアクセスを提供–Linux 環境と Windows 環境の両方でキーベースの SSH 認証をサポートします。
- シームレスなデータ収集を保証– SSH の exec 機能を活用して、接続の信頼性、短さ、堅牢性を高めます。
- パフォーマンスのボトルネックを特定–使用率、VRAM 使用量、クロック速度をカバーするメトリック。また、ハードウェアを最大限に活用するモデルを特定するのに役立ちます。
- デバイス管理を効率化–専用のプロパティソースを使用します(
@category NVIDIA-SMI
) を使用すると、監視が合理化され簡単になります。
NVIDIA SMI 互換性の要件
LogicMonitor の GPU モジュールは、SSH EXEC を使用して NVIDIA SMI コマンド (幅広い GPU サポート) を実行するリソースと互換性があります。
監視へのリソースの追加
NVIDIA GPUリソースを監視に追加します。監視にリソースを追加する方法の詳細については、 追加 リソース。
LogicModulesをインポートする
LogicMonitor モジュール エクスチェンジから、すべての NVIDIA GPU LogicModules をインポートします。これらの LogicModules がすでに存在する場合は、最新バージョンであることを確認してください。
LogicModules がインポートされると、データ収集が自動的に開始されます。
パッケージ内のLogicModules
表示名 | タイプ | 説明 |
Nvidia_SMI_SSH | データソース | Nvidia-SMI からの GPU メトリック。 |
カテゴリー_Nvidia_SMIを追加 | プロパティソース | Nvidia-SMI をサポートする Nvidia GPU を使用して、Windows および Linux ホストを識別しようとします。 |
このパッケージの DataSource によって追跡されるさまざまなメトリクスに静的なデータポイントのしきい値を設定する場合、LogicMonitor はテクノロジー所有者のベスト プラクティス KPI 推奨事項に従います。
推奨事項: 必要に応じて、環境固有のニーズに合わせてこれらの事前定義されたしきい値を調整します。 データポイントのしきい値の調整の詳細については、を参照してください。 データポイントの静的しきい値の調整.