Kubernetesモニタリングのトラブルシューティング
LogicMonitorのKubernetesMonitoring Integrationを正常にインストールできなかった場合は、次の手順を使用してトラブルシューティングを行ってください。
Helmインストールコマンドが成功しなかった場合:
- インストール中に、KubernetesRBAC対応オプションが正しく選択されていることを確認してください。 これは、クラスター内のRBACと一致する必要がある「enableRBAC」ヘルムチャート値を制御します(すなわち クラスタでRBACが有効になっていない場合、この値はfalseである必要があります)。
- LogicMonitor APIトークンが有効であり、十分な権限があることを確認してください。
- Argus&Collectorset-Controllerポッドのログを確認してください
Helmインストールコマンドは成功したが、クラスターが監視に正常に追加されていない場合:
- コレクターグループが追加されたかどうかを確認します。 そうでない場合は、提供されているLogicMonitorAPIトークンに問題がある可能性があります。 LogicMonitor監査ログを使用して、要求が拒否されたかどうかを識別できます。
- コレクターが正常にインストールされたかどうかを確認します。 コレクターグループが追加されたが、コレクターが正常にインストールされなかった場合は、APIトークンに問題がある可能性はありません。 Collectorのインストールメモリ要件が満たされていない可能性があります。そうでないことを確認してください。 コレクターが正しくインストールされていない場合は、Argus、Collectorset-Controller、およびCollectorポッドのログを確認することもお勧めします。
- OpenShiftを使用している場合、インストールを有効にするには、コレクターのサービスアカウントのパーミッションを上げる必要がある場合があります。 これは、次のコマンドを使用して実行できます(デフォルトの名前空間が使用されていることを前提としています)。ocadm policy add-scc-to-user anyuid system:serviceaccount:default:collector
Helmインストールコマンドが成功し、クラスターが監視に追加されたが、データ収集が機能していない場合:
- 最新バージョンのデータソースを使用していることを確認してください。 バグ修正と改善を含む新しいバージョンのデータソースを定期的にリリースしています。 新しいバージョンをインポートするには、を参照してください。 この記事
- 最新バージョンのデータソースを使用してもデータ収集が機能しない場合は、データソースを変更してKubernetes APIの応答とステータスコードを表示し、詳細情報を取得できます。 たとえば、次のスクリーンショットのように、ポッドデータソースを変更して、リクエストとレスポンスの情報を出力し、データ収集の試行中にKubernetesAPIが返すエラーを絞り込むことができます。 これは、データ収集が機能しない理由を特定するのに役立つ場合があります。

メモリ、CPU、およびエフェメラルストレージが原因でGKEでArgusおよびCollectorset-Controllerポッドをセットアップできない場合は、次の構成を使用します。
- Argus構成ファイルを使用して、コレクターのリソース制限と要求(メモリ、CPU、エフェメラルストレージ)を設定してください。
サンプルファイル:
statefulsetspec:
template:
spec:
containers:
- name: collector
resources:
requests:
cpu: 1000m
ephemeral-storage: 5Gi
memory: 2Gi
Argusのインストール中に次のgRPC接続失敗エラーが発生した場合は、次の手順を実行します:
level = warning msg =”gRPC接続の作成中にエラーが発生しました。 エラー:コンテキストの期限を超えました」argus_pod_id = debug_id = goroutine = 1 method = pkg / connection.createGRPCConnection watch = init
問題を解決するには、次の手順を実行します。
- 次のコマンドを実行して、ArgusPodシェルにログインします。
kubectl exec -it <argus_Pod_name> /bin/sh
- 次のコマンドを入力して、ArgusとCollectorset-Controllerポッド間の通信を確認します。
curl http://collectorset-controller:50000
- 通信に失敗してエラーが発生した場合は、内部ネットワークポリシーで設定されている制限のパラメータを確認する必要があります。