NTPの監視。 そして、なぜそれが重要なのか…

英国の勇敢なサポートエンジニアのXNUMX人であるAntonyHawkinsによるゲスト投稿。

「自分が抱えているとは知らなかった小さな問題をキャッチします(大きな問題が発生する前に、対処したくない)。」

これで、エステート全体でNTP階層を構成してテストし、すべてのデバイスを同時に実行できるようになりました。 あなたは今それを放っておくことができます、それが働いているという知識で安全です。
できませんか?

時が経つ-1415573-m

最近、顧客から連絡があり、以前にNTPセットアップが構成されて正しく機能していたときに、LogicMonitorが不動産の一部でNTPアラートの生成を開始した理由を問い合わせました。

確かに、LogicMonitorは、一部のホストにはNTPピアがないことを報告していましたが、それらのホストには明らかにntpd.confファイルにピアが設定されていました。

さらに調査したところ、ホストにはピアがありましたが、ピア自体が偽のティッカーであると宣言されることがありました。 特定のホストのすべてのピアがfalsetickerと宣言されたとき、ホストは、時報を取得するための有効なピアがないことを非常に正しく報告しました。 次に、LogicMonitorは「ピアなし」アラートを発生させました。NTPの実行中、選択プロセスに合格したピアはありませんでした。

LogicMonitorはホストから収集された情報のみを報告していたため、XNUMX分ごとにすべてのホストのNTP応答を手動でチェックし、探しているものがわかっていれば、偽の応答を手動で見つけることができたはずです。 ただし、私のような人であれば、何か問題が発生した場合に備えて、XNUMX分ごとに不動産全体のNTP構成と応答を確認する時間がない可能性があります。

このNTP同期の喪失は重要ですか? それは確かにできます。 異なるシステム間でログエントリを相互に関連付けようとしている場合、共通の時間設定を共有しない限り、これは事実上不可能です。 正しい時間が失われると、SSL証明書が検証に失敗したり、VPNが壊れたり、あらゆる種類の陰湿な問題を見つけるのが困難になる可能性もあります。

無し 自動監視、マシンが他の不動産と十分に同期しなくなり、他の問題を引き起こすまで、たとえばビジネスクリティカルになるまで、問題があったことはわかりません。 データベースアプリケーション。 これらの重要なアプリケーションで問題が発生し始めたら、NTP階層全体を最初にチェックしますか? 設定して忘れてしまった場合、おそらくそうではありません。 しかし、それがモニタリングの目的です。したがって、より戦略的な問題に集中でき、モニタリングによって必要なときに問題が警告されることを確信できます。