DevOpsの異常検出

DevOpsの異常検出

機械学習の異常検出により、より優れた可観測性を実現します。

今日のDevOpsチームは、急速な成長とcに挑戦しています。インフラストラクチャの複雑さ。 静的なしきい値のみを介してこれらの環境を管理することは不十分になるため、この問題に対処するために、最新のDevOpsチームは高度なML / AIアルゴリズムに依存しています。 

LogicMonitorの異常検出ソリューションは当社の一部です AIOps早期警告システム コンテキスト、意味のあるアラートを提供し、パターンを照らし、先見性と自動化を可能にします。 これらはすべて、ML / AIアルゴリズムやパラメーターにさらされることなく、自動的に実行されます。

この記事では、以下について説明します。

少しの歴史

人工ニューラルネットワークへの第一歩は、1943年にウォーレンマカロックとウォルターピッツがニューロンの仕組みに関する論文を書いたときに始まりました。 彼らは、電気回路を備えた単純なニューラルネットワークもモデル化しました。 

数学的アプローチを使用して時系列の変化を記述するために使用される他のアルゴリズム(たとえば、GeorgeBoxとGwilymJenkinsによるARIMAモデル)は、1970年代に開発されました。  

これにより、計算能力が得られたのはここ数年(GPUがニューラルネットワークのトレーニングに使用され始めた2009年)であり、利用可能な大量のデータがモデルの効率的かつ正確な学習に重要な役割を果たしました。

DevOpsチームの主なユースケースは何ですか?

LogicMonitorでは、異常検出のXNUMXつの主な使用例を特定します。

  • 予測する 問題が発生する前に(重大な問題を防止します)。
  • 抑制する アクションを実行する必要のない問題に関するアラート(ノイズリダクション)
  • 解決します 発生した問題、次のような質問への回答
    • この問題は異常ですか?
    • 信号は最後の日/週とどのくらい異なりますか?
    • 環境の変化は何ですか? 
異常を検出するLogicMonitorプラットフォーム。

元の時系列をXNUMX日の設定(オレンジ)および予想範囲と比較する

適切な異常検出アルゴリズムを自動的に選択

いくつかの異常検出技術が文献で提案されています。 人気のある手法には、フォレスト、テンソルベース、相関ベース、ニューラルネットワーク、ベイジアンネットワーク、および相関ルールと頻繁なアイテムセットからの逸脱があります。

LogicMonitorでは、プラットフォームがストリーム内のデータを処理し、システムの俊敏性を維持して、適切なアルゴリズムをすばやく調整して使用できるようにします。 DevOpsエンジニアはデータサイエンティストになる必要はないと私たちは信じています(私たちは数人を雇いました)。 私たちのプラットフォームはあなたのために大変な仕事をするはずです 

競合する多くのモニタリングプラットフォームでは、DevOpsチームが特定のパラメーターを入力する必要がありますが、LogicMonitorはこの負担を取り除き、次の質問に自動的に回答します。 

  • どのリサンプルアルゴリズムを使用しますか?
  • 正しい標準偏差は何ですか?
  • 毎日、毎週、または季節性に合わせて調整するにはどうすればよいですか?
  • ARIMA / SARIMAを使用する必要がありますか?
  • 夏時間やタイムゾーンに注意する必要がありますか?

ワークロードは自動的に分類され、データポイントごとにモデルが学習および調整します。 トランスフォーマーは、季節性、シフトなどを処理するために使用されます。実装されると、モデルのウォームアップ時間は次のようになります。

  • 12.5時間–非対称偏差を自動的に識別します。
  • 12.5時間-シェルフトランスフォーマーと振幅トランスフォーマーに基づいて変化率を自動的に識別します。
  • 2.5。XNUMX日–毎日の季節性を発見します。
  • 9日–毎週の季節性を発見します。 
季節性の変化を自動的に検出するLogicMonitor異常検出。

注:毎日の季節性は2.5。XNUMX日後に自動的に始まります

異常検出を設定するときにユーザーが知っておくべきこと

異常検出を設定するとき、ユーザーはML / AIアルゴリズムパラメーターにさらされるべきではありません。 アルゴリズムの感度の調整は、簡単な英語で説明する必要があります。  

簡単な用語を使用してLogicMonitorでしきい値を設定します。

まれにチューニングが必要になる場合もありますが、デフォルトではユーザーに負担をかけず、99.9%のシナリオで回避することを哲学としています。