31年2016月XNUMX日

このすべての集合体は私を満足させていません

リソースカードイメージプレーン

OK、エルビスは実際に「このすべての悪化は私を満足させない」と歌ったかもしれませんが、彼がデータ集約について言及していれば、私たちは王を満足させることができるでしょう。

開発者が長い間取り組んできたものを発表します。それは、独自の時系列データベース(TSDB)を使用してお客様の時系列データを保存することです。 なぜあなたは気にする必要がありますか? これは私たちを意味するので データを集約したりロールアップしたりする必要はもうありません。 データがXNUMX分間隔で収集され、過去XNUMXか月間のそのデータのグラフを見て、XNUMXか月前からXNUMX時間にドリルダウンすると、すべての個々のデータサンプルが表示されます。

以前は、他のほとんどすべての製品と同様に、データをラウンドロビンスタイルのデータベース(RRD)に保存していました。このデータベースには、日、週、月などの後にロールアップ間隔が事前定義されていました。 したがって、数か月前のデータを見ると、6時間ごとの平均を表すデータポイントがXNUMXつしか表示されない場合があります。 通常、これはそれほど重要ではありません。 より長い時間枠を見ると、通常、個々のデータポイントではなく、傾向に関心があります。

JavaプロセスによるCPUコアの使用状況のXNUMXか月のビューの次のXNUMXつの画像について考えてみます。

最初に古いRRDスタイルから:

スクリーンショットrrd

そして、新しいTSDBシステムから:

スクリーンショットTSDB

両方のグラフの形状は似ていますが、新しいTSDBグラフはRRDスタイルのグラフほど「滑らか」ではなく、TSDBグラフはデータピークをより適切に表現しています。 短い時間にズームインすると、XNUMXつの間にはるかに大きな違いが見られます。

TSDBブログ_画像3

RRDデータを拡大すると、数時間ごとにのみデータポイントが表示されます。

ただし、新しいTSDBを使用すると、特定の時間枠でのデータの基本的な粒度を確認できます。

2016 05-16-2.19.00 PMでのスクリーンショット


TSDBシステムは、ドリルダウンして任意の期間の生データを表示できることに加えて、相関やさまざまな視覚化方法など、展開するその他の優れた機能の基盤でもあります。

既存のオープンソースプロジェクトを使用する代わりに、独自の時系列データベースを作成した理由を知りたい人にとって、答えは、TSDBを使用すると、他の方法よりもはるかに高いパフォーマンスをニーズに合わせて達成できるということです。 間もなくリリースされる高スケーラビリティアーキテクチャの詳細については、しばらくお待ちください。ただし、最初のハイライトは次のとおりです。

  • 複雑なスキーマ操作をサポートする列指向のデータストア
  • 単一ノードで800K挿入/秒をサポート
  • 10:1圧縮比


このようなパフォーマンスの高いシステムをクラスターで実行することで、顧客ベースが劇的に拡大するため、インフラストラクチャを効率的に拡大し続けることができます。

TSDBは根本的な進歩であり、最大XNUMX年間(エンタープライズプランの場合)ロスレスデータストレージを可能にします。 また、今後さらに多くのエキサイティングな発表の基盤にもなります。 もっと来て!