最近まで、Hadoopのデプロイは、組織が所有および実行するハードウェア上に存在していました。 もちろん、コンピューティングリソースとネットワーク接続を取得して、クラウドでHadoopクラスターを実行できるようになりました。 しかし、Hadoopをパブリッククラウドにデプロイすることには、単にマシンをレンタルするだけではありません。
このハンズオンガイドは、Hadoopに精通している開発者とシステム管理者に、クラウドで生まれたクラスターを効率的にインストール、使用、管理する方法を示しています。 落とし穴を回避するだけでなく、これらのサービスを最大限に活用するために、クラウドプロバイダー機能と連携するクラスターを設計する方法を学習します。 また、Amazon、Google、Microsoftのクラウドを比較し、それぞれにクラスターを設定する方法を学びます。
- Hadoopクラスターがクラウドでどのように実行されるか、それらが解決に役立つ可能性のある問題、およびそれらの潜在的な欠点について説明します
- コンピューティング機能、ネットワークとセキュリティ、ストレージなど、クラウドプロバイダーの一般的な概念を調べます
- クラウドインフラストラクチャ上に機能的なHadoopクラスターを構築し、主要なプロバイダーが何を必要としているかを学びます
- 高可用性、Hiveを使用したリレーショナルデータ、Sparkを使用した複雑な分析のユースケースを探る
- 価格とセキュリティの設計からメンテナンスの処理まで、クラウドクラスターを実行するためのパターンとプラクティスを取得します
