Hadoop における HDF の役割は何ですか?-Apache-php.cn

Hadoop における HDF の役割は何ですか?

青灯夜游

リリース： 2020-09-09 10:37:06

オリジナル

10853 人が閲覧しました

Hadoop における HDF の役割は、大規模なデータ用のストレージを提供し、高スループットのデータアクセスを提供することです。HDFS は高いフォールトトレランスの特性を持ち、低コストのハードウェアに導入できるように設計されています。アプリケーションデータへの高スループットアクセスであり、非常に大規模なデータセットを含むアプリケーションに適しています。

Hadoop における HDF の役割は何ですか?

Hadoop は、Apache Foundation によって開発された分散システムインフラストラクチャです。ユーザーは、分散の基礎となる詳細を理解していなくても、分散プログラムを開発できます。高速コンピューティングとストレージのためにクラスターの力を最大限に活用します。

Hadoop は分散ファイルシステム (Hadoop 分散ファイルシステム) を実装しており、その 1 つが HDFS です。

HDFS は耐障害性が高く、低コストのハードウェアに導入できるように設計されており、アプリケーションデータにアクセスするための高いスループットを提供するため、大規模なデータセットを含むアプリケーションに適しています。 HDFS は POSIX 要件を緩和し、ファイルシステム内のデータへのストリーミングアクセスを可能にします。

Hadoop フレームワークの核となる設計は、HDFS と MapReduce です。 HDFS は大規模なデータのストレージを提供し、MapReduce は大規模なデータの計算を提供します。

HDFS

外部クライアントにとって、HDFS は従来の階層ファイルシステムのように見えます。ファイルの作成、削除、移動、名前変更などを行うことができます。ただし、HDFS のアーキテクチャは、独自の特性によって決定される特定のノードのセットに基づいて構築されます (図 1 を参照)。これらのノードには、HDFS 内でメタデータサービスを提供する NameNode (1 つだけ) と、HDFS にストレージブロックを提供する DataNode が含まれます。 NameNode が 1 つしか存在しないため、これは HDFS 1.x バージョンの欠点 (単一障害点) です。 Hadoop 2.x バージョンでは、2 つの NameNode が存在できるため、単一ノード障害の問題は解決されます。

HDFS に保存されているファイルはブロックに分割され、これらのブロックは複数のコンピューター (データノード) にコピーされます。これは従来の RAID アーキテクチャとは大きく異なります。ブロックのサイズ (デフォルトは 1.x の場合は 64MB、2.x の場合は 128MB) とコピーされるブロックの数は、ファイルの作成時にクライアントによって決定されます。 NameNode はすべてのファイル操作を制御します。 HDFS 内のすべての通信は、標準の TCP/IP プロトコルに基づいています。

関連知識の詳細については、PHP 中国語 Web サイトをご覧ください。

以上がHadoop における HDF の役割は何ですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。