クラウド・データセンター用語集

用語集|Hadoop(ハドゥープ)

英:Hadoop

類:Apache Hadoop

Hadoopとは、大量のデータを手軽に複数のマシンに分散して処理できるオープンソースのプラットフォームです。大規模なデータ(ビックデータ)を効率的に処理し、管理する目的で開発・利用されており、誰でも無料で自由に利用することができます。

データ読み込みのスループットの最大化と、並列分散処理によるバッチ処理の高速化が特長です。

Hadoopは、大きく分けて次の二つの要素から成り立っています。

■分散ファイルシステム
HDFS(Hadoop Distributed File System)

■大規模データの処理を分散実行するフレームワーク
MapReduce

大規模データを効率的に扱えることから、国内外のWebサービスを提供する多くの企業においてHadoopを用いて大規模分散システムの構築がなされています。
例えばオンライン広告のアクセスログ解析や、販売データを用いて売れ筋商品を分析するときなどに使われます。

ちなみに、Hadoopという名称は、Hadoop生みの親であるDoug Cutting氏の娘が象のぬいぐるみにつけた名前が由来ということです。

    

用語集TOPへ戻る

このページの先頭へ このページの先頭へ