アマゾン、「Hadoop」を利用した「Amazon Elastic MapReduce」のベータサービスを開始

文:Larry Dignan(CNET News.com) 翻訳校正:中村智恵子、福岡洋一2009年04月03日 11時09分
  • このエントリーをはてなブックマークに追加

 Amazonの子会社Amazon Web Services(AWS)は米国時間4月2日、オープンソースのソフトウェアフレームワーク「Hadoop」を利用して大量のデータ解析を行う、新たなクラウドコンピューティングのベータサービスを開始した。

 「Amazon Elastic MapReduce」と呼ばれるこのサービスは、集中的なデータ処理を必要とする企業、研究者、アナリストを対象に開発された(発表資料)。HadoopはYahooなどの企業も採用しているが、Clouderaなどの新興企業はHadoopを企業データセンターとして利用するためのサービスを提供している。

 Amazon Elastic MapReduceは、同社の「Elastic Compute Cloud」(EC2)および「Simple Storage Service」(S3)上でHadoopを稼働させる。顧客はAmazon Elastic MapReduceを使って、ウェブのインデックス化、データマイニング、行動ファイナンス分析、シミュレーション、バイオインフォマティクスなどの処理を行い、利用したサービスの分だけ課金される。

 声明でAmazonは次のように記している。

 Amazon Elastic MapReduceは、ウェブ規模のインフラであるAmazon EC2上のHadoopソフトウェアによって実行されるデータ処理のジョブフローを作成する。このサービスは、顧客が数と種類を指定したAmazon EC2インスタンスを自動的に開始し設定する。続いて、MapReduceプログラミングモデルを実装したHadoopが実行され、Amazon S3からユーザーの入力データを大量に読み込み、細分化したデータをAmazon EC2インスタンスを使って並列処理する。処理が完了するとデータは再び結合され、最終的な回答にまとめられて、結果はAmazon S3に再び保存される。ユーザーはウェブサービスAPIもしくは「AWS Management Console」を通じて、ジョブフローを設定、操作、監視できる。

 大まかに言えば、データマイニングをわれわれのところでやろう、ということだ。

 MapReduceは別途サービスとなり、米国での価格は以下のようになっている。

Amazon Elastic MapReduce 提供:Larry Dignan

この記事は海外CNET Networks発のニュースをシーネットネットワークスジャパン編集部が日本向けに編集したものです。海外CNET Networksの記事へ

  • このエントリーをはてなブックマークに追加