logo

DWH専用DB「Greenplum」コミュニティ版が無償公開--ビッグデータアプリ開発へ

田中好伸(編集部)2011年02月08日 18時54分
  • このエントリーをはてなブックマークに追加

 EMCジャパンは2月8日、超並列処理(Massively Parallel Processing:MPP)アーキテクチャのデータウェアハウス専用データベース(DB)ソフト「EMC Greenplum Database」のコミュニティ版を無償で提供すると発表した。コミュニティフォーラムからダウンロードできる。

 今回のコミュニティ版は開発者やデータサイエンティストを対象にしている。この1〜2年で話題となっている“Big Data(ビッグデータ)”を処理するツールを手軽に利用できるとしている。提供されるのは「Greenplum Database CE」と分析アルゴリズムライブラリ「MAD(Magnetic, Agile and Deep)lib」、データマイニングツール「Alpine Miner」。MADlibは、構造化データや非構造化データを数学的、統計学的、機会学習法で並列処理するオープンソースソフトウェア(OSS)。Alpine Minerはビジュアルデータマイニングモデラーであり、モデリングからスコアリングまで行うという。

 コミュニティ版は、Greenplum Databaseの利用経験を問わずにすべてのユーザーを対象としている。初めてのユーザーでも総合的なビジネス分析専用の環境にアクセスできるという。デモ用データファイルの閲覧や変更、拡張を通じてビッグデータの分析ツールを試すことができるとしている。既存のユーザーは、Greenplum Database CEのアップグレード版と分析ツールをダウンロードすることで、自身の研究開発環境と統合を図れるとしている。コミュニティ版で提供されるGreenplum Database CEは、製品版と同じ機能を搭載している。

 コミュニティ版は、事前構成されたVMwareの仮想アプライアンスとしてダウンロードでき、ノートPCやデスクトップPC上で使用したり、ユーザーのPCにパッケージとして導入可能だ。ユーザーはGreenplumのコミュニティフォーラムに参加、サポートを受けられ、アイデアを投稿することもできるという。ユーザーが独自に開発したさまざまなアプリケーションを検証することも可能としている。

-PR-企画特集