EMCジャパンは2月8日、超並列処理(Massively Parallel Processing:MPP)アーキテクチャのデータウェアハウス専用データベース(DB)ソフト「EMC Greenplum Database」のコミュニティ版を無償で提供すると発表した。コミュニティフォーラムからダウンロードできる。
今回のコミュニティ版は開発者やデータサイエンティストを対象にしている。この1〜2年で話題となっている“Big Data(ビッグデータ)”を処理するツールを手軽に利用できるとしている。提供されるのは「Greenplum Database CE」と分析アルゴリズムライブラリ「MAD(Magnetic, Agile and Deep)lib」、データマイニングツール「Alpine Miner」。MADlibは、構造化データや非構造化データを数学的、統計学的、機会学習法で並列処理するオープンソースソフトウェア(OSS)。Alpine Minerはビジュアルデータマイニングモデラーであり、モデリングからスコアリングまで行うという。
コミュニティ版は、Greenplum Databaseの利用経験を問わずにすべてのユーザーを対象としている。初めてのユーザーでも総合的なビジネス分析専用の環境にアクセスできるという。デモ用データファイルの閲覧や変更、拡張を通じてビッグデータの分析ツールを試すことができるとしている。既存のユーザーは、Greenplum Database CEのアップグレード版と分析ツールをダウンロードすることで、自身の研究開発環境と統合を図れるとしている。コミュニティ版で提供されるGreenplum Database CEは、製品版と同じ機能を搭載している。
コミュニティ版は、事前構成されたVMwareの仮想アプライアンスとしてダウンロードでき、ノートPCやデスクトップPC上で使用したり、ユーザーのPCにパッケージとして導入可能だ。ユーザーはGreenplumのコミュニティフォーラムに参加、サポートを受けられ、アイデアを投稿することもできるという。ユーザーが独自に開発したさまざまなアプリケーションを検証することも可能としている。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」
地味ながら負荷の高い議事録作成作業に衝撃
使って納得「自動議事録作成マシン」の実力