logo

EMC Greenplum、開発者およびデータ・サイエンティスト向けにコミュニティ版「ビッグ・データ」ツールを無償で提供

無償提供のEMC Greemplum Database Editionと
オープンソースの分析アルゴリズムのMADlib、および Alpine Miner Visual Modelerが
業界全体にわたるデータ・コラボレーションを可能に

EMCジャパン株式会社(略称:EMCジャパン、本社:東京都渋谷区、
代表取締役社長:山野 修、URL:リンク)は、本日、業界をリードする、高性能な超並列処理(MPP)製品「EMC(R) Greenplum(R) Database」のコミュニティ版ソフトウェア、および分析アルゴリズムとデータ・マイニング・ツールを無償で提供すると発表しました。
当該ソフトウェアは、 リンク からダウンロードすることが可能です。

昨年12月に発表の「EMC Greenplum Data Computing Appliance」に加え、新しいEMC Greenplum コミュニティ版により、多くの開発者、データ・サイエンティスト、その他のデータ関連の専門家は、「ビッグ・データ」を処理するための強力なツールを手軽に利用できるようになります。
無償提供のツール・セットにより、コミュニティは、自らのデータをより良く理解し、さらに深いレベルの情報の取得および可視化ができるだけでなく、次世代のツールやソリューションの開発に参加、貢献することが可能となります。
開発者は、「Greenplum Database」とデータベース内の分析処理機能を含む最高クラスのビッグ・データ用ツールやコミュニティ版ソフトウェアを活用することで、ビッグ・データの収集、分析、オペレーション化のための複雑なアプリケーションを構築することができます。

Greenplumの共同創設者で、EMCデータ・コンピューティング部門担当CTO兼バイス・プレジデントであるLuke Lonerganは以下のようにコメントしています。
「EMCの新しいコミュニティ版ソフトウェアは、未だかつてない速さでビッグ・データを完全並列処理(parallel-everything)し、実環境のデータを用いた次世代データ分析や実験を可能とするだけでなく、業界に革新をもたらすことができます。
また、無償コミュニティ版の提供は、開発者を支援するプロジェクトであり、開発者は、最も人気のあるツールを用いてプログラミングでき、オープンソースへのさらなる貢献の場を持つことができます」。

EMC Greenplumコミュニティ版には以下のものが含まれます。
1) Greemplum Database CE :大規模な分析および次世代のデータ・ウェアハウジングのための業界最先端の超並列処理(MPP)データベース製品
2)MADlib(magnetic, agile and deep):構造化および非構造化データの数学的、統計学的および機会学習法におけるデータの並列処理を可能にする、オープンソースの分析アルゴリズム・ライブラリ
3) Alpine Miner:業界で注目を集めるサード・パーティの分析ツール。
直感的なビジュアル・データマイニング・モデラーで、迅速にモデルリングからスコアリングまで行う。
データベース内の分析機能を活用した「ビッグ・データ」アプリケーション専用のツール

■コミュニティのメリット

EMC Greenplumコミュニティ版の初回のリリースは、Greenplumの利用経験の有無を問わず、
すべてのお客様を対象としています。
初めてのお客様は、総合的なビジネス分析専用の環境にアクセスすることができることになります。
デモ用データファイルの閲覧、変更、または拡張を通じ、Greenplum Database内で「ビッグ・データ」分析ツールを試すことができます。
既存のお客様は、「Greenplum Database CE」のアップグレード版と分析ツールをダウンロードすることで、自身の研究開発環境とのインテグレーションを図ることができます。

コミュニティ版は事前構成されたVMwareの仮想アプライアンスとしてダウンロード可能で、ラップトップやデスクトップ上で使用、あるいはお客様のマシン上にパッケージとして導入することができます。
お客様はどなたでも、Greenplum コミュニティ・フォーラムに参加し、サポートを受け、コラボレーション、アイデアを投稿することができます。
また、お客様が独自に開発した様々なアプリケーションの検証を行うことも可能です。

■MADlib環境について

MADlibは、拡張性のあるデータベース内分析のためのオープンソース・ライブラリで、構造化および非構造化データの数学的、統計学的および機会学習法におけるデータの並列処理を可能にします。
MADlibは、商業用、学術研究、オープンソースの開発の取組みを生かし、拡張性のある分析スキルの開発を幅広く促進するために設計されています。

■EMC Greenplum Databaseについて

「EMC Greenplum Database」は、汎用ハードウェア上に、リソースを共有しない(shared-nothing) 超並列処理(MPP)アーキテクチャを用いて、ビジネス・インテリジェンスおよび分析処理のためにゼロから設計されています。
データは、複数のセグメント・サーバに跨って自動的に分割され、各セグメントが
全データのうち特定部分を所有および管理します。
このリソースを共有しないアーキテクチャでは、全通信がネットワークのインターコネクトを通じて行われ、
ディスク・レベルの共有や解決が必要な競合問題は発生しません。
「Greenplum Database」に関し、詳しくはこちらをご覧ください。
www.greenplum.com/products/greenplum-database

■EMCジャパン株式会社について

EMCジャパンは、情報インフラの卓越したテクノロジーとソリューションの提供を通して、日本のお客様の情報インフラの課題解決をご支援し、あらゆる規模のお客様のビジネスの継続と成長、さらにビジネス価値の創造に貢献致します。
リンク

本件に関するお問い合わせ先
EMCジャパン株式会社  マーケティング本部 マーケティング・コミュニケーション部
広報マネージャ 武村綾、Tel: 03-5308-8888 (代表)/ 03-5308-8867(直通)
E-mail: japanpr@emc.com

###

EMC、EMC2、Greenplum、where information livesは、米国EMCコーポレーションの登録商標または商標です。
これらの商標は、日本または諸外国で商標登録等により、適用法令で守られている場合があります。
その他の製品の登録商標および商標は、それぞれの会社に帰属します。

本プレスリリースは発表元企業よりご投稿いただいた情報を掲載しております。
お問い合わせにつきましては発表元企業までお願いいたします。