logo

Cloudera、データサイエンティストのHadoop活用を より促進する新たなイニシアチブを発表!

クラウデラ 2015年07月24日 13時00分
From PR TIMES

~Python用の新しいプロジェクトIbis、およびWrangle Conferenceが、データサイエンスとビジネスインテリジェンスのギャップを埋める~

米国カルフォルニア州パロアルト - 2015年7月20日発: Apache Hadoop(TM) をベースとした企業向けデータ分析マネジメント分野のリーダーである Cloudera(本社:東京都中央区 カントリー・マネージャー:田村研三郎、米国本社:カリフォルニア州パロアルト、CEO:Tom Reilly)は本日、データサイエンティストのための新たなイニシアチブを発表しました。データ量が飛躍的に拡大し続ける中、データサイエンティストは今まで以上に、大量データの大規模な分析を確実に実行しなければならなくなっています。Clouderaの新たなイニシアチブによりデータサイエンティストは、複雑なワークフローでのデータ分析に、ビッグデータとHadoopをより有効に活用することが可能となります。

Cloudera Labsで誕生したオープンソースプロジェクトIbisにより、Clouderaは100% Pythonスタックでの高度なデータ分析を可能にし、HadoopでPythonによるネイティブな操作性を実現します。さらに、Hadoopを用いた学習環境を構築する業界リーダーとして、Clouderaは世界初のWrangle Conferenceを開催します。スタートアップから大企業まで、あらゆる企業におけるデータサイエンスの実践にフォーカスしたカンファレンスです。
Clouderaのソフトウェアエンジニアで、Python Pandasの開発者でもあるWes McKinneyは次のように述べています。「Hadoopは過去10年間にわたり、バッチ処理ツールから、今日のインフォメーションアーキテクチャと従来からのBIワークロードをサポートする包括的なエコシステムへと劇的な進化を遂げてきました。Clouderaはこの進化の波に乗り、Hadoopインフラストラクチャをデータサイエンティストにとってより一層アクセスしやすいものへと構築していきたいと考えています。そのために、PythonをHadoopエコシステムにより統合的に組み込むと同時に、Sparkの機械学習サポートを拡充し、データサイエンスの導入と実践にも注力しています」

Ibis
現代のデータエンジニアリングおよびデータサイエンスにおいて、Python言語は非常に重要です。また、複雑なワークフローへの対応が可能なPythonは、データ変換およびインタラクティブ分析の主要言語ともなっています。Pythonの開発はこれまでローカルでのデータ処理と小規模なデータセットに限られていたため、データサイエンティストはビッグデータを扱う際に数多くの妥協を余儀なくされていました。しかし新しいオープンソースデータ分析フレームワークのIbisを用いることにより、Pythonユーザーはついに、使い勝手やパフォーマンスに妥協することなくビッグデータを処理することが可能になります。
IbisのファーストバージョンはエンドツーエンドのPython操作性のほか、Impalaの分析機能の包括的サポートを提供し、ETL、データラングリング、およびアナリティクスの合理化を実現します。セカンドバージョン以降ではPythonフルパッケージと、Pythonを使った効率的カスタムロジックの活用が可能になります。Impalaとの統合により、Hadoop用MPPデータベースエンジンであるIbisは、ビッグデータに必要なインタラクティブ性能とスケーラビリティを実現します。
Wes McKinneyは次のように述べています。「ユーザビリティ、拡張性、および堅牢なサードパーティライブラリエコシステムを誇るPythonが、多くのデータサイエンティストにオープンソース言語として選ばれるのは当然でしょう。しかしPythonにも限界はあり、Hadoopスケールでは高性能を発揮できません。ClouderaはIbisにより、Hadoopのようなスケーラブルアーキテクチャで最高のPythonの使い勝手を提供すると共に、Pythonツールエコシステムへのフルアクセスを実現したいと考えています」
Ibisは、Hadoopコミュニティ&エコシステムの拡充を目指す新しいプロジェクトのインキュベーターであるCloudera Labs(cloudera.com/labs)でプレビューが可能です。IbisはApacheライセンスプロジェクトであり、オープンソースコミュニティ(github.com/cloudera/ibis)でもコントリビューターに公開されています。
詳しくは以下のIbisテクニカルビジョンをご覧ください。
リンク

Wrangle Conference(ラングルカンファレンス)
データサイエンティストは今、幅広い柔軟性と実用性を誇るHadoopでさまざまな難題に対処しています。この現状を踏まえ、ClouderaはWrangle Conference(ラングルカンファレンス)の開催を決定しました。スタートアップから大企業まで、あらゆる企業におけるデータサイエンスの原則・実践・導入をテーマに、1日だけ開催される業界イベントです。Facebook、Salesforce、Uberをはじめとする企業のデータサイエンティストが講演を行い、これまでに克服してきた最大の難題と、その過程で学んだことを参加者と共有します。サンフランシスコで今秋、10月22日に開催予定となっています。
カンファレンス(wrangleconf.com)への参加登録は現在のところ招待制となっており、近く一般向けの登録受付を開始する予定です。
ビッグデータテクノロジーは、データサイエンティストにとって欠かせないツールです。用途や課題の複雑度にかかわらず、また、ツールの好みにかかわらず、ClouderaはデータサイエンティストがHadoopをスムーズに活用できるようお手伝いします。

Clouderaについて
Cloudera は、業界初の Apache Hadoop™ 上のエンタープライズデータハブである、ビッグデータ向け統合プラットフォームで、エンタープライズデータマネージメントの変革を続けています。Cloudera は、すべてのデータを1ヶ所にストアし、処理・分析することで、既存の投資に対する価値を高めると同時に、全く新たな方法でデータから価値を引き出すための手段を提供します。保存、アクセス、管理、分析、セキュリティ、検索など、重要な業務データを扱う上で必要なソフトウェアを含む、エンタープライズデータハブに必要なすべてを提供できるのは、Cloudera だけです。また、Hadoop プロフェッショナルの有数の育成機関として、全世界で 40,000 名以上の人々を教育してきました。さらに、1,700名以上のパートナーとベテランのプロフェッショナル・チームが高い時間価値を提供します。エンタープライズデータハブを確実に稼動させるために必要となる、予知・予見的なプロアクティブサポートを提供できるのは Cloudera だけです。すべての業界の先端企業や世界中の公的機関で、Clouderaはその実務に活用されています。

▼Cloudera の情報は下記よりご覧いただけます。
・ウェブサイト : リンク
・ブログ : リンク
・Twitter : リンク
・Facebook : リンク
・コミュニティ:リンク
Cloudera、Cloudera’s Platform for Big Data、Cloudera Enterprise Data Hub Edition、Cloudera Enterprise Flex Edition、Cloudera Enterprise Basic EditionおよびCDHは、Cloudera Inc.の米国および他国の管轄権における商標または登録商標です。その他の社名および製品名は一般にその各社の標章または商標です。

【報道関係者の方からのお問い合わせ先】
Cloudera株式会社
マーケティング担当:木林
press-jp@cloudera.com

プレスリリース提供:PRTIMES リンク

本プレスリリースは発表元企業よりご投稿いただいた情報を掲載しております。
お問い合わせにつきましては発表元企業までお願いいたします。