logo

データマネジメントの新時代をリードするリアルタイムクエリを発表 〜Hadoopが、思考と同等の速度でより大きな問題に取り組む(Ask Bigger Questions)ための技術へと進化〜

Cloudera株式会社 2012年10月25日 16時43分
From PR TIMES

ニューヨーク州ニューヨーク - カリフォルニア州パロアルト - 現地時間2012年10月24日- 企業向けApache Hadoopのデファクトスタンダードを確立したリーダー企業であるClouderaは本日、ニューヨークで開催されているHadoop最大のイベント「Strata+Hadoop World」において、業界初となる真のHadoop用リアルタイムクエリエンジンを発表しました。この大きな技術進化により、業界トップの実績を誇るビッグデータプラットフォーム「Cloudera Enterprise」は、非構造化・構造化データ問わず、大規模スケーラブルシステムに存在するあらゆる形態のデータにおいて、バッチ処理の実行とリアルタイム運用の両方を可能にする初のデータマネジメント・ソリューションとなります。中央一元的なビッグデータプラットフォームを実現するというこの新しいアプローチは、経済活動および企業における大規模データ管理の方法を劇的に改善するものです。企業、組織では歴史上初めて、あたかも人間が思考と同等の速度で、同じシステム上にあるペタバイト規模のデータをリアルタイム処理できるようになります。

Ovumのプリンシパル・アナリストであるTony Baer氏は、「Hadoopを導入している主要企業の期待は、否応なく高まるはずです。企業は、これまでの既存のデータウェアハウスやBIインフラを利用するインタラクティブなクエリを実行するon-the-spot(即席)の分析に慣れきっています。Clouderaは、新しいImpalaのエンジンで強化されたリアルタイムクエリ機能により、パフォーマンスとアクセシビリティにおいて超並列SQLプラットフォームと同じレベルを実現すべく技術革新に励んでいます」と述べています。

Clouderaが発表したこの最新の技術革新、すなわち市場をリードするApache Hadoopプラットフォームの“バッチの先を実現する「Cloudera Impala」は、HDFS((Hadoop Distributed File System:Hadoop分散ファイルシステム))とHBaseのデータに対するApacheライセンスのリアルタイムクエリエンジンで、2年間の自社開発の末に誕生しました。Cloudera Enterprise RTQ(Real-time Query)は、Cloudera Impalaを本番環境で効率的に運用するために必要な管理・サポート機能を提供します。またキャップジェミニ・フィナンシャルサービス、Karmasphere、マイクロストラテジー、Pentaho、Qlikview、Tableauを含むClouderaのパートナーは、既にCloudera Enterprise RTQ by Impalaと自社ソリューションの検証を実施しました。

キャップジェミニ・フィナンシャルサービスのバイスプレジデント兼Business Information Management部門チーフソリューションストラジストのJojy Mathew氏は、「今日におけるグローバルビジネス力には、企業情報の分析と意思決定における方法論を変革するようなリアルタイムの意思決定、および市場を理解する力の必要性がますます必要になってきます。当社は、金融市場におけるBIMサービスおよびソリューションのリーダー企業として、Impalaで強化されたCloudera Enterprise Real-Time Queryが、企業のビッグデータマネジメントのニーズにいち早く反応した技術であると確信しています。こうしたことにより、Clouderaが提供する進化したパフォーマンスとスケーラビリティを活用することで、これまでわれわれが開発してきたような製品、顧客、リスクマネジメントおよび金融などミッションクリティカルな分野における実証済みの幅広いビッグデータ・ユースケースを、今まさに統合しようとしています」と述べています。

マイクロストラテジーのエグゼクティブ・バイスプレジデントのSanju Bansal氏は、「マイクロストラテジーは、特にビッグデータクエリのより効率的かつ迅速な稼働において、企業を支援しています。Clouderaからの最新リリースを受け、マイクロストラテジーは、Cloudera Impalaがもたらす分析・パフォーマンス効果を引き出すため、クエリの最適化に取り組み始めました。経営層は、構造化・非構造化データを含めた全データからのより優れた意思決定を実現するため、マイクロストラテジーが提供する直感的な分析とデータ可視化技術を利用できます」と述べています。

真のデータ駆動型企業を実現
ビッグデータは、ビジネスにおいて絶対的に有利な条件となります。Clouderaの顧客企業100社に対して行った最新の調査によると、70%以上の企業が実際に主要なビジネス緊急課題として、ビッグデータから価値ある情報を引き出す方法を模索しています。この調査では、Hadoopの導入がもたらすビジネス上の効果として、IT運用の効率化と競争優位性を述べていますが、一方で78%の顧客が「Hadoopで稼働する高速なクエリが必要」という意見が寄せられました。

451Researchのデータマネジメント・分析部門のリサーチマネージャーであるMatt Aslett氏は、「われわれは、低コストストレージや大容量データの変換処理を安く実現したい企業によるHadoop導入が進む中、分析のためにHadoop導入が進むためには、Hadoopのスケーラブルな並列処理アーキテクチャの最大活用できる分析ツールが必要であるという高レベルな次元の議論をしてきました。Cloudera Enterprise RTQとCloudera Impalaについては、企業が既存のSQLスキルを活用し、Hadoopに蓄積された構造化・非構造化データに対するリアルタイム分析の秘められた可能性を実現するツールとして、重要なステップであると捉えています」との談話を発表しています。

Apache Hadoopは、オフラインのバッチ処理システムとして誕生しました。その後Hadoopは、インタラクティブにオンラインワークロードを処理するサービスへと拡張されました。その中での最初の取り組みは、分散型で表形式データストアであるHBaseの登場です。そして、Clouderaから本日発表された、リアルタイムワークロードのための新しいオープンソースプロジェクトであるImpalaは、Hadoopエコシステム用のスケーラブルな分散クエリエンジンです。この技術は、Impalaプロジェクトのリードアーキテクトであり、以前はGoogleのF1プロジェクトでクエリエンジンを共同設計していたMarcel Kornackerによって開発されました。Cloudera Impalaは、データウェアハウスよりも複雑なデータを処理できる柔軟なデータモデルを誇り、また業界標準のSQLにおけるインタラクティブなクエリ表現による効率性が特徴です。これにより、幅広くITおよびビジネスアナリストの方々が利用でき、HDFSおよびHBaseに格納された大規模データを、思考と同等の速度で処理します。

ExpediaのグローバルビジネスインテリジェンスおよびデータウェアハウジングプラットフォームのディレクターであるJeff Prather氏は、「当社ではCloudera Enterpriseを利用して4ペタバイトのデータを管理しています。Cloudera Enterprise RTQ by Impalaを追加することで、アーカイブやETL、分析用に分かれたシステムではなく、単一のビッグデータプラットフォーム上で処理を実現できるようになります。このHadoopの進化により、50%以上のレイテンシの削減のほか、以前は実現できなかった新しいビジネスインサイトサービスを実現できます」と述べています。

また、インフォマティカのCTOであるJames Markarian氏は、「インフォマティカとClouderaは、実証されたエンタープライズ向けHadoopデータ統合ソリューションを提供しています。Cloudera Impalaによるリアルタイムクエリが実現したことで、インフォマティカのリアルタイムデータ統合の処理スピードも向上し、企業や組織はこれまで以上に迅速にHadoopのリアルタイム分析を実行できるようになります」と話しています。

今やHadooo内でビジネスとITのリアルタイム対話が可能に
Clouderaのビジョンは、企業が「より大きな問題に取り組む(Ask Bigger Questions)」ことを実現し、構造化・非構造化の全ビジネスデータから、より偉大で役立つ答えを導き出せるように支援することです。Cloudera Enterprise RTQ by Impalaを発表することで、Clouderaはビジネスインサイトを駆動する唯一のシステムの姿を明らかにしました。Clouderaは、バッチ処理を超え、データ分析にかかる増加するコストを避けつつ、顧客企業に力を与え、ビジネスとITがHadoop内でリアルタイムに対話できるよう、ビッグデータマネジメントを簡素にしました。

ClouderaのCEOであるMike Olsonは「Apache Hadoopは、世界中の企業に対し、ビッグデータからの価値を解き放つことで、産業を変えていきました。今までは、MapReduceを利用したバッチ処理のため、いくつかのビジネス課題を解決するには処理が遅いというHadoopの限界がありましたが、本日発表したCloudera Enterprise Real-Time Query by Impalaにより、これらの課題解決が実現できます。Cloudera ImpalaはMapReduceを補完するもので、CLouderaの100%オープンソースのビッグデータプラットフォームに追加する最新コンポーネントになります。今や、Hadoop内の全データに対する強力な分析、また業界標準のツールやSQL言語を利用したリアルタイムクエリの両方を、同じハードウェア上で実行できるようになります。この画期的な新しいプロジェクトは、「すべてのデータに対しより大きな問いかけを行う」というClouderaのビジョンを実現する非常に重要なステップとなります。Cloudera Enterprise Real-Time Query by Impalaは、Hadoopプラットフォームにおける大きな進化であり、企業におけるビッグデータの可能性を大きく広げるものです」と述べています。

これまでの状況を変えるCloudera Enterpriseの進化ポイント:
・パフォーマンス:Hive/MapReduceより通常10倍以上のパフォーマンスを実現−ワークロードに応じ、さらなるパフォーマンス向上も可能−非−常な低レンテンシーと、柔軟なデータモデル。
・コスト抑制:ビッグデータの処理や探索、分析に必要となる増加インフラコストを90%抑制。コモディティハードウェア上で、オープンソースコミュニティベースの技術を稼働させることによる所有コストの削減。
・ビジネスデータのリアルタイムなインタラクション:Cloudera Enterprise RTQ(Real-Time Query):Hive/MapReduceで数分かかっていた応答時間を、ApacheライセンスのCloudera Impalaによりわずか数秒に短縮するという以前のHadoop上では実現できなかった方法により、ワークロードのユーザビリティを改善。

オープンソースコミュニティに対するClouderaの揺るぎないコミットメント
Clouderaは、オープンソースプロジェクトとしてのコミュニティにImpalaをコントリビュートすることに加え、Apache HBaseのトップエンジニアリングチームに、HBaseに焦点を当てて開発を続けていた主要な3人のコントリビュータを加えました。彼らはこれからHBaseとImpalaにフォーカスし、コミュニティに還元するよう開発を続けていきます。HBase Project Management CommitteeバイスプレジデントのMichael Stackを含む新しい3人のチームメンバーの追加により、企業向けのHadoop管理ベースのデータのリアルタイムクエリを実現・サポートする最新技術に対するClouderaの開発・提供体制が加速します。

「Clouderaのビジョンは、顧客に対し、HDFSとHBaseに格納されたデータを分析する際、MapReduceだけではないやり方を提示することです。われわれは、Cloudera ImpalaはHadoop以来の最もエキサイティングなオープンソースプロジェクトであると信じ、またHDFSとHBase内のデータを分析するためのフレームワークとして、MapReduceを超える最も重要なフレームワークであると確信しています。低レンテンシーを実現するために、苦難の道を歩み始めました:インメモリデータ上で非効率なクエリエンジンを単純に走らせるより、インメモリまたはオンディスクのいずれかに格納されたデータ両方にわたって低レンテンシーをもたらす効率的なクエリエンジンを開発するために奮闘してきたのです。Cloudera Impalaは、HDFSおよびHBaseと別のストレージ管理機構が不要というユニークな特徴を持ち、さらに、過去数十年にわたるデータベースシステム研究から学んだことを組み込むことで開発された、初のオープンソースである大規模な並列クエリ処理エンジンという、比類なき素晴らしさがあります。Clouderaは、データ取得、データクレンジング、レポーティングとアドホックなクエリワークロードを、単一なオープンソースシステム内で実行します。またCloudera Enterprise RTQ Powered by Impalaは、主要なパートナーのソフトウェアと統合している最中で、将来はバンドル版として出荷されるほか、実際に顧客の下で使われるようになってきています」と述べています。

<Clouderaについて>
Clouderaは、企業向けApache Hadoopの標準製品を提供し、「Ask Bigger Questions(TM)の実現、そしてまるで思考するような早さで、全データから偉大な回答を得る」というデータ駆動型企業を支援する企業です。ビッグデータ用プラットフォームのCloudera Enterpriseは、Cloudera Enterprise Real Time Queries powered by Impalaが搭載されたことで、構造化・非構造化データからビジネスバリューを簡単に引き出し、圧倒的な競争優位性をもたらします。経済活動やビッグデータマネジメントのパフォーマンスを再び革新しているClouderaは、Apacheベースのソフトウェア、トレーニングおよびサービスの分野のリーディングカンパニーです。Cloudera のディストリビューション「Cloudera’s Distribution Including Apache Hadoop (CDH)」は、商用・非商用環境を問わず、現在利用されている Hadoop ディストリビューションのうち、最も幅広く利用されており、ディストリビューションとしての完成度、技術検証を経た高い堅牢性に定評があります。CDH は、www.cloudera.com/downloads から無料でダウンロードできます。

また、ビッグデータ分析および以前は取り組めなかった“Big Questions”に応える本番環境システムで、オープンソースを確実・安全に使いこなすための最短の道として、「Cloudera Enterprise」を提供しています。Cloudera Enterpriseは、管理ツール「Cloudera Manager」と「Cloudera Support」で構成されたサブスクリプション形態で提供している製品です。このほか、コンサル ティングサービスや、業界内で唯一認定資格が取得できるApache Hadoopトレーニングを提供し、Apache Hadoopの開発と普及に貢献しています。Clouderaは、金融、官公庁、 通信、メディア、ウェブ、広告、小売、エネルギー、バイオインフォマティクス、製薬/ ヘルスケア、大学研究機関、石油、ガス、ゲーム業界などさまざまな業界において、何万ノードにわたる実績を持つApacheオープンソースコミュニティのトップコントリビュータとして、ビッグデータに関する業界トップの深い見識と専門性を備えています。


Clouderaの情報は下記よりご覧いただけます。
ウェブサイト(英語): リンク
ウェブサイト(日本語): リンク
ブログ(英語): リンク
Twitter(英語): リンク
Twitter(日本語): リンク
Facebook(英語): リンク
Facebook(日本語): リンク


<報道関係者の方からのお問い合わせ先>
Cloudera株式会社
マーケティング担当:木林
press-jp@cloudera.com
www.cloudera.com


プレスリリース提供:PRTIMES リンク

本プレスリリースは発表元企業よりご投稿いただいた情報を掲載しております。
お問い合わせにつきましては発表元企業までお願いいたします。

今日の主要記事