logo

Apache Sparkの市場調査の結果、ユーザー数に加え、探索的データサイエンスや機械学習などの新たなワークロードにおける利用拡大が明らかに

クラウデラ 2016年11月08日 14時40分
From PR TIMES

回答者の57% が最も重要なユースケースに向けたSpark プラットフォームとして、Clouderaを選択していると回答

米国カルフォルニア州パロアルト - 2016年11月8日発: ビッグデータに対するApache Sparkの利用状況を詳細に理解するために、Taneja Groups主導の下、世界のビッグデータに関与する技術者および管理職約7,000名を対象にした大規模な調査が実施されました。本調査には大きな反響があり、Sparkの採用や導入状況、直近の認識、好感を持っているベンダー、またSparkの将来性などに関する調査結果が得られました。今回の調査プロジェクトは、Apache Hadoopと最新のオープンソーステクノロジーをベースに、最も高速、簡単、そしてセキュアなデータ管理および分析のためのプラットフォームを提供するClouderaがスポンサーとなって実施され、本日その調査分析結果が発表されました。

CDHの一部として統合され、Cloudera EnterpriseがサポートしているSparkは、柔軟なインメモリデータ処理のオープンスタンダードとして、Apache Hadoopプラットフォーム上でのバッチやストリーム処理、高度な分析機能などを可能にしています。

Taneja Groupのシニアアリスト兼コンサルタントのであるMike Matchett氏は、次のように述べています。「Apache Sparkは、先端のビッグデータオープンソースプロジェクトに急速に取り込まれています。業界や企業規模を問わずビッグデータは成熟レベルに達しており、回答者の半数以上が既にSparkを積極的に活用しています。また、既にSparkを使用している回答者の64% が、今後12ヶ月でその適用を大幅に拡大したいとしています。分析でリアルタイムデータストリーミング処理が必要なワークロードや、機械学習アプリケーション、さらにデータサイエンスの採用が増えるにつれ、Sparkの存在感も増しています」

ClouderaのSparkにおけるリーダーシップ

Clouderaは、2014年にSparkの出荷とサポートを開始した最初のHadoopベンダーであり、これが高速バッチ処理のためのフレームワークの選択肢の1つとなってきました。現在では、多くのClouderaユーザーが、業務向けシステムのMapReduceをSparkに移行し、データ処理の範囲を大幅に拡大しています。調査結果からも、この拡大傾向が明らかになっています。

Clouderaのお客様は、Hadoopの標準的なバッチ処理エンジンとしてエンタープライズ規模でSparkを導入する際には、専門家の関与が必要だとしています。Clouderaでは、引き続きOne Platform Initiativeによって、Sparkの管理機能、セキュリティ、拡張性、ストリーミング処理、クラウド対応などの面で機能強化を図っていきます。これらの取り組みを通じてClouderaは、分析ワークロードのためのデフォルトのバッチ処理エンジンとして、対象エコシステムがSparkを採用できるようにすることを確約しています。

Clouderaでは、各パートナーと協力しながら、Spark上の新しいソリューションを構築し、これまでとは異なるソリューションの素早い市場展開に必要となるリソースやサポートを提供することで、お客様が新しいチャレンジングなユースケースにも対応できるようにします。

調査結果

2016年10月実施の「Apache Spark Market Research Study」の調査研究結果によれば、当初予想していたバッチ処理やデータエンジニアリング、ETLワークロード以外でもSparkの利用が進み、将来のクラウドへの導入をにらんだものとなっています。さらに次のような調査結果も得られています:

● 約半数となる54%の回答者が、既にSparkを積極的に使用しています。Sparkを使用中の64%が非常に有益であると回答し、今後12ヶ月間でさらに利用を拡大したいと回答しています。
● 新規のSpark導入も進んでおり、ビッグデータプロジェクトの経験がある10人に4人が、近々にSparkの導入を計画していると回答しています。
● Sparkユーザーの57% が、Clouderaの提供するSparkに依存しており、最も重要なユースケースの場合、この数値はApache Hadoopを提供するClouderaに続くベンダー3社を合わせた数値の2倍以上となっています。複数のソリューションの中からClouderaを選択したお客様は、規制に対応可能なセキュリティ機能やガバナンスモデル、製品の安定性やパフォーマンス、クラウドへのポータビリティ、また、データ処理やクエリ、分析、機械学習など相互機能連携などをその主な選定理由としてあげています。
● Sparkは、当初の予想通り、バッチ処理やデータエンジニアリング、ETLといったワークロードでの使用が55% を占める一方、Sparkへの取り組みの上位には、リアルタイムのストリーミング処理、探索的データサイエンスに加え、Sparkを機械学習に応用する例が急速に伸びています。これらはまさにClouderaが継続的に注力している分野に一致します。
● 導入における壁や課題が残っていることは事実ですが、その多くは、ビッグデータとのスキルギャプを様々な形式のトレーニング(オンライン、教室形式、カンファレンスやトレードショー)によって埋められるかどうかという問題です。Clouderaは、プロフェッショナルサービスやコンサルティング、多彩なパートナーなどを通じて、さらに多くのSparkプロフェッショナルの育成を支援しています。

Clouderaの創業者兼最高戦略責任者 (CSO)であるMike Olsonは、次のように述べています。「Clouderaは、エンタープライズ対応でリーダーシップを取ることに注力しており、これらのお客様に不可欠なセキュリティやデータガバナンス、コンプライアンスなどの機能を提供しています。本調査結果は、現在、完全なエンタープライズ対応であることの重要性や、将来想定されるSparkのユースケースにもClouderaなら対応できるという事実を裏付けるものとなっています」

今回の調査では、パブリッククラウドとSparkの高まる役割についても、詳細に報告しています:

「興味深いことに、現在はSparkをオンプレミス環境に導入するケースが大半を占めていますが、将来はその多くをクラウド環境に移行することにユーザーは大きな関心を示しています。Sparkをパブリックあるいはプライベートクラウド (IaaSまたは PaaS) に導入する割合は、現在の23% から将来は36% へと急速に拡大する見込みとなっています」とMatchett氏は述べています。

追加情報は、以下でご覧いただけます

● The Apache Spark Market Research Studyのダウンロード
リンク
● Spark 2.0 Beta Parcel のダウンロード
リンク
● Clouderaのデータエンジニアリングについて
リンク

###

Taneja Groupについて

Taneja Groupは、専門特化型のアナリスト機関として、テクノロジー産業に向けた分析業務とコンサルティング業務を提供しています。Taneja Groupの調査とガイダンスは、テクノロジーベンダー、ITエンドユーザーおよびベンチャーキャピタルを対象にしたものです。Taneja Groupのアナリストは、ストレージ全般、サーバー仮想化、WAN最適化、ストレージとアプリケーションの高速化、eDiscoveryおよびコーポレートガバナンス、クラウドストレージ、ビッグデータとデータセンターの統合などの分野をカバーしています。データセンターは本質的な変化の途上にあり、Taneja Groupのアナリストは、どのようなテクノロジーが重要であり、また最大の効果を発揮するためにはどのタイミングで導入すべきなのかなど、クライアントの最前線に立ってアドバイスを提供しています。eDiscovery の分野では、訴訟ワークフローに限らず、ガバナンスやコンプライアンス、記録管理、データ維持管理といった関連ビジネスプロセスもカバーしています。

Clouderaについて

Clouderaは、Apache Hadoopや最新のオープンソーステクノロジーに基づく、今の時代に則したデータ管理や分析のためのプラットフォームを提供する企業です。世界の名だたる企業が、Clouderaの高速で容易に扱うことができる、優れたセキュリティ機能を持つデータプラットフォームであるCloudera Enterpriseを利用し、もっとも困難な業務課題の解決にあたっています。Clouderaのカスタマーは、膨大な量のデータを効果的に収集、ストア、処理、分析し、高度な分析機能に応用することで、以前では成し得ないほど迅速で柔軟な業務上の意思決定を、低コストで実現しています。またClouderaは、カスタマーの確実な成功を支援するため総合的なサポートやトレーニング、プロフェッショナルサービスを提供しています。

Clouderaの情報は下記よりご覧いただけます
Clouderaについて:www.cloudera.com/about-cloudera.html
ブログ:www.cloudera.com/blog and www.vision.cloudera.com
Twitter: www.twitter.com/cloudera
Facebook:www.facebook.com/cloudera

Cloudera、Cloudera’s Platform for Big Data、Cloudera Enterprise Data Hub Edition、Cloudera Enterprise Flex Edition、Cloudera Enterprise Basic Edition、Cloudera Navigator OptimizerおよびCDHはCloudera Inc.の米国および他国の管轄権における商標または登録商標です。その他の社名および製品名は一般に各社の標章または商標です。

【報道関係者の方からのお問い合わせ先】

Cloudera株式会社
マーケティング&PR:風間
press-jp@cloudera.com

プレスリリース提供:PR TIMES リンク

本プレスリリースは発表元企業よりご投稿いただいた情報を掲載しております。
お問い合わせにつきましては発表元企業までお願いいたします。