logo

メタデータ、専門画像認識のための学習済ディープラーニング(DL)システムを提供開始

人間の認識能力を凌駕する第一弾「この猫なに猫?」API&アプリを提供。併せてDLトレーニング請負事業を開始。

メタデータ株式会社(所在地:東京都文京区 代表取締役社長:野村直之)は、人間の認識能力、識別能力を凌駕する専門画像認識のための学習済ディープラーニングシステムを提供開始いたします。第一弾は、入力画像の猫の種別を、世界の猫約60種類のどれであるかを認識して言い当てる、「この猫なに猫?」Webサービスです。リクルートホールディングス主催のMashup Award 11、KDDI∞ラボ9期の参加者様他へ向けて、従来のテキスト解析系API群に加えて、「この猫なに猫?」WebサービスとAPIを提供いたします。今後、利用目的に沿った適切な方法で、高品質のトレーニング用画像を適切に収集、選別し学習させて特急研究開発で納品する手法等、ディープラーニングの性能を引き出すノウハウをもって、ITコンサルティング会社、代理店、SIerと業務提携することにより、向こう3年間でディープラーニング(DL)トレーニング請負を核とした100システム程度の受注を目指します。

■「この猫なに猫?」Webサービスの概要
 近年、人工知能復活の原動力となったディープラーニング(DL)は、大量の生データを教師(正解)データとしてトレーニングするだけで急速に、他方式を凌駕する精度と実用性を獲得するに至りました。「一般物体認識」「特定物体認識」「物体照合」「物体検出」「画像分類」「シーン理解」等、さまざまな画像認識・理解の課題がありますが、数10~数100の品種を識別する「専門画像認識」の課題は、容易に一般人の能力を凌駕し、様々な問題解決やエンターテインメントに役立つ点で魅力的です。その第一弾「この猫なに猫?」Webサービスは、アップロードされた猫が世界の猫約60種類のどれであるかを高い精度で回答します。図のように、確率値とともに上位5種を、様々な属性情報とともに回答します。Web上で1秒未満の応答時間です。

 ちなみに東京在住の被験者10名に左の入力画像を見せて、「アラビアンマウ」と即答できた人はゼロ名でした。数千、数万程度の画像とその正解情報を元に学習させる所要時間は、5Tflops (2000個近い演算ユニットで1秒に5兆回浮動小数点演算)の計算機で1~10時間程度。高精度を達成する正解データを効率よく整備するのに、弊社の独自ノウハウとデータ加工技術を投入しています。
■ 「専門画像認識タスクのためのDLトレーニング請負事業」の優位性

2012年以降、ディープラーニング(DL)による画像認識が、より高コストの従来方式よりも精度面で圧勝するようになり、2015年から本格的な産業応用が始まりかけています。神羅万象のイメージを認識する汎用の画像認識は、「人の顔」か「猫」かなどの荒い識別ができるに留まるケースが多く、また、人をゴリラと誤認識するなど、大きく外した認識が問題を生じることもありました。また数百万、数億枚の画像とその名前の組を正解データとして集めるコスト、チューニングのコストが見えにくい、という問題点がありました。

 これに対し、例えば草木か花か犬か茸か人面であるかが既知の状況で、その品種、名前、出身の違いを識別するなどの専門課題は、多くの人にとっても知識不足で正答が難しいこともあり、100名を超える潜在ユーザの多くから「使ってみたいサービス」との評価を受けています(マクロミル社『ミルトーク』を活用)。「この猫なに猫?」Webサービスは、人の顔をアップロードすると「アビシニアン43%、シャム17%・・」のように、科学的根拠に基づいて回答します。そこで、実用性に加え、ゲーム性、ソーシャル要素を兼ね備えたサービスの構築も有望です。

 ターゲットとする具体的な課題やビジネスモデルについて、クライアント企業、コンサルティング会社、代理店、SIerと議論を詰めることで市場性は十分に拡がります。データの選定、高い精度を出すためのチューニングに独特のノウハウを要したり、若干のモデルの拡充(画像特徴のごく一部や属性、状態変数をメタデータとして事前に抽出してパラメータ化)が求められることはありますが、弊社代表(元MIT人工知能研究所)や東京のトップクラス大学院の人工知能研究室在籍の弊社スタッフが、国際学会の最先端ノウハウをアレンジして取り込むことで個別の問題を迅速に解決することが可能です。

 開発期間が短く、評価結果に基づいてデータを何度も入れ替えて試行錯誤し、改良可能なことで、応用ビジネスにとって重要なPDCAサイクルを沢山回すことができます。

なお、第一弾「この猫なに猫?」のWebアプリ、WebAPIは、リクルートホールディングス社メディアテクノロジラボ主催のMashup Award 11ならびに、KDDI∞Labo第9期プログラム参加企業向けに、マッシュアップ・アプリ、ハードウェア開発の素材、部品ソフトウェアとして提供いたします。また、今月末頃発刊予定の日経ビッグデータ関連ムックにて、弊社代表野村が「この猫なに猫?」の認識プロセスの概要を解説、執筆しています。

このプレスリリースの付帯情報

メタデータ、専門画像認識のための学習済ディープラーニングシステムについて

(画像をクリックすると拡大画像をご覧いただけます。)

用語解説

◆メタデータ株式会社について
メタデータ株式会社は、2005年12月にメタデータ活用技術、セマンティック技術の応用ソフトウェア会社として設立。テキスト意味解析技術を駆使した、5W1H抽出によるコンテンツ連携や個人情報の自動匿名化や、評判分析(ネガポジ・感情解析)、風評発見・監視ソリューションなどを、大手都銀様等向けに、SaaS、クラウド向けアプリケーション、APIとして開発・提供してまいりました。最近は、ビッグデータ解析、分析エンジンやマッチングエンジンを構築し、顧客の声(VoC)、マーケティングや広告マッチング最適化等をソフトウェアで強化、支援しています。人工知能アプリとしては、資料送信や予約まで自動で行えるソフトウェア・ロボット"Web受付嬢"から、機械学習、人工知能による意味・文脈解析を行う高度テキストマイニングまで、開発・提供しています。

本プレスリリースは発表元企業よりご投稿いただいた情報を掲載しております。
お問い合わせにつきましては発表元企業までお願いいたします。

今日の主要記事