お使いのブラウザは最新版ではありません。最新のブラウザでご覧ください。

CNET Japan ブログ

「見ないためのカメラ」対談3 「カメラ」 後編

2007/02/13 19:00
  • このエントリーをはてなブックマークに追加

プロフィール

宮田拓弥

携帯電話向けアプリケーションの業界で、常に新しい製品・サービスを模索・開発してきた宮田拓弥氏(ジェイマジック株式会社代表取締役社長)が「ケータイ用アプリの未来」について考えていきます。
ブログ管理

最近のエントリー

前編はこちら

-------------------------------------
宮田 オリンパスさんは、カメラで撮影された画像の特徴点を抽出して、その内容を高い精度で認識する技術(PBR : Point Based Recognition) をお持ちですよね。ジェイマジックでも、楽天さんのフリーペーパー「楽天マガジン」から商品毎の携帯サイトにユーザを誘導するサービスや、看板からレストランの情報を検索するサービスのeyenowaグルメなどで利用させていただいております。実際に、屋外に設置されている看板のような対象物であっても90%程度という非常に高い精度で認識できています。そういう意味では、冒頭でお話しされた「撮った画像を使う」ということのうち「画像を認識する」ということはある程度実現できていると言えるレベルに近づいているのだと思います。今後はどのような開発の方向性をお考えでしょうか?

古橋 弊社のPBRが、ベースにしているシンクロリアリティの世界において「リアルタイム性」をどれだけ持てるかが今後の鍵になると考えています。つまり、瞬間、瞬間の情報を検索してその結果を表示するだけでなく、連続して表示してあげる。ユーザが空間の中でその瞬間でどのようになっているのかをリアルタイムにトラッキングしてあげたい。つまり、撮った看板がここにあるということは、あなたはここでそれを見ているから、こっちには何があるはずだよね、こっちには何があるよねと、写真の情報からそこまで引き出して表示をするところまで持っていきたいと考えています。この辺までが実際に実現できると、現実の空間に対して情報を引っ張ってきてオーバーレイして表示してあげることができます。そうすると、リアルな空間を動き回ることが今よりもきっと楽しくなるはずで、人間をもっと活動的にできると思っています。そのときに、キーになるコンポーネントが画像、映像、人間の視覚になってくるはずだと思っています。

宮田 今、弊社のeyenowaなどで実現しているのは、「画像(検索キー)→文字(検索結果)」というフローです。これでも、従来の「文字→文字 or 画像」というフローよりは、直感的なインターフェースになっていると自負していますが、これが「画像→画像」でしかもそれがシームレスに実現されるイメージですね。例えば、山で初めて見たおいしそうなキノコがたまたま毒キノコで、その右上に「食べるな注意!」と漫画のようなメッセージが見えるみたいな感じでしょうか。百科事典的な使い方や広告的な使い方など、今のプロセスよりも更に応用は広がりそうです。初めて見たキノコでも、それが焼いて食べるのがいいのか、煮て食べるのがいいのかがその場で分かると。確かに、現実空間での生活がより楽しく充実したものになりそうですね。

古橋 まさにそれが瞬間であればある瞬間の位置の復元だし、それが連続であればまさにそれがトラッキングで、もっと応用範囲が、それこそ車みたいなところとか、いろんなところに広がると思います。

宮田 先ほどの斎藤先生のGPSの話とつなげて、カメラも「センサー」として機能させることを考えると、ユーザの行動であるとか嗜好が把握できるということが改めて意識されますね。携帯電話を「センサーの塊」として考えるまた違うものに見えてくるような気がします

古橋 そのとおりだと思います。だから、カメラの画像から取れるリッチな情報はいっぱい取ってうまく使えばいいと思います。デジカメメーカーとして今後の「ネットワークデジカメ」というものを考える場合にも、カメラというセンサーがついたネットワークデバイスと捉えると面白いと考えています。

宮田 カメラ自体のハードウェア的な進化としては、今後どのようなことが期待されるのでしょうか?

斎藤 解像度という意味ではもうかなり十分なものかもしれないです、特にデジカメでは。後は明るさが重要です。コンピュータビジョンの研究をやっていても、単純に原理的に考えるとこうできるんだけどと思ってやってみると、ダイナミックレンジが少ないためにできないことってよくあるんですよね。一方で、明るさのことなんか言い出したら、それが表現できるデバイスがなきゃいけないからなかなか難しい。そこで、先ほどでたように「センサー」だと割り切ってしまうと、別にそんなデバイスがとか、表示系がなんてこと全く気にすることなくて、もっと解像度は無限に欲しいし、明るさのダイナミックレンジももっと欲しいし、あと時間軸方向の解像度というのももっと欲しい。人間が見るから動画のフレーム数も30分の1秒で十分だとなっていますけども、センサーだと思ったら、あれもう無限に細かければ細かいほどいろんな情報をとれますから。そうすると、逆に人間が追っかけられないような速い球も追っかけられるしなんていう話になってきます。

宮田 160キロの球でも止まって見えるような、超高速カメラみたいなイメージですね。そういった「人間より見えちゃう」カメラを携帯につけたら何ができるのでしょうか?

斎藤 今までのカメラの使い方は、写したものを人間に対して表示するだけだったからよかったけど、認識とかセンシングをしてその情報を表示するという方向に向いているとするならば、カメラはもっと性能が上がらなくてはいけなくなっちゃうんです。なぜなら、人間が見る必要ないわけだから。人間が知りたい情報をカメラは撮らなきゃいけないわけですね。

宮田 「見ないためのカメラ」ということですね。せっかく通信回線も3.5G、4Gとどんどんと太くなっていくのだから、ストリーミングとか動画共有というこれまでの「カメラ」の延長線上での発想から大きく転換して、「見なくてもいい」からひたすら大量の動画データをサーバに送って、画像認識・処理された結果がリアルタイムで返ってくるみたいなことですね。そういうカメラをみんなが持ったときのことを想像するといろんな使い道が考えられそうです。

古橋 ある種の「ライフログ」的な発想ですね。つまり、自分の目が見たすべての画像をカメラが記録していく。通常ライフログの議論は、撮るのはいいけど、いつ見るんだ? 、となっていました。つまり、撮影と同じだけの時間がそれを人が見るのにかかってしまうため、理論的に不可能というか意味がなかった。

斎藤 実際に最近のハードディスクレコーダーなんかでは、ユーザが録ったものを全部見ることは最初から期待していないですね。昔のVTRとは違って、もはや見るレートと記録のレートがもう完全に逆転してるわけです。そこで重要視されているのが検索機能、見たいものを探してきてくれる機能。

古橋 現状の検索はテキストをキーにしたものが多いですが、今後画像自体を解析して検索していくとすると、そのベースになるコンピュータビジョン自体が人間の処理を模倣するところを超えなていかないといけないですね。そうすれば、こうした本当に大量のデータから意味のあるデータを抜き出せるようになるはずです。

斎藤 先ほどのシンクロリアリティの話に少し戻ると、眼鏡にカメラがつくというのもこれからあると思います。自分の視野と同じ映像を記録しつつけて、それを何らかの形で共有する。

古橋 完全に眼鏡型ではないのですが、弊社でも研究所でテーマとしてはあって、何か細い棒みたいなのを眼鏡の脇に出して、ここにQVGAぐらいのディスプレーを見せてあげるとかいうのはやっています。これはあくまでディスプレーの側の話ですが、そこに一緒にカメラもつくようになれば、ほんとにライフログ的に人が見ているものは常に実は記録されていて、そこで見た欲しい情報だけがここにパッパッて出てくるとか、いろんな見せ方ができるようになるかもしれません。

宮田 私も個人的にウェアラブルディスプレーは気になるテーマなので、実現されたらすぐに買います(笑)。お二人のお話を伺っていて、これまでの「シーンをきれいに保存する」、そしてそれをベースに「コミュニケーションをする」という応用を超えたところに、今後のカメラデバイス、カメラ付き携帯の未来を感じますね。

古橋 もちろん一つの方向性として、例えば自分がきれいだと思う写真をアップして、その写真をほかの人が見たときに、その人もきれいと思って例えばコメントをつけてくれると、素直にうれしかったりしますよね。そういう人をつなぐというところに一つ価値があると思います。一方で、これまで議論してきたように、携帯のこの画面を通すと、違う世界が見えますよ、というようなとらえ方もできたらいいと思います。山へ行って、何か茂みを撮ったらポケモンが出てきたとかもでもいいのかもしれないです。見せ方として。ここを通して見ると、人間の生の目で見ただけじゃなくて別の世界が見えますという、そういう新しい世界があるような気がします。

----------------------------------------------------------------

 つい先日NTTドコモが、今年の秋からは全ての端末をHSDPA(3.5G)対応にすると発表しました。これを受けて、高帯域を前提としたゲームや動画配信など様々な新しいサービスの企画が進むことになると思います。
 今回、画像技術に主に研究開発のお立場から関わられているお二人との対談ということで、より巨視的な視点で、カメラそしてカメラ付き携帯の利用に関しての将来のお話をお伺いすることができました。可能性として語られたアプリケーションはかなりSF的なものも多かったですが、それぞれ技術要素としてはすでに存在しているものがほとんどなので、HSDPAのようなインフラやプラットフォームが進化してくれば、そう遠くない未来に実現が期待できるものです。
 カメラが撮影する画像というものをそのプロセスで分けると、「撮影」→「保存」→「検索」→「共有/配信」→「表示」という感じになります。現状は、まだ「手振れ補正」や「高画素」など、「撮影」のプロセスでの機能拡張に力が入っているようですが、折角ほとんどの消費者が持っているカメラがついたネットワークデバイスなので、今回話しのあったシンクロリアリティのような新しい「表示」方法などが実現し、写メールの世界をこえる「カメラ付き携帯 2.0」が実現される日の到来を期待したいものです。

※このエントリは CNET Japan ブロガーにより投稿されたものです。朝日インタラクティブ および CNET Japan 編集部の見解・意向を示すものではありません。
運営事務局に問題を報告

最新ブログエントリー

個人情報保護方針
利用規約
訂正
広告について
運営会社