お使いのブラウザは最新版ではありません。最新のブラウザでご覧ください。

CNET Japan ブログ

「携帯を持っていれば車がよける? 」対談3 「カメラ」 前編

2007/01/26 06:57
  • このエントリーをはてなブックマークに追加

プロフィール

宮田拓弥

携帯電話向けアプリケーションの業界で、常に新しい製品・サービスを模索・開発してきた宮田拓弥氏(ジェイマジック株式会社代表取締役社長)が「ケータイ用アプリの未来」について考えていきます。
ブログ管理

最近のエントリー

 これまで二回の対談では、今後携帯電話で実現されていくアプリケーションを考えていく上で重要な前提となる「収益モデル」を理解するため、現在モバイル業界に起きている「オープン化」や「無料化」の流れの中での「広告」「検索」の動きについて取り上げました。今回からは、少しずつ実際のアプリケーションやサービス、そしてその将来の可能性について取り上げていきたいと思います。
 今回のテーマは、「カメラ/画像」です。 2000年に当時のJ-Phoneが「写メール」というブランドで写真付きメールサービスを開始し、シャープ製のJ-SH04に11万画素のCMOSカメラを搭載したことで、「カメラ付き携帯」というジャンルが産まれました。そして、いまや国内で新たに出荷されるほぼすべての端末がカメラ機能を持つ時代になり、全世界で撮影される100億とも200億とも言われる写真の多くがカメラ付き携帯によって撮影されるようにまでなりました。


最初のカメラ付き携帯「J-SH04」

 カメラ付き携帯電話に関しては、最近の「高画素」や「手振れ補正」というように機能の点から通常のデジタルカメラと同列で語られる傾向にありますが、そのもともとの特性である「ネットワークにつながっている」という特徴から見てみることで、様々な新しいアプリケーションの可能性が見えてくると考えています。
 今回は、コンピュータビジョンを中心とした画像技術の専門家である慶応大学の斎藤英雄教授と、弊社の画像認識技術のパートナーで先日も楽天と「新しい携帯ショッピング」を共同で発表したオリンパスの古橋幸人氏との三者対談で、技術的な視点から、カメラ付き携帯で実現されるアプリケーションの可能性について議論しました。

-------------------------------------
宮田 まず、はじめに自己紹介をお願いします。

古橋 オリンパスは、ご存知の通り医療機器としての内視鏡や生物系の顕微鏡など、様々な用途で「画像を撮る」という部分に関しての製品を持っています。その次のステップとして「撮った画像を使う」ということ、中でも「画像を認識する」ということに研究として取り組んでいます。「画像」というのは、その撮影されたシーンやコンテキストも含めて非常に多くの情報が含まれているため、まず「何が写っているのか」をきちんと理解したうえでないと、その後「画像」にビジネス的な価値が産まれないであろうという認識が前提にあります。その上で、将来的に実現されるであろう「ネットワークデジカメ」などで様々な応用を想定していますが、現在はまず最も普及しているネットワークデジカメともいえるカメラ付き携帯電話の分野でビジネス化の可能性を模索しています。

斎藤 僕らは、カメラから入力される画像を使ってできることは何でもやります、という感じで研究しています。特に、カメラに写っているものを認識することで、3D情報つまり、物体の形状やカメラの動き、位置情報などを測定して、新しいメディアのインプット方法や表示方法を提案するというような研究をやっています。ここ10年以上の間の一つのメインテーマは、複数の画像から三次元の形状を出すことでどこの視点からの画像も作れる「フリービューポイントビデオ」です。以前から利用の可能性が言われていたCGや映画の分野では画像のクオリティーの問題がありまだ利用は進んでいないのですが、最近スポーツなどの生中継で大分使われ始めています。スーパーボールなどでは実際に2000年くらいからずっと使われていて、30台以上のカメラからの画像をハードディスクにためておいて、「じゃあ今のシーンを見てみましょう」というときに、普通のカメラでは追えないようなアングルでざっと追いかけてもっと面白いビューを提供するという使い方がなされています。現状はカメラのスイッチングに使われているだけですが、カメラとカメラの間を合成するとか、極端な話、カメラを並べてないこの辺からも合成できるなんていうことが本当に実現できてくると、いま私たちがやっている三次元ビデオと言っているようなものの一つの応用例として確立されてくることになると思っています。

宮田 お二方とも、大学と企業というそれぞれの立場から「画像の利用」に関して様々な研究をされていますが、携帯に限らずカメラ自体の数がどんどん増えている現状をどのように考えられますか?また、「カメラがネットワークにつながる」という視点で見たときに、今後どのようなアプリケーションや利用があるとお考えでしょうか。

斎藤 去年、Univ. of Washington とマイクロソフトがシーグラフで発表した「Photo Tourism」やそれをベースにマイクロソフトが開発した「Photosynth」などは面白い例だと思います。

Photosynth.JPG

 いまや世界中の人々が様々な場所で写真をとってサイトにアップする時代ですので、それらの画像を利用することでその対象物の三次元モデリングができてしまうという発想です。世界中の人が撮影したカメラの画像がネットワークを介してお互いに共有できる状況を考えると、パリの凱旋門くらい有名な場所であれば、仮想視点の画像や別の視点の画像などを作ることをしなくても、ありとあらゆる視点の画像が既にあるわけです。そうすると、あたかもぐるぐるぐるっと凱旋門の周りを眺めているような画像もつくれるということになります。
 これがリアルタイム性を増すと、まず自分が撮ったカメラの画像があって、その撮影対象がどういう三次元形状かが分かっていたとすれば、どの位置から自分がそれを撮っているかということが分かる。そうすると、自分が撮影をしてはいなくても、少しずれた視点からの画像やズームの写真をネットワークからもらってくれば、違う視点やズームで写真がその場で見られるということになります。
 私たちの研究の視点からすると、「撮影した画像から対象の三次元モデルを再構築する」という発想になってしまいますが、この発表は対象の三次元形状は分かっているものとするという割り切りをすることで、「たくさんの画像を集めて好きな形で自分で見る」という発想にしたところが面白いですね。

宮田 flickrなどでポピュラーになった「タグ」により部分的に実現されている「画像がつながる」というユーザ体験を、画像の「中身」を理解することによってより高度な形で実現するということですね。flickrのアプローチは、特に画像技術的な仕掛けはありませんが、そこにコンピュータビジョンを適用したと。こうした取り組みに、何かハードウェア的なエッセンスを加えることはできないでしょうか?

古橋 具体的にという訳ではないのですが、世界中のユーザが撮っている写真を張り合わせていくと、世界がもう一つの別のものとして構築できるということは漠然と考えていました。例えば、カーナビの3D地図、今でもありますけど、非常に殺風景で誰も使わないですよね。そこで、一番フレッシュなテクスチャーは何かと考えると、今そこで誰かが撮影している画像です。そういうのをぺたぺたと張り合わせていくと、常に最新の情報ができる。しかも、いわゆる地図の上からの視点ではなくて、人間の視点で作ることができますからね。
 ハードウェアが大事になる部分も当然あると思います。やはり位置情報は非常に重要なので、GPSや地磁気センサーのようなものは重要だと思います。後は、ラフでもいいので3D情報があるのであればそれを使えるような形にしてやる。ただ最終的にサービスのクオリティーを考えた場合は、ソフトウェアの部分の非常に重要になってきます。

-------------------------------------

宮田 先ほどお話した画像共有の視点は、今の一般的にCGMとして語れている分野にはない大変面白いものだと思うのですが、より具体的に「人のためになるような実用ってありますか?

斎藤 古橋さんの話ででた車のナビゲーションの延長で言うと、カメラを使って交通事故を防止できないのかという発想があります。例えば、車はどうしても死角ができてしまうので右折の際などに衝突事故が起きてしまいます。ただ、運転手から相手の車が死角になってしまっていたとしても、全く別の角度にいる第三者の車の視点からは相手の車が見えていることもある。そういう情報をみんなが共有してれば事故は減るかもしれないという発想です。最近、急速に設置が進んでいる車のバックカメラの映像を共有するということが最近真面目に考えられています。もし実現すれば、すべての動いているカメラの映像から、死角をなくすようなこともできるかもしれない。

宮田 ホンダの純正カーナビのフローティングカーのサービスの交通安全版ですね。ホンダの純正カーナビでは、すでにすべての車の走行情報(位置、スピードなど)をサーバに集約して、リアルタイムで渋滞情報を独自に作成し、カーナビの道案内に反映しています。この応用で、カメラの情報も共有できれば確かに事故防止できるかもしれません。
 そういう意味では、コンセプトはずいぶん前からあって、なかなか実現が進まないITSのようなものも、道側のインフラの高度化ありきで発想するのではなく、車自体をネットワーク化するという発想の方が早く実現する可能性も感じます。

斎藤 実は車だけの話ではなくて、人が持っている携帯電話で同じ発想をすると、「人を車がよける」というのも実現可能だと思います。つまり、携帯電話のGPSないしはカメラなどの画像を共有することで、人が死角から車の前に飛び出してきて運転者が気づかなくても車が自動的に止まる、というような。

宮田 それ、すごいですね!GPS情報を共有するといっても現在でてきているアイディアはエンターテインメント的なものがほとんどですが、これは新しい発想ですね。車×携帯電話というのは他にもアプリケーションの可能性があるような気がしてきました。

斎藤 こういう話をすると、どうしてもプライバシーの侵害という問題が出てくるのですが、一方で、自分の情報を教えるので安全をください、という発想もあっても良いと思っています。携帯カメラではないですが、イギリスでは街中に監視カメラが設置されていて、一説には5分に一回くらい写真を撮られているという話があります。そこでは、テロなどの問題を考えた場合、カメラが見守ってくれているから事件が抑止できる考え方もできると思います。
 ユーザの側が、見守られているというようにポジティブに捉えるか、監視されているとネガティブに考えるか、それは大きな違いですね。監視されているというイメージがどうしてもつきまとうけども、ある閾値のようなものがあって、そこを超えると、きっとカメラに見守られてるんだという発想になる部分もあると思う。今寝るときに、カメラがそこにあって、カメラがずっと見られていると思うと寝るのがすごく不安になるかもしれませんけど、逆に、そうなってるからこそ突然泥棒が入ってきて襲われそうになっても見守られてるから安心だという気持ちになる、そのどこかに閾値があると思うんです

古橋 研究とか公共的なところでとまるのか、ビジネスになるのかの境目がありそうですね。

斎藤 ええ、そう思いますね。その一線を越えさせるのはあくまでも政府の力とかじゃなくて、やっぱりユーザがみんなでそう思うかどうか。携帯電話だって、最初は電話って歩きながらかけたいか?と思っていたと思うのですけど、結局あっという間に普及したじゃないですか。それと多分同じで、そういう感覚って今カメラに対してすごくネガティブな面があるかもしれないけども、もしかしたらそのうちそうじゃなくなる可能性も……。

宮田 安全とか、社会インフラ的なキーワードがあるところではそういったハードルを越えやすいかもしれないですね。

-------------------------------------
後編へ続く

※このエントリは CNET Japan ブロガーにより投稿されたものです。朝日インタラクティブ および CNET Japan 編集部の見解・意向を示すものではありません。
運営事務局に問題を報告

最新ブログエントリー