「Googleレンズ」の画像認識力が強化され、10億以上の製品を認識できるようになった。この数は1年前の4倍だ。
Googleは米国時間12月19日、人工知能(AI)を利用したこの画像認識アプリが大きな節目に達したことをブログで発表し、Googleの画像認識能力をどのようにトレーニングしているのかを説明した。それによると、同社は検索と「Knowledge Graph」による言語学習と、独自の光学文字認識(OCR)エンジンと組み合わせて利用しているという。
このOCRエンジンとトレーニングのおかげで、Googleレンズは製品ラベルなどの文字を読み取る機能が大幅に向上し、10億以上の製品を特定できるようになった。たとえば、アルファベットのo(オー)と数字の0(ゼロ)を区別するために、GoogleレンズはGoogle検索エンジンのスペル修正モデルを利用しているという。
GoogleレンズおよびAI担当のバイスプレジデント、Aparna Chennapragada氏はこう述べる。「コンピュータがわれわれと同じような方法で物を見るようになれば、カメラはわれわれの周囲にある世界と直感的につながる強力なインターフェースになる。AIのファインダーが、その場ですぐに疑問に答えてくれるようになるのだ。たとえば、今歩いている道の上に正しい道順を重ねて表示したり、店の棚にある自分が探していた製品を教えてくれたり、外国の都市で目の前に見えるあらゆる文字をすぐに翻訳したりしてくれたりするようになる。また、カメラを向けるだけで、代金を支払ったり、パーキングメーターにお金を入れたり、身の回りにあるほとんどの物の詳しい情報を得たりすることが可能になる」
Googleは設立20周年のイベントで、画像検索を通じてGoogleレンズをウェブの世界に導入することを発表した。その際に説明していたように、Googleレンズは検索をもっと視覚的なものにするというGoogleの目標を推し進める存在だ。
この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス
住環境に求められる「安心、安全、快適」
を可視化するための“ものさし”とは?
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」