グーグルは7月14日、YouTube動画に自動で字幕をつける「自動キャプション機能」の日本語版を公開した。音声認識技術を使って日本語の動画に自動で字幕がつけられるようになった。自動翻訳機能も組み合わせると、手間をかけずに多言語の翻訳字幕もつけられる。
YouTubeにアップロードされる動画は1分間に48時間にのぼる。この膨大な量の動画を広く視聴してもらうために、グーグルは3年前からキャプション機能の開発に取り組んできた。キャプション機能を実装することで、検索性を向上させること、言語の壁を越えること、耳の不自由な人にも楽しんでもらえるようにすることが可能になるという。
たとえば東日本大震災の被災地である南相馬市の桜井市長が語るYouTube動画は、英語の字幕がつけられたことで、世界中に発信され、多くの関心を集めた。
ただし字幕の作成と編集は煩雑な作業を要する。グーグルは「キャプションエディター」というツールを実験的に提供しているが、字幕テキストと音声のタイミングをあわせるのが難しいという。
そこで1年半前に、キャプションの自動同期機能を用意した。テキストデータをアップするだけで、音声認識技術を使って、動画と音声が自動的に同期するというものだ。この機能は2011年3月から日本語にも対応。震災関連の動画に素早くキャプションをつけられるように開発された。
YouTubeの字幕に関する最新のテクノロジが、今回発表された自動キャプション機能だ。音声認識技術を利用しているため間違いも発生するが、1年前から提供されている英語版では継続的な開発により、字幕内容の間違いが20%減少しているという。
日本語版がリリースされたことで、日本語の音声が入っている動画であれば、自動で日本語字幕が入るようになった。YouTubeの視聴画面にある「cc」というボタンを押すと表示される。自動翻訳ボタンを押せば、そのまま多言語字幕の表示も可能だ。
この機能は現在YouTubeにアップロードされている4000万点の動画で利用できる。自動で字幕がつけられた動画はすでに2300万回視聴されている。ユーザーからの注目度も高く、手動で字幕が作成された字幕の数も3倍に増えたという。
YouTubeプロダクトマネージャーのブラッド・エリス氏は、「自動キャプション機能により日本国内にあるコンテンツを海外にも発信できるようになる。自動翻訳を使えば日本語がわからないユーザーにも届く。この新機能がYouTubeのユーザー体験を向上させることを期待している」と述べた。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス
地味ながら負荷の高い議事録作成作業に衝撃
使って納得「自動議事録作成マシン」の実力
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」