logo

動画の音声を自動文字起こし、「もじもじTV」がクローズドサービス開始

永井美智子(編集部)2009年10月09日 21時33分
  • このエントリーをはてなブックマークに追加

 ベンチャー企業のカタログは、動画共有サイトに投稿された動画の音声を自動認識して文章化する「もじもじTV」を10月14日にクローズドサービスとして公開する。先着1000名の登録ユーザーが利用できる。

 サイト上でニコニコ動画やYouTubeの動画のURLを登録すると、音声を認識して自動的に文字起こしをする。結果はユーザーが手動で修正したうえでウェブ上に公開することが可能だ。ICレコーダーやデジタルカメラで撮った音声や動画を登録することもでき、できあがった文章を非公開にすることもできる。なお、動画の登録は1日3件までとなっており、動画共有サイトの場合は3分程度のもの、動画ファイルを登録する場合は20Mバイト以下のもののみ利用できる。また、登録した動画が文章化されるまでには数分かかる。

もじもじTV もじもじTVでYouTubeの動画を文字起こしした様子。サービス開始直後は精度が高くないが、時間とともに自動学習していくという

 ユーザーが直した文章をシステムが自動的に学習するため、時間とともに音声の認識率は向上するとのこと。また、インターネット上の文章をクロールし、新語や俗語、人物名などを順次辞書データに自動追加するため、旬なキーワードにも対応できるとしている。

 カタログでは、「動画のタイトル・タグ・説明文だけでなく、今まで不可能だった動画内の音声を検索することや、動画の音声を字幕で楽しむことができる」と説明している。

 今後はクローズドサービスに参加したユーザーの反応をもとに機能や登録できる動画サービスの種類を増やすといい、2009年冬に一般公開する予定だ。

 カタログは2006年に創業したベンチャー企業で、旅行プランを作成・共有できる「Tripl」やブログランキングサービス「人気ブログランキング」などを運営してきた。ただ、事業としての難しさを感じていたといい、「Web 2.0系のサービスは競争が激しく、自社でコア技術を持たないと負けてしまう」(代表取締役社長の清水勇樹氏)と判断して、2009年からは音声認識技術を活用したサービスに力を入れているとのことだ。

-PR-企画特集