ベンチャー企業のカタログは、動画共有サイトに投稿された動画の音声を自動認識して文章化する「もじもじTV」を10月14日にクローズドサービスとして公開する。先着1000名の登録ユーザーが利用できる。
サイト上でニコニコ動画やYouTubeの動画のURLを登録すると、音声を認識して自動的に文字起こしをする。結果はユーザーが手動で修正したうえでウェブ上に公開することが可能だ。ICレコーダーやデジタルカメラで撮った音声や動画を登録することもでき、できあがった文章を非公開にすることもできる。なお、動画の登録は1日3件までとなっており、動画共有サイトの場合は3分程度のもの、動画ファイルを登録する場合は20Mバイト以下のもののみ利用できる。また、登録した動画が文章化されるまでには数分かかる。
ユーザーが直した文章をシステムが自動的に学習するため、時間とともに音声の認識率は向上するとのこと。また、インターネット上の文章をクロールし、新語や俗語、人物名などを順次辞書データに自動追加するため、旬なキーワードにも対応できるとしている。
カタログでは、「動画のタイトル・タグ・説明文だけでなく、今まで不可能だった動画内の音声を検索することや、動画の音声を字幕で楽しむことができる」と説明している。
今後はクローズドサービスに参加したユーザーの反応をもとに機能や登録できる動画サービスの種類を増やすといい、2009年冬に一般公開する予定だ。
カタログは2006年に創業したベンチャー企業で、旅行プランを作成・共有できる「Tripl」やブログランキングサービス「人気ブログランキング」などを運営してきた。ただ、事業としての難しさを感じていたといい、「Web 2.0系のサービスは競争が激しく、自社でコア技術を持たないと負けてしまう」(代表取締役社長の清水勇樹氏)と判断して、2009年からは音声認識技術を活用したサービスに力を入れているとのことだ。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」