Microsoftは米国時間8月25日、「Word」のウェブ版でトランスクリプト(文字起こし)機能「Transcribe in Word」をリリースしたと発表した。ユーザーはこの機能で、会話を直接Wordに録音し、自動的に文字に起こすことができる。また、この機能を有効にすると、事前に録音、録画された音声ファイルや動画をアップロードし、自動的に文字起こしをさせて、検索や編集が可能なテキストにすることも可能だ。
Microsoftは新しい文字起こし機能について、ユーザーが目の前の作業に集中し続けられるよう支援するとしている。最新の「Surface」デバイスや、生産性ソフトウェア、サービス向けの「プロシューマー」を想定した位置づけと同様かもしれない。
Microsoftのブログ記事によると、Transcribe in Wordは、ウェブ版Word(Wordのウェブベースのバージョン。ネイティブのWordアプリではない)ですべての「Microsoft 365」サブスクライバーが利用できるようになっている。新しい「Microsoft Edge」、「Chrome」ブラウザーでサポートされている。現在、米国英語への変換のみに対応しているが、Microsoftはさらなる言語をサポートするよう取り組んでいるという。また、アップロードされた録音データの文字起こし機能は、1カ月あたり最大5時間分の音声を変換可能で、録音ファイルごとのサイズの上限は200MBとなっている。Word内での録音、文字起こしは制限なくできるとMicrosoftはブログで説明している。
Microsoftによると、モバイル版「Office」向けの文字起こし機能も2020年中に公開される予定だ。
またMicrosoftは、Word向けの新しいディクテーション機能も発表した。ユーザーは音声コマンドを使用して、テキストを追加、フォーマット、編集、整理することができる。音声コマンドでのディクテーション機能は、ウェブ版Wordとモバイル版Office(無料)で、Microsoftアカウントにサインインすれば利用できる。Microsoft 365サブスクライバーがデスクトップ版Wordや「Mac」向けWordアプリで音声コマンドを利用できるようになるのは2020年末頃だという。
Microsoft Officeアプリで使用できるディクテーションコマンドのリストは、Microsoftのサイトで確認できる。
このほかMicrosoftは、25日に「Immersive Reader」サービスの一般提供を開始(GA)したと発表した。Immersive Readerは、テキストを読んで理解できるよう支援する「Azure Cognitive Service」だ。Wordのトランスクライブ機能は、Azure Cognitive Serviceの「Speech to Text」を利用し、自動で会話の文字起こしを行うという。
この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス