Google「音声要約」の衝撃--ウェブページやPDFから「ポッドキャスト風の掛け合い音声」をAI生成


 Googleの生成AIノート「NotebookLM」の「音声概要」機能が日本語をはじめとする50以上の言語に対応した。WebページのURLやPDFを指定すると、その内容を会話形式の“ポッドキャスト”として誰でも自動生成できるようになった。

 同機能は2024年の英語版リリース直後から高い人気を集めてきた。今回の多言語対応は、Gemini 2.5 Proが持つネイティブ音声処理とマルチモーダルAI技術を組み合わせた成果だという。ユーザーはGoogleアカウントの言語設定に合わせて音声を再生できるほか、設定メニューに新設された「出力言語」で任意の言語に切り替えられる。

 同社によれば、複数言語の資料を一括で取り込み、好みの言語で音声ダイジェストを生成できる点が教育現場や国際共同研究での活用を後押しするという。

 NotebookLMは、Googleの公式サイト「https://notebooklm.google/」で体験できる。

実際に試してみた

 実際にCNETのテキスト記事を読み込ませて、ポッドキャスト風の解説音声を生成してみた。記事のURLを指定し「解説風にして」と軽くプロンプトを入力。「生成する」ボタンをクリックすると、数分程度で音声ファイルが出力された。

CNETの記事から音声要約を生成 CNETの記事から音声要約を生成
※クリックすると拡大画像が見られます

 生成された音声を聞いて衝撃を受けた。違和感は完全にはゼロではないが、かなり自然な掛け合いだ。さらに、記事の内容を理解するための「噛み砕き方」も自然で、2人の掛け合いによって内容がすっと頭に入ってくる。ポッドキャストの魅力である「ながら聴き」にも十分耐えるクオリティだ。


 Googleによると、異なる言語の資料を一括でアップロードでき、そこから任意の言語の音声要約を生成できる点も魅力だという。Google Labsのプログラムマネージャー、アリエル・フォックス氏は「言語の壁を取り払い、誰もが必要な情報へ音声でアクセスできる環境を整えた」とコメント。ソフトウェアエンジニアのマイケル・チェン氏も「多様な言語資産から新たなインサイトが生まれる」と期待を示した。

Amazonで現在開催中のセールを見る

コンセントに挿して充電器にもなるAnkerのモバイルバッテリー(価格をAmazonでチェック)

CNET Japanの記事を毎朝メールでまとめ読み(無料)

-PR-企画広告

企画広告一覧

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]