Googleの生成AIノート「NotebookLM」の「音声概要」機能が日本語をはじめとする50以上の言語に対応した。WebページのURLやPDFを指定すると、その内容を会話形式の“ポッドキャスト”として誰でも自動生成できるようになった。
同機能は2024年の英語版リリース直後から高い人気を集めてきた。今回の多言語対応は、Gemini 2.5 Proが持つネイティブ音声処理とマルチモーダルAI技術を組み合わせた成果だという。ユーザーはGoogleアカウントの言語設定に合わせて音声を再生できるほか、設定メニューに新設された「出力言語」で任意の言語に切り替えられる。
同社によれば、複数言語の資料を一括で取り込み、好みの言語で音声ダイジェストを生成できる点が教育現場や国際共同研究での活用を後押しするという。
NotebookLMは、Googleの公式サイト「https://notebooklm.google/」で体験できる。
実際にCNETのテキスト記事を読み込ませて、ポッドキャスト風の解説音声を生成してみた。記事のURLを指定し「解説風にして」と軽くプロンプトを入力。「生成する」ボタンをクリックすると、数分程度で音声ファイルが出力された。
生成された音声を聞いて衝撃を受けた。違和感は完全にはゼロではないが、かなり自然な掛け合いだ。さらに、記事の内容を理解するための「噛み砕き方」も自然で、2人の掛け合いによって内容がすっと頭に入ってくる。ポッドキャストの魅力である「ながら聴き」にも十分耐えるクオリティだ。
【音声コンテンツ】 ChatGPTが最近やたら「よいしょ」してきて鬱陶しい件について
— CNET Japan (@cnet_japan) April 30, 2025
(同対談は、CNET Japanの元記事「https://t.co/an28Bo0AGE」をAIに読ませて自動生成しています) pic.twitter.com/onEo8xxlCV
Googleによると、異なる言語の資料を一括でアップロードでき、そこから任意の言語の音声要約を生成できる点も魅力だという。Google Labsのプログラムマネージャー、アリエル・フォックス氏は「言語の壁を取り払い、誰もが必要な情報へ音声でアクセスできる環境を整えた」とコメント。ソフトウェアエンジニアのマイケル・チェン氏も「多様な言語資産から新たなインサイトが生まれる」と期待を示した。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
地味ながら負荷の高い議事録作成作業に衝撃
使って納得「自動議事録作成マシン」の実力
イノベーションの「種」から社会実装へ--
社会課題の解決に挑む各社の挑戦
すべての業務を革新する
NPUを搭載したレノボAIパソコンの実力
「1→10」の事業化を支援する
イノベーション共創拠点の取り組みとは