Appleは、複数のTikTok動画で確認された、タイミングの悪い奇妙な文字起こしの不具合について、ソフトウェアで修正すると発表した。この不具合は、一部の「iPhone」で「racist」(人種差別主義者)と音声入力してテキストに文字起こしすると、一瞬「Trump」と表示されるというものだ。
Appleの広報担当者は、同社はこの問題を認識しており、音声認識モデルの問題が原因であるとして、「修正プログラムを提供する」と述べた。Appleは、子音のRを含む単語との「発音の重複」がバグの誘因だとしている。
米CNETの独自テストでは、「iOS 18.1.1」で「racist」「rhubarb」「rhythmic」「ramp」「ruffles」などの単語を試したが、「Trump」と表示させることはできなかった。The New York Timesは、この問題を複数回再現できたと伝えている。
2月には、iOSの新しいバージョン18.3.1がリリースされている。
提案された単語が固有名詞としてではなく、文頭のため大文字表記された可能性もある。また、「trump」という単語が大統領の名字ではなく、打ち負かす、優位に立つといった意味の単語を指している可能性もある。
ある元Apple従業員は、Appleのソフトウェアに携わる人物が意図的にこの不具合をプログラムした可能性があるとNew York Timesに示唆した。
しかし、サンタクララ大学リービー経営大学院のHaibing Lu准教授は、この恥ずかしいエラーは単なるミスである可能性もあると考えている。
「音声認識システムは、音のパターンと文脈に基づいて単語を予測する確率的言語モデルに依存している」と、Lu氏は米CNETに電子メールで述べた。「音声が不明瞭だったり、単語が似通って聞こえたりすると、システムは自動修正を試みる前に、一時的に奇妙な代替の単語を選択することがある」
この不具合は、現在の技術的な限界と、大規模言語モデル(LLM)に内在するバイアスの問題の両方を浮き彫りにしていると、Lu氏は述べた。
別の専門家は、AIには限界があり、今回のようなエラーは、まだ新しい技術に対する信頼を損なう可能性があると指摘した。
「AIは、学習に使われたデータと同じくらい賢いだけだ」と、テキスト読み上げ用のAPIで動作するAIプラットフォームDeepgramの創業者で最高経営責任者(CEO)のScott Stephenson氏は述べた。
同氏は、このバグが「音声認識は推測ではなく理解であるべき」ということを示すものだと述べ、「目標は正確性だけではなく、信頼性だ」と指摘した。
Appleは修正プログラムの提供時期を明らかにしていない。
このバグが明らかになった今週、Appleは5000億ドル(約75兆円)を米国に投資すると発表している。先週には、最高経営責任者(CEO)であるTim Cook氏がDonald Trump大統領と会談していた。
この記事は海外Ziff Davis発の記事を朝日インタラクティブが日本向けに編集したものです。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
イノベーションの「種」から社会実装へ--
社会課題の解決に挑む各社の挑戦
「1→10」の事業化を支援する
イノベーション共創拠点の取り組みとは
すべての業務を革新する
NPUを搭載したレノボAIパソコンの実力
地味ながら負荷の高い議事録作成作業に衝撃
使って納得「自動議事録作成マシン」の実力