カーネギーメロン大学(CMU)の研究チームは、書かれた文章をより丁寧なものに自動変換する技術を開発した。これまでの計算言語学による方法のように、単にテキストをスキャンして丁寧かどうかを調べるのではなく、より礼儀正しくなるように文章を再構成したり言葉を追加したりすることで、無作法な言葉や中立的な言葉を使っている指示や要請を実際に修整してくれる。たとえば、「Say that more politely」(もっと丁寧に言って)という文章は、「Could you please say that more politely?」(もっと丁寧に言っていただけますか?)のようになる。
ただし、これは単に「please」(お願いします)や「thank you」(ありがとうございます)などの言葉やフレーズを使えばいいだけの話ではないと、CMU言語技術研究所の博士課程に在籍する学生で、今回の方法に関する研究論文を執筆した1人であるShrimai Prabhumoye氏は説明する。直接的な表現をほんの少し控える場合もあり、「you should do X」(あなたはXをするべきだ)という文章が「let us do X」(Xをしましょう)のようになる。
この実験の中心にあるのは、丁寧さを分析し、丁寧度のスコアでラベル付けされた139万の文章からなるデータセットだ。研究チームは、これを「タグ付けして生成」するアプローチを開発した。このアプローチでは、明らかに無作法な(つまり、言い方を改善できそうな)文章を特定して、Emily Post氏(エチケットの指南書を書いた米国の作家)も認めるような言葉やフレーズを使って微調整する。
「Yes, go ahead and remove it」(うん、さっさと削除して)は、「Yes, we can go ahead and remove it」(ええ、さっさと削除してしまいましょう)になる。研究チームの説明によると、「we」(私たち)を追加することで、要請に含まれる負担感を話し手と受け手で共有する感覚が生まれるという。
「Not yet -- I'll try this weekend」(まだです--この週末にやってみます)は、「Sorry, not yet -- I'll try to make sure this weekend」(すみません、まだです--この週末に必ずやっておくようにします)となり、謝罪の言葉を入れることで、要請された行動が何らかの負担になるかもしれないことを丁寧に伝えている。
CMUチームのデータセットは、意外な(だが、適切とも言える)ソースから取得されている。それは、テキサス州に本社を置いていたエネルギー関連企業Enronの従業員がやり取りした電子メールだ。Enronは、不正会計のスキャンダルを引き起こして世間の注目を集め、多くの企業の会計処理が問題視される契機となった。
この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」
地味ながら負荷の高い議事録作成作業に衝撃
使って納得「自動議事録作成マシン」の実力