logo

日本の労働生産性向上の切り札になるか--エーアイスクエアのテキスト処理AI

  • このエントリーをはてなブックマークに追加

 公益財団法人日本生産性本部の発表によると、1970年から2016年まで、日本の労働生産性(就業1時間当たりの付加価値)は主要先進7カ国(G7)のなかで最下位という状況が続いている。少子高齢化とともに人口減の傾向も強まり、労働者・労働力の減少が大きな問題となりつつあるなか、これを打開するには生産性の向上が不可欠。しかし、G7最下位という事実により八方塞がりの様相を呈している。

 この状況に歯止めをかけるべく、厚生労働省や経済産業省などが「働き方改革」や「労働生産性の向上」を目的とした施策に向け動き始めてはいるものの、実効性があるかどうかは未知数だ。そんな状況で、エーアイスクエアは「AIによる事務仕事の効率化」という別のアプローチから「生産性向上」を目指している。テキストのAI処理に特化したビジネスを展開する同社の代表取締役である石田氏に、その取り組みを伺った。

エーアイスクエアの代表取締役である石田正樹氏
エーアイスクエアの代表取締役である石田正樹氏

文字数指定して重要センテンスを一発抽出する「要約エンジン」

 石田氏は、元々インテリアデザイナーとして住宅やエンターテイメント施設のデザイン・設計を手がけ、さらにはハリウッド映画のハンドリングにも関わっていたという異色の経歴の持ち主。10年ほど前からテキストのAI処理によるビジネスの可能性に目をつけ、2015年にエーアイスクエアを立ち上げて事業化した。

 AIと言えば、画像の認識処理を伴うソリューション・サービスが目立つが、同社がテキスト処理に特化したのはなぜなのか。同氏によると、日本語のテキスト処理について十数年関わっているスタッフが身近にいたことも理由の1つだが、「日本の労働生産性は先進7カ国のなかで最下位。人口も減っていて、このままいくと悲惨な未来しかない」と危機感を募らせてきたことも大きい。「少子高齢化が進むなか、業務の効率化を図るには自動化しかないという思いがあった。すでに工業製品の生産などは自動化されていて、残るは事務仕事。特に(この分野の自動化は)日本は世界から20年くらい遅れている」と指摘する。

 こうした事情を背景に、同社では現在「要約エンジン」「キーワード抽出エンジン」「QAエンジン」という3つのテキスト処理エンジンを主に提供している。

 1つ目の「要約エンジン」は、長文のテキストから重要と思われるセンテンスを自動で抽出するもの。たとえば新聞やニュースサイトの記事、論文、レポート、議事録などを、指定した文字数内もしくは指定したパーセンテージの文章量でまとめ直してくれる。テキスト内の要素を300次元や400次元といった高次元でベクトル化して重み付けすることで、どの部分が重要か、そうでないかを判断するようになっており、「すべて数学的な処理しかしていない」のが特徴だという。辞書を一切使っていないことからキーワードのメンテナンスが不要で、英語などのスペース区切りの言語ならそのまま対応できるのもメリットだとする。

 この要約エンジンは、すでにいくつかの企業、自治体などが採用している。そのうちの1つ、徳島県庁では、定例記者会見などの内容を同庁のウェブサイトに掲載しており、そのテキストを要約エンジンで処理して閲覧できるようになっている(実証実験は2017年10月30日~2018年3月30日)。原文は数千文字から1万文字にも達するが、要約率を指定すると重要なセンテンスだけが抽出されるため、効率的に内容を把握できる。

 また、このテキストの書き起こしにも同社が提供するツールが用いられている。記者会見の音声をリアルタイムで認識してテキスト化し、その後微細な修正を施すだけで完全な原稿が完成する。従来は耳で聞いて手作業でテキスト起こしするのに担当者2人がかりで1週間かかっていたが、エーアイスクエアのツール導入で担当者1人がわずか2時間作業するだけで完了するようになったという。生産性は単純計算で200倍に向上した、と言える。

徳島県庁の定例記者会見などの内容を掲載している「AI要約サービス」
徳島県庁の定例記者会見などの内容を掲載している「AI要約サービス」

企業の運用コストを大幅削減する2つのエンジン

 2つ目の「キーワード抽出エンジン」は、文章内から重要と考えられる単語を抽出するもの。これはコールセンターなどで活用されており、顧客との会話内容から重要なキーワードを自動で取り出して、後述の「QAエンジン」などとも連携し、適した回答例をオペレーターに提示するといった形で応用されている。

 そもそも人材の確保が困難でありながら、1年後の離職率が100%に近いというオペレーター業は、リクルーティングやトレーニングのコストが高くつき、ノウハウの蓄積も難しいのが課題だった。しかし、キーワード抽出エンジンなどを利用したシステムとすることで、「スキルがそこそこの人でもベテランと同じように回答できる。とりわけコールセンターのような属人化、労働集約型の業務においては高い効率化が狙える」と石田氏。

 3つ目の「QAエンジン」は、質問に対する回答を自動で行うもの。あらかじめいくつかの質問と回答の例を文章で登録することにより、ユーザーが新たな質問を入力したときにAIが表現の揺らぎを吸収したうえで意味的に最も適切な回答を自動的に表示する。ルールベースのチャットボットのように、あらゆる質問を事前に想定して対応する回答を用意しておくのとは異なり、わずかな質問・回答例を登録するだけで幅広い質問に回答できるようになるわけだ。

 このエンジンには、これまで多数のチャットボットを開発してきた石田氏の経験も詰まっている。300パターンの回答が可能なルールベースのチャットボット開発には通常3カ月程度かかるが、QAエンジンを用いることで、わずかな質問・回答例を用意するだけの時間で実用に耐えるQ&Aシステムを構築できるという。質問を入力してから回答が返ってくるまで内部的な処理にかかる時間はミリ秒単位と、処理の高速さもアピールする。この問い合わせ対応業務の自動化(Q&A 応答支援、チャットボット)のサービス提供形態は、基本的にクラウドでMicrosoft Azureのプラットフォームになる。オンプレミスは応相談。

教育分野でもテキスト処理AIが活躍する

 これらのエンジンは今後どのように応用し、進化していくのか。石田氏は「どんな風に使っていくべきか、まだ明確なアイデアがない」と率直に打ち明ける。エンジンが完成してまだそれほど時間がたっていないこともあるが、同氏らが当初想定していたコールセンターでの利用と大きく異なる、さまざまなニーズが多方面から寄せられていることも要因だ。

 最近では、「社史の編纂を担当する人から50年、100年分の資料を効率的に読むのに使えないかという問い合わせがあった」ほか、「最初の2、3ページしか読めず、中身がほとんどブラックボックス化している電子書籍のビジネス書を要約して、購入前に読めるようにする」という仕組みが検討段階にある。

 さらに同氏は、教育分野でも活用の機会があると見ている。「文部科学省の方針で、今後、大学入試の国語で自由筆記が増えてくる。ところが、全国の受験生何万人、何十万人分もの答案を誰が採点するのか、何も決めないまま進んでいる。ここに私たちの技術を導入すれば、模範解答を用意するだけで受験者の答案との差分で数値化できる。その数値を元に人が評価すれば採点のブレを少なくできるはず」。

 テストをマークシートから自由筆記にすること自体、日本は効率化と正反対の方向に進んでいると言えなくもない。「それが日本の生産性が上がらない理由の根幹にあるのかもしれない。米国は20年前、認識率が50%くらいのときから音声認識をバンバン使っている。そうした技術に対する姿勢の違いが、今の米国と日本における労働生産性の差として表れているのではないか」。最後に石田氏が絞り出した言葉には、同社の技術を広めたいということよりも、日本の将来をどうにか良くしたい、という切実な思いが透けて見える。

「技術に対する姿勢の違いが、今の米国と日本における労働生産性の差として表れているのではないか」と危機感を募らせる石田氏
「技術に対する姿勢の違いが、今の米国と日本における労働生産性の差として表れているのではないか」と危機感を募らせる石田氏

-PR-企画特集

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]