Norbert Preining氏による【SUSI.AI - プライバシーを意識するパーソナルアシスタントとスマートスピーカー】を公開

第20回:SUSI.AI - プライバシーを意識するパーソナルアシスタントとスマートスピーカー

「パーソナルアシスタントの「hidden cost」」
 スマートスピーカーとパーソナルアシスタントは私たちの日常生活の中で強い存在感を示しています。ほとんどすべての現代のスマートフォンはパーソナルボイスアシスタントを備えており、Google HomeやAmazonのAlexa/Echo用のスマートスピーカーは多くの家庭にあります。
 しかし、これらの商品を使うと「hidden cost」(隠れたコスト)があります(隠れたコスト:プライバシーの喪失のコストとこれまで以上に透明性の高い顧客側のコスト)。最近の報告によると、Alexaデバイスによって記録された多くの通信は、ユーザーの知らないうちにAmazonで転記されています。これらのスマートスピーカーは、起動のきっかけとなる単語("Hey Google"または "Alexa")を常に聞いている必要があるため、原則として、近くで行われているすべてのコミュニケーションを聞いています。

 FOSSASIAのソフトウェアおよびハードウェア開発者のチームは、代替案に取り組んでいます。それは、個人的な音声アシスタントとユーザーのプライバシーを尊重するスマートスピーカーです。このシステムはSUSI.AIと呼ばれます。プライバシーの問題に加えて、開発はウィキペディアの記事を書くのと同じくらい簡単であるべきで、また、ユーザーは彼ら自身のスキルでシステムの能力を拡張することができるでしょう。今回は、プロジェクトの現在の状況、機能の状況、そしてさらなる進行中の開発について報告したいと思います。

 SUSI.AIの開発は、Google Summer of Codeプロジェクト内の学生とともに、主にボランティアによって行われます。


「プライバシーとSUSI.AI」
 大手2社(AmazonとGoogleのスマートスピーカー)による恒久的なプライバシー侵害への不満から生まれたSUSI.AIの開発は、以下の原則によって行われています。

 ・インターネットサービスを必要とせずにデバイス上で可能な限り行う
 ・インターネットに接続せずに基本機能を利用可能
 ・すべての登録と識別は完全にオプトイン
 ・サーバーに保持し分析する情報は一切無い

 現時点で音声認識と音声合成をデバイス上で行うことはできますが、品質はまだオンラインサービスと比べられない状況です。従って、視覚的にはグーグル、マイクロソフト、またはIBMがスピーチ - テキスト(STT)およびテキスト - スピーチ(TTS)のために使用できます。FOSSASIAの開発者は現在、ログ記録や変換されたテキスト保存無しのSTT/TTSサービスを提供しようとしていますが、まだ作業中です。


「ソフトウェアとハードウェアスタック」
 ソフトウェアスタックは、システムの「頭脳」を形成するサーバー(Javaで書かれています)で構成されています。サーバーは、スキルを評価することによってクエリに応答します。サーバーの1つのインスタンスはapi.susi.aiから入手でき、このエンドポイントはモバイルクライアントで使用されます。

 モバイル(iOSおよびAndroid)用のクライアントが利用可能で、上記のAPIサーバーと連携しています。

 Debian/UbuntuをベースにしたLinuxデスクトップは、パーソナルアシスタントをインストールすることができます。

 スマートスピーカーは、オーディオ入出力用のReseedハットを備えたRaspberry(少なくともRaspi3)で構成されています。Raspbianの上にSUSI.AI用意された「Susibian」と呼ばれるイメージはgithubからダウンロードできて、テスト利用が可能です。 これらのイメージには、サウンド処理とともに、デバイス上のSUSIサーバーが含まれています。このデバイスは、出荷時設定へのリセット、設定用のアクセスポイントモード、ローカルオーディオの再生なども提供します。

 LinuxデスクトップとラズベリーのクライアントはPythonで書かれています。インストーラは最新のDebian/Ubuntuの変種すべてに対応し、Raspberryへのインストールはシェルで書かれています。

 すべてのソフトウェアはオープンソースであり、FOSSASIA Githubページのさまざまなリポジトリにあります。



・・・ここから先は、アクセリア株式会社で公開中のコラム本編でご覧ください。リンク


【アクセリア株式会社の研究開発部社員:Norbert Preining氏のコラム】
・第1回:今さら聞けない、機械学習/ディープラーニングとは!?リンク
・第2回:最新の機械学習の代表、ニューラルネットワークとはリンク
・第3回:手書き数字を認識する機械学習リンク
・第4回:畳み込みニューラルネットワークリンク
・第5回:機械学習における今後の展開リンク
・第9回:Analyzing Debian packages with Neo4jリンク
・第10回:Analyzing Debian packages with Neo4j - Part 2 UDD and Graph DB Schemaリンク
・第11回:Analyzing Debian packages with Neo4j - Part 3 Getting data from UDD into Neo4jリンク
・第12回:Specification and Verification of Software with CafeOBJ - Part 1 - Introducing CafeOBJリンク
・第13回:Specification and Verification of Software with CafeOBJ - Part 2 - Basics of CafeOBJリンク
・第14回:Specification and Verification of Software with CafeOBJ - Part 3 - First steps with CafeOBJリンク
・第15回:Specification and Verification of Software with CafeOBJ - Part 4 - Modulesリンク
・第16回:DebConf 2018 in 新竹 レポート
リンク
・第17回:グラフデータベースの入門例:TeX Live データベースからNeo4jグラフデータベースへリンク
・第18回:数学の知識のいらないブロックチェーン紹介リンク
・第19回:FOSSASIA OpenTechSummit 2019 レポートリンク

【アクセリア株式会社の研究開発部社員のコラム】
・第6回:アクセリアが手がけるP2P (Peer-to-Peer)リンク
・第7回:効率的な検索を可能にする、グラフデータベースリンク
・第8回:アクセリアにおけるディープラーニング適用例リンク

本プレスリリースは発表元企業よりご投稿いただいた情報を掲載しております。
お問い合わせにつきましては発表元企業までお願いいたします。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]