> >

2023年に登場した画期的なテクノロジー5選--オンデバイスAI、ワイヤレステレビなど

June Wan （ZDNET.com）翻訳校正：川村インターナショナル2023年12月14日 07時30分

　2023年は、さまざまなことが起きた1年だった。人工知能（AI）が世界を席巻し、大企業にも中小企業にも大きな変化を引き起こした。複合現実（MR）市場では、おそらく世界で最も影響力を持つであろうテクノロジー企業の参入という重要な出来事があった。スマートフォンの形状やサイズも多様化し、なんと衣服にピンでとめて使う小型ガジェットまで登場した。また、2本の指をつまむジェスチャーも広まった（これについては後述する）。

提供：June Wan/ZDNET

　この12カ月間は、技術革新の絶え間ない追求によって、アイデアを考えたり、コミュニケーションを取ったり、身の回りのハードウェアやソフトウェアを操作したりする方法に、いくつかの画期的な進歩がもたらされた。本記事では、その中から5つの技術的進歩を紹介する。企業各社が次の重要なテクノロジーの開発を急ぐ中で、これらの技術的進歩は、今から2024年にかけて、開発者やエンジニア、デザイナー、投資家の頭の中で重要な位置を占めることになるだろう。

オンデバイスAIは皆にメリットをもたらす
プロ向けの生成AIツール
「コードをなくす」を極限まで追求したワイヤレステレビ
すべてのPCユーザーが「Copilot」を利用可能に
空中で指をつまむジェスチャーが当たり前に

1. オンデバイスAIは皆にメリットをもたらす

提供：June Wan/ZDNET

　「DALL・E 2」は生成AIが加速するきっかけを作った。2022年後半にOpenAIのいくつかのAIサービスが瞬く間に成功を収めた後、2023年には、AIの進歩が驚異的なペースで加速した。その勢いは、2024年に入ってもとどまることはないはずだ。特にローカルのオンデバイスAIの機能性に焦点が当てられるだろう。

　Googleやサムスン、Qualcommなどの企業は今後、スマートフォンやPC、電気自動車など、エッジにAIを展開していく可能性をすでに示唆している（Qualcommは、「Meta Quest 3」など、特に高性能なガジェットでニューラルネットワークを実行するチップセットを製造している）。これにより、インターネット接続やバックエンドで実行されるクラウドサーバーを必要とせずに、テキストから画像を生成したり、リアルタイムで翻訳を実行したり、便利なAIアシスタントにアクセスしたりできるようになるだろう。

　AIアプリケーションをローカルで実行することには、大きな利点が4つある。まず、個人情報や財務情報、医療情報を含むあらゆる情報は、デバイスの外部ではなく内部で保存および処理される。第二に、位置情報や、ユーザーの好みやアクティビティーを活用して、よりパーソナルなAIアシスタントを作成できるようになる。第三に、遅延と処理時間が著しく短縮される。第四に、クラウドコンピューティングを介在させる必要がないため、データセンターのエネルギー消費が大幅に削減され、環境の持続可能性が向上する。

　TIRIAS ResearchのプリンシパルアナリストJim McGregor氏は、「フルスペックのAI高速化サーバー1台のアイドル時の消費電力は1kWに達することがあり、ピーク時の消費電力も数kWに達することがある。この数字に、生成AIモデルの実行に必要なサーバー台数と、モデルが実行される回数が掛け合わされる。そして、モデルの実行回数は指数関数的に増加している」と話す。オンデバイスAIは、すべてではないにしても、ほとんどの摩擦をデバイス内にとどめることで、この問題を解決してくれる。2024年には、十分な能力を備えるようになるだろう。

2. プロ向けの生成AIツール

提供：June Wan/ZDNET

　生成AIは、コーディングから写真や動画の編集まで、プロフェッショナルなコンテンツ作成のためのツールキットも拡充した。少数ではあるものの、CanvaやApple、Adobeといった企業では、アーティストやビデオグラファー、デザイナーなどの仕事を奪うのではなく、そうしたクリエイターに力を与えることを目的に、自社のクリエイティブ系スイートに各種AIツールを導入している。

　一部のツールには、テキストプロンプトに基づいて本格的なウェブサイトを生成できるWixの「AI Site Generator」や、写真（特に高ISOで撮影したもの）のデジタルノイズをインテリジェントに除去する「Adobe Lightroom」の「ノイズ除去」設定を備えた「Adobe Sensei」などが含まれる。Adobe Senseiは、「Premiere Pro」でのテキストベースの編集もサポートしており、クリップのトリミングやカット、並べ替えをより効率的に実行できる。また、Adobeは先ごろのイベントで、動画内のオブジェクトを削除したり、新しい小道具を追加したりできる生成AIツール「Project Fast Fill」をまもなく提供することも発表している。

　そうしたワークロードでは、特に各社がこれらの大規模言語モデルを微調整していることもあり、コンピューターやサーバーのGPUやRAMを最大限に活用しなければならないことが多く、IntelやAMD、NVIDIA、Qualcommといった世界最大手の半導体企業間で激しいAI競争が展開されている。2024年には、「AI向け」のコンピューターやチップセット、手の込んだ比較表を目にすることが増えるはずだ。

3. 「コードをなくす」を極限まで追求したワイヤレステレビ

提供：June Wan/ZDNET

　まるで「CES」（世界最大級のテクノロジー展示会）での宣伝文句のようだ。実際に、新興企業のDisplaceとLG Electronicsが1月にワイヤレステレビのデモを米ZDNETに見せてくれたとき、まさにそのように感じたが、それから約1年が経過した今、ワイヤレステレビがついに発売されようとしている。

　ワイヤレステレビでは、通常、ディスプレイパネルから30フィート（約9.1m）以内にベースユニットを設置し、そこから映像情報や音声情報が送信される。これは、公然の仕組みだ。このベースユニット（サムスンのハイエンドテレビに含まれる既存の「One Connect Box」によく似ているが、ワイヤレスである点が異なる）には、多くの場合、HDMI、USB Type-A、光デジタル、LANなどのI/O端子が搭載されており、事実上、ワイヤレステレビ用の送信機となる。

　当然のことながら、ワイヤレステレビに関する大きな疑問の1つは、遅延が視聴体験に及ぼす影響である。特に、ゲーマーにとっては、ほぼ瞬時の入力応答が不可欠であり、メーカーがゲーマーをターゲットにすることが増えていることを考えると、なおさらだ。有線接続を利用できない場合、内蔵スピーカーはどの程度正確にサウンドを出力できるだろう。そして、Displaceの指でつまむジェスチャーは、本当にリモコンの代わりになるのだろうか。われわれは、2024年にさらに多くのワイヤレステレビが登場したときに、こうした点をテストするのを非常に楽しみにしている。

　とはいえ、ワイヤレステレビの価格は決して一般ユーザー向けではないことは確かだ。「Displace TV」の価格は4499ドル（約65万4000円）、97インチの「LG OLED M3」は約3万5000ドル（日本では429万円前後）となっている。しかし、コードやケーブルが壁からぶら下がっていない未来を間近で見たいなら、ここから始めるのが一番かもしれない。

4. すべてのPCユーザーが「Copilot」を利用可能に

提供：Maria Diaz/ZDNET

　MicrosoftがCopilotを大々的に推進していることは、同社が9月のイベントで、Copilotが「Windows」PC上でのウェブの作成、閲覧、操作に革命的な変化をもたらす方法について長時間にわたって説明したことからも明らかだ。Microsoftの最高経営責任者（CEO）のSatya Nadella氏は先ごろ開催された「Ignite」で、「Bingチャット」をCopilotに改称することを発表した。Nadella氏は、「われわれは、Copilotの企業だ。あらゆるユーザー、そして、ユーザーが実行するあらゆることにCopilotが関与する未来を信じている」と述べた。

　ビジョンは単純明快だった。タスクバーから1回クリックするだけで、4億人を超える「Windows 11」ユーザーが同社のBingチャットを搭載したアシスタントにアクセスして、「Microsoft 365」製品でクリエイティブな回答を受け取ったり、「Edge」でショッピングについてアドバイスしてもらったり、「Microsoft Teams」で会議の要約を作成してもらったりできるようになる。そのほかにも、いろいろなことが可能だ。Copilotは、使用するのにサードパーティーのアプリケーションや拡張機能は不要なので、生成AIアプリケーションを体験したい人にとって、最も利用しやすく、最も自然な手段の1つとなっている。

　基本的なレベルで、Windows 11でCopilotを使用すると、1日のクリック回数をかなり減らせる。Copilotを使用すると、あの複雑な設定画面を操作しなくても、ディスプレイ解像度を調整したり、ダークテーマの時間を設定したり、そのほかの日常的なタスクを実行したりできるようになったからだ。ビジネスや大企業の場合、Copilotはサイバーセキュリティの脅威にも対処でき、機械学習アルゴリズムによるリスクの特定から、自動対応メカニズムによるほぼ瞬時の防御といったことまで可能だ。

5. 空中で指をつまむジェスチャーが当たり前に

提供：June Wan/ZDNET

　指で塩を振りかける。鉛筆で文字を書く。鍵でドアを開ける。Appleの3499ドル（約51万円）の「Vision Pro」ヘッドセットを操作する。これらの動作に共通することは何だろう。指をつまむ動作は、最も普遍的な（そして、不可欠な）手のジェスチャーの1つで、あまりにも頻繁に行う無意識の動作となっている。そのため、指をつまむ動作は、マウスやトラックパッド、静電容量式タッチスクリーンに代わる操作方法として、最も自然なものだ。このことは、「Apple Watch」やVision Proヘッドセット、Meta Quest 3、Humaneの「AI Pin」でも実証されている。

　この4つの例ではいずれも、指をつまむジェスチャーは新しい「クリック」操作となっており、実際のハードウェアを物理的に一切操作することなく、ウィンドウやインターフェースの選択、ドラッグ、展開を実行できる。これらのデバイスで異なるのは、指をつまむジェスチャーを検出する方法だ。Apple Watchが手首のセンサーを使用して、人差し指と親指に特有の血流の変化を追跡するのに対し、Vision Proは新しい「R1」チップとセンサーを使用して、手の骨格データを視覚的にマッピングする。Humaneは、デバイス上の深度センサーとモーションセンサーを使用して同様のことを実行し、スワイプやピンチなどのジェスチャーを追跡する。

　指をつまむ動作に関する大きな問題は、そのような基本的なジェスチャーを、必要に応じてどれだけ多次元にできるかということだ。Vision ProやMetaの次期MRヘッドセットなどのデバイスを使用したときに、ポップコーンをつかんだだけで、映画を一時停止するといったことは起きないだろうか。また、指をタップできないユーザーにとって、次善策はどのようなものだろう。既存のテクノロジーに基づいて考えると、空中で指をつまむジェスチャーが当たり前になる新時代は、これまで以上に現実的で、間近に迫っているように感じられる。

この記事は海外Red Ventures発の記事を朝日インタラクティブが日本向けに編集したものです。

CNET Japanの記事を毎朝メールでまとめ読み（無料）