ピザの写真だけで作り方を学習するAI、MITが発表

Bonnie Burton (Special to CNET News) 翻訳校正: 編集部2019年06月20日 11時59分

 ニューラルネットワークが究極のピザを生み出す可能性があることが、最近の研究で示唆された。このマサチューセッツ工科大学(MIT)の研究(6月に入ってArxiv.orgで発表された)では、ピザの写真を見るだけでピザの作り方を学習できる「PizzaGAN」というニューラルネットワークに焦点を当てている。

ピザの写真
提供:Pizza Hut

 敵対的生成ネットワーク(GAN)はモデルを使用して決定を下す。PizzaGANプロジェクトの狙いは、「この段階的な手順を反映した生成モデルを構築することで、ピザの作り方を機械に教える」ことにある。

 PizzaGANは、それぞれ1つのピザが写った9213枚の画像(Instagramからダウンロードしたもの)を含むデータセットを使用する。各画像には、トッピングを説明する一連のラベルが割り当てられているが、生地、ソース、チーズの説明は含まれていない。12種類のピザトッピング(ルッコラ、ベーコン、ブロッコリー、コーン、バジル、マッシュルーム、オリーブなど)の写真もデータセットに追加し、AIがそこから適切なものを選択できるようにした。

 ピザの画像を見せると、PizzaGANは最初にトッピングを識別し、次に画像を順番に並べられた一連のレイヤーに分割する。これらのレイヤーは、何がいつどこに追加されたのかを示す。

MITのPizzaGAN
提供:MIT

 PizzaGANは画像を基に、どのトッピングがピザに載っているのかを判断するのは得意かもしれないが、ロボットシェフが運営するピザレストランを実際にオープンする計画はまだない。

 「How to make a pizza: Learning a compositional layer-based GAN model」(ピザの作り方:合成レイヤーベースのGANモデルについて学ぶ)と題されたこの研究がきっかけとなって、ほかの複雑なレシピだけでなく、複数のレイヤーを持つあらゆるタスクを理解するのに、このモデルが使われるようになる可能性もある。

 「われわれのモデルがデジタルの服飾品ショッピング向けアシスタントのような分野でどのように機能するのか興味深い。その分野で重要な操作は、さまざまな服のレイヤーをバーチャルに組み合わせることだ」とこの研究には書かれている。

この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。

CNET Japanの記事を毎朝メールでまとめ読み(無料)

-PR-企画特集

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]