> >

ピザの写真だけで作り方を学習するAI、MITが発表

Bonnie Burton （Special to CNET News）翻訳校正：編集部2019年06月20日 11時59分

　ニューラルネットワークが究極のピザを生み出す可能性があることが、最近の研究で示唆された。このマサチューセッツ工科大学（MIT）の研究（6月に入ってArxiv.orgで発表された）では、ピザの写真を見るだけでピザの作り方を学習できる「PizzaGAN」というニューラルネットワークに焦点を当てている。

提供：Pizza Hut

　敵対的生成ネットワーク（GAN）はモデルを使用して決定を下す。PizzaGANプロジェクトの狙いは、「この段階的な手順を反映した生成モデルを構築することで、ピザの作り方を機械に教える」ことにある。

　PizzaGANは、それぞれ1つのピザが写った9213枚の画像（Instagramからダウンロードしたもの）を含むデータセットを使用する。各画像には、トッピングを説明する一連のラベルが割り当てられているが、生地、ソース、チーズの説明は含まれていない。12種類のピザトッピング（ルッコラ、ベーコン、ブロッコリー、コーン、バジル、マッシュルーム、オリーブなど）の写真もデータセットに追加し、AIがそこから適切なものを選択できるようにした。

　ピザの画像を見せると、PizzaGANは最初にトッピングを識別し、次に画像を順番に並べられた一連のレイヤーに分割する。これらのレイヤーは、何がいつどこに追加されたのかを示す。

提供：MIT

　PizzaGANは画像を基に、どのトッピングがピザに載っているのかを判断するのは得意かもしれないが、ロボットシェフが運営するピザレストランを実際にオープンする計画はまだない。

　「How to make a pizza: Learning a compositional layer-based GAN model」（ピザの作り方：合成レイヤーベースのGANモデルについて学ぶ）と題されたこの研究がきっかけとなって、ほかの複雑なレシピだけでなく、複数のレイヤーを持つあらゆるタスクを理解するのに、このモデルが使われるようになる可能性もある。

　「われわれのモデルがデジタルの服飾品ショッピング向けアシスタントのような分野でどのように機能するのか興味深い。その分野で重要な操作は、さまざまな服のレイヤーをバーチャルに組み合わせることだ」とこの研究には書かれている。

この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。

CNET Japanの記事を毎朝メールでまとめ読み（無料）