ニューラルネットワークが究極のピザを生み出す可能性があることが、最近の研究で示唆された。このマサチューセッツ工科大学(MIT)の研究(6月に入ってArxiv.orgで発表された)では、ピザの写真を見るだけでピザの作り方を学習できる「PizzaGAN」というニューラルネットワークに焦点を当てている。
敵対的生成ネットワーク(GAN)はモデルを使用して決定を下す。PizzaGANプロジェクトの狙いは、「この段階的な手順を反映した生成モデルを構築することで、ピザの作り方を機械に教える」ことにある。
PizzaGANは、それぞれ1つのピザが写った9213枚の画像(Instagramからダウンロードしたもの)を含むデータセットを使用する。各画像には、トッピングを説明する一連のラベルが割り当てられているが、生地、ソース、チーズの説明は含まれていない。12種類のピザトッピング(ルッコラ、ベーコン、ブロッコリー、コーン、バジル、マッシュルーム、オリーブなど)の写真もデータセットに追加し、AIがそこから適切なものを選択できるようにした。
ピザの画像を見せると、PizzaGANは最初にトッピングを識別し、次に画像を順番に並べられた一連のレイヤーに分割する。これらのレイヤーは、何がいつどこに追加されたのかを示す。
PizzaGANは画像を基に、どのトッピングがピザに載っているのかを判断するのは得意かもしれないが、ロボットシェフが運営するピザレストランを実際にオープンする計画はまだない。
「How to make a pizza: Learning a compositional layer-based GAN model」(ピザの作り方:合成レイヤーベースのGANモデルについて学ぶ)と題されたこの研究がきっかけとなって、ほかの複雑なレシピだけでなく、複数のレイヤーを持つあらゆるタスクを理解するのに、このモデルが使われるようになる可能性もある。
「われわれのモデルがデジタルの服飾品ショッピング向けアシスタントのような分野でどのように機能するのか興味深い。その分野で重要な操作は、さまざまな服のレイヤーをバーチャルに組み合わせることだ」とこの研究には書かれている。
この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
「程よく明るい」照明がオフィスにもたらす
業務生産性の向上への意外な効果
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」