IBMが人工知能(AI)を利用した顔認識システムのトレーニングに用いる100万枚の画像コレクションで、Flickrに投稿した写真が利用されていることを知って驚いたフォトグラファーがいるかもしれない。だが、おそらく驚くべきではなかったのだろう。
写真共有サイトFlickrの写真には、Creative Commons(CC)ライセンスの下で共有されているものがある。CCライセンスという枠組みの下では、本来著作権で保護される写真やテキスト、動画などの作品の利用に関する制限が緩和される。CCライセンスは、営利目的での利用を禁じたり、写真の利用者にクレジットの表示を求めたりすることもできるが、概して作品を他者が利用できるようにするというものだ。
PRなどを手がけるSharpOrangeの幹部Greg Peverill-Conti氏は、IBMに写真が利用されているようだ。同氏は米国時間3月12日、NBC Newsの取材に対して次のように語った。「私が撮影した人たちは誰も、このような形で画像が利用されるとは思っていない。(中略)IBMが誰にも何も告げずにこれらの写真を利用できるのは、少し腑に落ちない感じがする」
IBMはCCライセンスの写真のみを使用しており、法務チームはこのプログラムを認めているとIBMの担当者は述べている。データは、「Diversity in Faces」というプロジェクトを通じて学術研究者のみに提供されている。顔には、性別や年齢などの要素のアノテーションが付けられているという。アノテーションは人による判定と幾何学的な計測によるものだ。AIの公正性を損なう恐れのあるバイアスがかからないよう、研究者を支援することを意図しているという。
IBMの広報担当であるSaswato Das氏は声明で次のように述べている。「当社は個人のプライバシーを非常に重視しており、Diversity in Facesのデータセットを公開されている画像アノテーションのみに制限したり、データセットの利用を正当な研究者に限定したりして、プライバシーの原則に従うよう大いに注意を払ってきた。このデータセットからオプトアウトすることもできる」
読者もクリエイティブ・コモンズの理念を気に入るかもしれない。たとえば、AIシステムから人種バイアスを取り除く目的や、Mozillaの「Common Voice」プロジェクトのように音声認識を向上する目的で、研究者が自由に利用できるデータを共有することが称賛に値する目標であるのは間違いない。
CCライセンスを管理する非営利団体Creative Commonsは、IBMによる今回の利用についてコメントしていない。だが、最高経営責任者(CEO)のRyan Merkley氏は、AIシステムのトレーニングに顔が利用された件は、単なるライセンス問題よりも広範囲に及ぶ問題だと述べている。
「当団体のツールは著作権問題を解決するために設計されたものであり、それはうまくいっている。だが、著作権は、プライバシーや研究倫理、監視用AIに対処するのに適切なツールではない」(Merkley氏)
Creative Commonsは13日、IBMによるFlickr利用の件に関するブログとより広範なAIの状況についてのFAQを公開した。
争点の1つは、IBMによる利用が非営利的かどうかだ。IBMは画像を学術研究者にしか提供していないが、AIの世界においては注目を浴びる立場であることから商業的な利益も得ている。IBMは、プログラムのもっと広範な営利問題についてコメントしていない。
Merkley氏は、IBMによる利用について見解を示していない。だが、許可するかどうかは、CCライセンス下にある画像を誰が利用しているかではなく、どう利用しているかどうかによるとして、「企業だからといって、非営利コンテンツを利用できないとは限らない」と述べている。
コレクションにはPeverill-Conti氏の写真が700枚以上含まれており、NBC Newsによると、IBMにデータセットから自分が撮影した写真を取り除かせるのに苦労した撮影者もいるという。Peverill-Conti氏にコメントを求めたが、回答はなかった。
SmugMugのCEOでFlickrを率いる立場にあるDon MacAskill氏は12日、IBMが写真を取得したのはSmugMugがFlickrを買収する前だったとツイートした。だが、同氏は、Creative Commonsの原則に従っているとして、IBMのような利用方法を擁護した。
Flickrには、CCライセンス下で共有されている写真が4億枚以上ある。Flickrは、米Yahoo傘下にあったころの、写真家に1テラバイトの写真ストレージを無料提供するプランを廃止したが、CCライセンス下の写真は容量制限の対象外にしている。
「私たちは、フォトグラファーと、彼らが作品に適用するライセンスを選ぶ権利を積極的に支持する。デフォルトでは、彼らがすべての権利を保持しており、希望に応じてそれをゆるめる選択肢が提供されている」とMacAskill氏はツイートしている。
「すでにCreative Commonsのライセンスを選択しているため、彼らはデータセットにオプトインする必要はなかった。彼らはすでにアクションしていたのだから。これがライセンスの仕組みだ。この仕組みのおかげで、世界中のアーティストや科学者がCCライセンスの適用されたものを使って創造したり発明したりすることが可能になっている」と同氏は付け加えた。
この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス