驀進するAIアートの陰で

リアラ・ルーが今や大人気の新テクノロジーを考察する

文: Liara Roux
アートワーク: Gavin Park

原作からの派生はどこまで許されるのか？模倣されることは、ある意味で自尊心をくすぐる。だが、別の見方をすれば盗用だ。AIアートは、誰でも新しいツールを利用できるようになった2022年後半以降、大きく躍進しており、私のソーシャルメディアのフィードにも押し寄せている。中には新しいツールで斬新な作品を作り出したアーティストもいる。例えばファッションフォトグラファーのチャーリー・エングマン(Charlie Engman)がツールを使いこなしたシュールな作品は、それまでの作品群と難なく調和している。St4ngeThingはルネサンス期のファッションにアイデアを得たストリートウェアを生成し、Vaqueraはゴシックな雰囲気の不気味なランウェイのイメージで、「FASHION IS DEAD -ファッションは死んだ」と宣告している。

AIの威力はいとも簡単に感じとれる。現実世界で何枚もの写真を相手に苦労することも、Blenderでデジタル処理する必要もなく、短時間でアイデアを展開できるのだ。アーティストのあいだでは、特に営利の文脈で、AIの利用に対する非難の声も上がっている。企業が自分たちの作品を無償で搾取しているという主張だ。この難問に対応するため、米国では知的所有権に関する複雑な法律が制定された。私たちの誰もが規則を守らなければならないように、進出しつつあるAIに規則を守らせるにはどうすればいいのか？

まず最初に、人工知能という呼び方は不正確ではないだろうか。現在広く利用されている「人工知能」にはGPT(generative pretrained transformer)と拡散モデルの2種類がある。両方とも人工ニューラルネットワーク(ANN)の形態だ。

現在のところ、ANNの一般的なタイプはGPTであり、もっとも優秀なテキストベースのAIプログラムに貢献している。突出した人気を誇るOpenAIのChatGPTは、この記事を書いている時点でユーザーが1億人を超える。私自身フランス語の練習に利用しているし、ビジネス立ち上げ時のコピーを書くのに使った友人もいる。以前の言語処理プログラムは、与えられたタスクに関連すると考えられるテキストのみで準備されていたが、GPTはそれとは異なり、まず大量の汎用テキストで準備され、その後特定の命令を与えられる。

Stable DiffusionやDALL-E 2など、拡散モデルのANNは画像生成が中心で、特定のテキスト記述に関連付く無限の視覚イメージを基盤とする。次に「ノイズ」画像が与えられる。基本的に、昔のテレビ画面のノイズと同じようなものだ。その後、ノイズの中から画像を探し出すように命令される。雲を見ていると人の顔に見えたり、じっと天井を見上げるうちに奇妙なイメージが浮かび上がってくる、あれと似たような現象だ。

そのように機能するのだから、どちらのモデルも本当にインテリジェントとは言えないと思う。十分な自己認識がないのだ。Stable DiffusionやChatGPTに自己の定義を指示しても、構築に不可欠な要素として、真に深い洞察力のある自己参照は含まれていない。もし膨大な時間をかけて自己および他者との対話を基にChatGPTを構築し、さらに、それらのデータに基づいた反映やアウトプットを継続し続ければ、徐々に意識の方向へ向かうのかもしれない。

認識とは私たちひとりひとりの独自の視点であり、作品に変容の力を与えるものだ。著作権法を考えるときには、この点が極めて大きな意味を持つ。事実、これらのAIは、逐語的に準備されたテキストに符合するコンテンツを吐き出すことが多い。あちこちから盗用した内容でレポートを提出する高校生だって、その辺りの要領は心得ている。だが、アーティストが明確な美学を表現するために意図的に生成したAIアートと、ただ包括的な指示を入力しただけのAIアートは、簡単に見分けられる。エングマンは「『受賞者』や『誇り』といった感情のレイヤーを付け足すと、AIは新しい方法で画像を解釈した」と『SZ Magazin』で語っている。AIジェネレーターはそのような抽象的概念を表現することはできるが、今のところ、体験に共感することはできない。だから、これらのAIモデルをアーティストとかキュレーターと呼ぶ人も多いけれど、私としては、絵筆やカメラのように、アーティストが使う他の道具と比較する方が妥当だと思う。

1980年代、アンディ・ウォーホル(Andy Warhol)が著作権のある写真、映画のスチール写真、ロゴ、広告、缶スープを流用して作品を作ったことは有名だ。彼は、訴えられるたび、自分の作品はオリジナルを変容したものだと主張した。カトリックのミサで、素朴なウエハースが文字通りキリストの体に変容するように、自分は元の物体をアートに変えたのだと抗弁した。

このことは当時も騒動を巻き起こしたし、年月を経た現在なお、ウォーホルの作品は論争の的になる。米国最高裁は、2022年、自分の作品を使用したウォーホルから対価を受け取る権利があると主張する写真家リン・ゴールドスミス(Lynn Goldsmith)の審理を開始した。最終的な判断はまだ下されていない。

商業目的の模倣を正当化するのは、もう少し難しい。ウォーホルの審議中、最高裁判事エレナ・ケイガン(Elena Kagan)は、「自分たちの行為が根本的に変容的利用ではありえないという見解に、映画製作者は驚くかもしれない」との考察を示した。事実、映画製作者はただ本を読んで、映画化を決めるわけにはいかないのだ。著者の労働に対する適切な対価を保証するために、映画製作者は著作に対する権利を支払わなくてはならない。

Stable DiffusionやChatGPTは、私の知る限り、構築に貢献した知的財産に対する対価を誰にも支払っていない。アーティストやライターたちは、モデルを構築するための巨大なリポジトリに、作品のすべてを呑み込まれている。ほぼ盗用と言えるほど、アーティストの作品に酷似した作品を生成する場合さえあるのに。

私自身、AIを構築するデータの一部だ。セルフィーも書いた文章も吸収されている。私のツイートを真似るボットがいるのをご覧いただきたい。1月には、4chanへの投稿で、私自身がAIの生成物だとさえ非難された。もっと若かった頃に付き合いのあったアナーキーなハッカー人種は、情報は解放を求めていると主張したものだ。模倣は自然なことだし、人類の進化にはミーム的コミュニケーションが不可欠だと言っていた。インターネット経験の浅かった当時の私は、トレンドや情報が菌類のようにデジタルネットワーク全体へ繁殖していく様を目の当たりにして、彼らの言い分が正しく思えた。今は、企業が私の大切な素晴らしい友人たちから甘い汁を吸い、ソーシャルメディアへ無償で提供した労働から大金を稼いでいるのを目の当たりにしている。

友達のキャロライン・コールドウェル(Caroline Caldwell)はイラストレーターでタトゥーアーティストだが、新興クラフトビールのラベルやインスピレーションTシャツを作るデザイナーたちに、しょっちゅうデザインを盗まれると言う。何とか食べていける程度の生活を送りながら、AIのせいでもっと事態が悪くなるのではないかと懸念し、苦痛と苛立ちを感じている。彼女にとって、アートとは人間らしい何か、繋がりを作り出す何かを創造することだ。もちろん、AIアートを使ってそういう力のある視覚イメージを作れることも認めよう。だけど、本当に理解され、存在を認められ、少しは孤独でなくなったように感じさせる作品を、果たして作り出せたことがあるだろうか？私たちはAIアートが生成した視覚イメージを単なるピクセルの集合体として眺め、純粋に美学的見地から魅力を判断することはできる。だけど、多くの人にとって一番大切なのは、実はアートに潜む人間の要素だ。ただ画像を見ることではなく、誰かと繋がり、おそらくは同じことを感じることかもしれない。

ChatGPTの原則は、大量のテキストデータを取り込み、その後学習していくことだ。一方Stable Diffusionのようなモデルは、予めクリーンアップとカリブレーションを行なったデータに基づいて構築する必要がある。その膨大なデータの準備作業は大抵グローバルサウスにある会社が請負い、従業員には搾取的な賃金しか支払われない。

CAPTCHAを利用した人は誰もが、言葉や文章をタイプ入力し、歩道や街路灯を特定することで、AIの構築準備に参加している。4chanを根城にしたネット荒らしのグループが、CAPTCHAでデジタル化された電子書籍に悪意の雑言を挿入する目的で、目についたCAPTCHAに片っ端から非難中傷を書き込んだ時期があった。OpenAIやその他の会社はAIに関するガイドラインを組み込んでいるものの、安価な、あるいは無償の労働を利用する考えにはゾッとする。4chanの荒らし集団が、故意に攻撃的な画像やトラウマになるような画像を安全とタグ付けし、テスラに子供たちを轢かせようと企てることがないと誰が断言できるだろう。

企業はどうしてそれほど躍起になって、文章や画像を生成しようとするのか？文を書いたり視覚イメージを作ることは、非常に人間的なタスクだ。人間のニューラルネットワークは、すでに言語やイメージの処理に適応している。AIの用途としては、医療研究、安全措置、リスク分析など、人間につきものの誤謬や弱点を補える領域に目を向けるほうが意義深いのではないか？

車線変更を阻止して交通事故を防止する、ガンの早期発見を助ける、送電網や公共交通機関の効率を向上する等の領域で、AIは力を発揮している。アーティストであり教育者でもあるメラニー・ホフ(Melanie Hoff)は、AIを私たちの手に取り戻すことは可能だと言う。AIの「構造は、以前の構造や以前の構造の生成物を使うよりはるかに刺激的なツール」だし、「(ChatGPTやStable Diffusionの)マイナス面は、ユーザーが独自のデータベースやAI構造を作る代わりに、事前準備された大規模なデータセットを使うこと」だと指摘する。

ホフが教えてくれた自作の「Partisan Thesaurus」は、一般的に関連性のある言葉を結びつける初歩的なAIだ。一方は共和党のスピーチと文書、もう一方は民主党のスピーチと文書というふたつのテキストグループで準備した結果、曖昧になりかねない素のバイアスがかけられた。また、ソフトウェア開発者ボマニ・オセニ・マクレンドン(Bomani Oseni McClendon)の業績から、特に『Black Health』に触れた。WebMDのデータから「黒人」あるいは「アフリカ系」への言及を抽出したこの本は、医療分野に浮かび上がった偏向を厳しく糾弾するものだ。

これらの仕事は、消費や宣伝だけを目的に、既存のコンテンツを搾取してさらに多量のコンテンツを生成するよりはるかに興味深い。人間にとって困難や長時間を意味する仕事を簡便化する目的でAIを利用しているが、それこそが本来コンピュータに求められる作業だし、曖昧になりかねない物事も明確になる。これがAIの核心ではないのか？

ジャーナリストのエドワード・オングウェソ・ジュニア(Edward Ongweso Jr)は、テック企業が神を構築しようとする可能性を危惧している。「(AIを)社会に統合すれば、僕らが向上すると思ってるんだ。(AIが)リソースをもっとうまく編成してより良い政治を実現する、監督者として機能すると考えている」。しかしAIの「神」は、人々の生活向上を目指す人間中心の体制を作り出す代わりに、人間からさらに多くの利益と時間と注意力を絞り出す目的に利用されるだろう。

AIの領域は不明瞭だし、企業も非常に秘密主義だ。アルゴリズムもデータセットも、すべてが独占所有権で厳重に保護されている。AI分野で働いている友人たちは誰もが、申し訳なさそうに、会社に禁止されているから公表を前提とした話はできないと言う。シリコンバレーが掲げた「すばやく行動し、破壊せよ」の精神が私たちの政治、社会生活、思考に及ぼした影響を考えるなら、遂に、それらの企業のスピードを落とすべき時が来たのだろう。彼らが構築するシステムがどのようなものであれ、あくまで人間性を念頭に置くものであり、それでなくても限界まで乱用された世界からさらに可能な限りの富を絞り出そうとするものであってはならない。

米国南部の農業に輪作を導入したジョージ・ワシントン・カーヴァ―(George Washington Carver)が脳裏に浮かぶ。ただ耕地を切り拓いて、毎年毎年、同じ作物を栽培し続けることはできないのだ。土壌の疲弊を防ぐには、違う種類の作物を一定の順序で栽培し、何かを土壌へ還元しなくてはならない。ChatGPTやStable Diffusionは本当に何かを還元しているだろうか？

設立当初のOpenAIは、非営利組織として、人工知能テクノロジーに関わる透明性を促進するはずだった。ところが実際は営利目的の子会社を作り、秘密主義ではGoogleのAI研究部門を凌ぐほどだ。すばやく行動して破壊した前回の結果からシリコンバレーがスピードダウンを学んだことを願いたいが、新テクノロジーの適切な利用と規制の擁護はユーザー次第だ。才能あるアーティストが使えば、AIは社会にとって意義も価値もあるものを作り出せる。私たちは、今以上にどれだけ多くの写真や動画やテキストを生成して関心を競い合う必要があるだろうか？イラストレーターの仕事に対価を支払う代わりに、AIを使い、本質的に派生でしかありえない画像を作ることにどんな意味があるだろうか？

文: Liara Roux
アートワーク: Gavin Park
翻訳: Yoriko Inoue
Date: April 3, 2023