«Bouger vite et casser des trucs»:
le problème avec l’art IA

L’autrice Liara Roux nous donne son avis
sur cette nouvelle technologie en plein essor.

  • Texte: Liara Roux
  • Images générées par IA: Gavin Park

Où trace-t-on la ligne entre le clin d’œil et le plagiat? Difficile de trancher, puisque selon les perspectives, l’imitation peut relever de la flatterie comme du vol. Depuis la fin de 2022, le public dispose de nouveaux outils technologiques. L’art créé par l’intelligence artificielle connaît ainsi un essor fulgurant, tel qu’en témoignent mes réseaux sociaux qui en sont saturés. Plusieurs artistes ont produit de remarquables œuvres inédites avec ces outils. Le photographe de mode Charlie Engman exploite effectivement l’IA pour concevoir des clichés surréalistes en parfaite continuité avec son univers, tandis que Str4ngeThing l’utilise pour confectionner des vêtements de streetwear inspirés de la Renaissance. Sur son compte Instagram, la marque Vaquera a publié des images d’un défilé gothique inquiétant et a intitulé ce diaporama généré par ordinateur «FASHION IS DEAD [LA MODE EST MORTE]».

L’intelligence artificielle a un potentiel indéniable: elle nous permet de concrétiser rapidement des idées sans devoir le faire en personne sur un plateau de tournage, ou à l’aide du logiciel Blender. Cela dit, plusieurs artistes ont critiqué l’utilisation de l’IA, en particulier dans des contextes commerciaux, affirmant que certaines entreprises s’en servent pour s’approprier leur travail sans les rémunérer. Le système juridique américain a par ailleurs établi des lois complexes sur la propriété intellectuelle afin de résoudre le problème suivant: comment fait-on pour s’assurer que l’IA se développe dans le respect de nos règles sociales?

Pour commencer, le terme «intelligence artificielle» n’est peut-être pas tout à fait juste. Il existe actuellement deux types prisés d’IA: les transformateurs génératifs préentraînés (GPT) et les modèles d’apprentissage automatique, qui constituent deux catégories de réseaux neuronaux artificiels (RNA).

Les GPT demeurent aujourd’hui les plus répandus et ont notamment ouvert la voie aux modèles de langage d’IA les plus performants de l’industrie. L’agent conversationnel ChatGPT d’OpenAI jouit d’ailleurs d’un immense succès, puisque plus de 100 millions de personnes l’utilisent au moment où j’écris ces lignes. Je l’ai essayé pour améliorer mon français et mon ami s’en est servi à des fins rédactionnelles pour son entreprise en démarrage. Contrairement à la manière dont on entraînait les anciens modèles de langage, c’est-à-dire exclusivement à partir de textes considérés pertinents pour une tâche précise à accomplir, on alimente maintenant les GPT avec des données générales. On ne leur fournit que plus tard des directives détaillées.

Les modèles d’apprentissage automatique, comme Stable Diffusion et DALL-E 2, se concentrent plutôt sur la génération d’images. On les entraîne avec une multitude de supports visuels associés à des descriptions textuelles, puis on leur fournit ensuite une image «embrouillée» à décoder – qui ressemble essentiellement à la friture d’une vieille télévision cathodique. Si vous avez déjà aperçu un visage dans les nuages, ou longtemps observé votre plafond au point d’y déceler d’étranges représentations, vous avez sensiblement procédé de la même manière.

Étant donné la façon dont ils fonctionnent, je ne pense pas qu’on puisse qualifier l’un ou l’autre de ces RNA de réellement intelligent. Ils n’ont pas assez connaissance d’eux-mêmes. On peut bien sûr demander à Stable Diffusion ou à ChatGPT de se définir, mais ils ne sont pas vraiment autoréférentiels; cette limitation fait partie intégrante de leur structure. Hypothétiquement parlant, si ChatGPT s’entraînait à long terme à analyser son «individualité» et ses conversations avec les internautes, puis à traiter en profondeur ces données, il pourrait finir par développer une conscience.

C’est notre conscience, soit notre propre manière d’appréhender le monde, qui nous permet de créer des œuvres réellement transformatrices – une caractéristique déterminante en ce qui concerne la législation sur le droit d’auteur. En fait, l’IA pond souvent du contenu qui correspond mot pour mot aux textes avec lesquels on l’a formée, contrairement aux plagiaires de l’école secondaire qui savent modifier l’essai copié juste assez pour que ça passe inaperçu. À leur défense, ce talent-là a au moins le mérite de témoigner d’une véritable forme d’intelligence. Les œuvres d’IA conçues par des artistes selon un but précis se distinguent facilement de celles qui résultent de requêtes génériques. Charlie Engman a d’ailleurs expliqué ainsi sa démarche au SZ Magazin: «Lorsque j’ajoutais une dimension émotionnelle à l’image, par le biais de mots comme “lauréat” ou “fierté”, l’IA l’interprétait d’une nouvelle manière.» Ces modèles parviennent donc à représenter des concepts abstraits, mais demeurent toutefois incapables d’éprouver de l’empathie, c’est-à-dire de les ressentir. Même si de nombreuses personnes affirment qu’ils constituent des artistes à part entière ou de précieux moyens d’effectuer une sélection experte, je préfère les comparer à n’importe quel outil dont disposent les créateur·trice·s – un pinceau ou un appareil photo, par exemple.

Dans les années 80, pour réaliser ses propres œuvres, Andy Warhol s’est souvent approprié des clichés, des photographies de films, des publicités, des conserves de soupe et des logos protégés par des droits d’auteur. Chaque fois qu’on le poursuivait en justice, il se défendait en évoquant le caractère transformateur de sa démarche. À l’instar du prêtre disant que l’hostie représente littéralement le corps du Christ durant la messe, Warhol affirmait qu’il convertissait ces objets en œuvres d’ART.Si, à l’époque, cette approche a provoqué maints remous, le travail de Warhol suscite toujours la controverse des décennies plus tard. En 2022, la photographe Lynn Goldsmith s’est adressée à la Cour suprême pour exiger une compensation quant à l’utilisation de ses œuvres par Warhol. Le verdict n’a pas encore été rendu.Lorsqu’il est question d’œuvres à visée commerciales, l’imitation s’avère plus difficilement justifiable. «Je pense que les cinéastes pourraient trouver surprenante l’idée que leurs films ne sont peut-être pas fondamentalement transformateurs», a déclaré Elena Kagan, adjointe à la Cour suprême, lors des plaidoiries concernant Warhol et Goldsmith. En effet, les cinéastes ne peuvent pas juste lire un livre et décider de l’adapter au grand écran. Pour rémunérer équitablement les écrivain·e·s, les productions doivent acquitter leurs redevances de droits d’auteur.En revanche, les gens dont la propriété intellectuelle a contribué à l’entraînement de Stable Diffusion et ChatGPT n’ont, à ma connaissance, jamais été dédommagés. Plusieurs artistes ont ainsi vu leur travail entier englouti dans les vastes répertoires de données qui alimentent ces modèles. Certaines œuvres produites par l’IA ressemblent d’ailleurs tellement à leurs créations qu’on pourrait parler de vol.Je participe moi-même à l’entraînement de ces modèles d’IA; mes égoportraits et mes textes les nourrissent et il existe un robot capable de rédiger des tweets à ma manière. En janvier dernier, on m’a même accusée sur 4chan d’être une entité générée par ordinateur. Ado, je fréquentais des pirates informatiques anarchistes qui prêchaient que l’information cherche toujours à se libérer, que l’imitation nous est naturelle et que la communication mimétique s’avère essentielle à l’évolution de l’humanité. Ces idées me semblaient certainement vraies à l’époque où je commençais à surfer sur internet et voyais les tendances et l’information se répandre comme du mycélium dans l’univers numérique. Aujourd’hui, c’est différent: je constate que les entreprises exploitent désormais la jeunesse branchée pour générer des profits grâce au contenu gratuit qu’elle publie sur les réseaux sociaux.

Caroline Caldwell, une amie illustratrice et tatoueuse, m’a d’ailleurs confié que des graphistes s’approprient souvent ses conceptions pour créer des étiquettes de bière à la mode ou des chemises ornées de messages inspirants. Elle craint que l’IA ne fasse qu’aggraver le problème alors qu’elle peine déjà à gagner sa vie et ressent maintes frustrations à ce sujet. Selon elle, l’art doit être pétri d’humanité, nous rapprocher. Mon amie sait bien sûr qu’on arrive à produire des images attrayantes avec l’IA, mais ce faisant conçoit-on quelque chose qui permet réellement aux gens de se sentir compris, vus, moins seuls? On peut prendre ces images comme de simples collections de pixels, juger leur valeur selon une perspective purement esthétique, mais pour plusieurs, la portée humaine d’une œuvre constitue sa plus importante caractéristique. On ne fait pas qu’observer une image, on cherche à établir un lien avec la personne qui l’a créée, à ressentir la même chose qu’elle.

Essentiellement, ChatGPT se base sur plusieurs textes qu’il traite en toute liberté; il affine son processus seulement plus tard. Des modèles comme Stable Diffusion doivent plutôt être formés à partir d’un nombre (phénoménal) de données corrigées et calibrées. En général, on confie surtout ce type de triage à des entreprises basées dans les pays du Sud, lesquelles paient des salaires dérisoires à leur personnel.

Chaque fois qu’on utilise des CAPTCHA, on contribue à l’entraînement de l’IA en y tapant des mots et des lettres, ou en y identifiant des photos de trottoirs et de réverbères. Pendant un certain temps, des trolls de 4chan les remplissaient d’insultes en espérant ainsi insérer des bêtises dans les livres électroniques qui ont été numérisés à l’aide de ces systèmes de vérification. Les modèles de langage d’OpenAI et d’autres entreprises comportent heureusement des lignes directrices intégrées pour pallier ce problème, mais l’idée d’encourager la main-d’œuvre gratuite ou bon marché me pue au nez… Et qui peut me garantir qu’aucun troll ne clique sur des images d’enfants pour rendre les voitures Tesla enclines à les écraser, ou n’étiquette délibérément des visuels offensants ou traumatisants comme étant sûrs?

Pourquoi ces entreprises se concentrent-elles autant sur la génération de textes et d’images? Ces tâches sont pourtant intrinsèquement humaines, au sens où notre architecture neuronale s’organise d’emblée en fonction du traitement du langage et de l’imagerie. Ne serait-il pas plus intéressant de miser sur le potentiel de l’IA dans le domaine de la recherche médicale, des mesures de sécurité ou de l’analyse de risques, où elle pourrait compenser nos faiblesses et nos lacunes?

En matière de véhicules, l’intelligence artificielle a amélioré la sécurité au volant et certains systèmes empêchent les automobilistes de traverser sur la voie inverse. Elle a aidé le personnel médical à identifier des cancers à un stade précoce, et contribué à parfaire l’efficacité du réseau électrique et des transports publics. L’artiste et éducatrice Melanie Hoff souligne qu’on a le pouvoir de se réapproprier l’IA, que sa «structure constitue un moyen plus intéressant à utiliser que les systèmes préexistants et ce qu’ils produisent. Elle explique que «l’inconvénient [de ChatGPT et de Stable Diffusion] tient au fait que les gens exploitent de vastes répertoires de données préétablies […] au lieu de développer leurs propres banques de ressources et structures d’IA».

Melanie Hoff m’a aussi montré un des projets sur lesquels elle travaille, le Partisan Thesaurus. Ce modèle d’IA rudimentaire relie des mots souvent associés entre eux. Elle l’a entraîné avec deux corpus de textes différents, soit un ensemble de discours et d’écrits républicains, et un autre ensemble produit par des démocrates. Cet outil a ainsi mis en évidence des préjugés qui auraient autrement pu nous échapper. Elle m’a aussi fait découvrir Bomani Oseni McClendon, en particulier son ouvrage intitulé Black Health. Pour l’écrire, l’auteur a consulté WebMD afin d’y repérer des références aux termes «Noir·e·s» ou «Africain·ne·s» et le résultat de ses recherches s’avère des plus déconcertants: on constate que le milieu de la santé est foncièrement discriminatoire.

Ces initiatives me semblent beaucoup plus intéressantes que le fait d’exploiter ce qui existe déjà dans le but de créer encore plus de contenu jetable destiné exclusivement à la consommation ou à des fins publicitaires. Ici, l’IA sert plutôt à simplifier certaines tâches éprouvantes et fastidieuses pour l’être humain, mais faciles à réaliser pour un ordinateur. Elle vise à dévoiler des informations qui auraient pu autrement rester dans l’ombre. En fin de compte, n’est-ce pas là l’objectif premier de l’intelligence artificielle?

Le journaliste Edward Ongweso Jr m’a confié qu’il craignait que ces entreprises technologiques essaient en réalité de transformer l’IA en une sorte de dieu tout-puissant: «Elles pensent qu’intégrer [l’IA] dans notre société nous fera évoluer… Qu’elle nous supervisera, gérera mieux nos ressources et améliorera nos politiques.» Au lieu de développer des systèmes humanistes et bienveillants, on utilisera ces «divinités» artificiellement intelligentes pour générer davantage de profits et exploiter le temps et l’attention des gens.

Le secteur de l’IA est opaque et la grande discrétion dont font preuve les entreprises spécialisées dans ce domaine ne facilite pas les choses. Leurs algorithmes et leurs banques de données sont soigneusement protégés. Mes proches qui travaillent dans ce secteur m’ont confié, en s’excusant, que leur employeur leur interdisait de s’exprimer publiquement à propos de leur métier. L’éthos de la Silicon Valley consiste à «agir vite et à casser des trucs» et exerce un effet indéniable sur nos politiques, nos rapports sociaux ainsi que nos cerveaux. Il est donc peut-être temps de freiner l’élan des entreprises technologiques, d’insister pour que leurs systèmes servent d’abord au bien commun, et non pas qu’à l’exploitation maximale des richesses d’un monde déjà à bout de souffle.

La sagesse de George Washington Carver me vient à l’esprit: on ne peut pas opérer une ferme et y planter, année après année, les mêmes légumes dans le même sol sans l’appauvrir. Il faut alterner les variétés de plantes, donner quelque chose en retour à la terre et ainsi lui permettre de se régénérer. ChatGPT ou Stable Diffusion procèdent-ils vraiment de cette manière?

Au départ, OpenAI se voulait un OBNL visant à promouvoir la transparence en matière de technologies artificielles. Or, l’entreprise a fini par fonder une filiale à but lucratif aujourd’hui plus secrète que la division de recherche sur l’IA de Google. J’espère que la Silicon Valley a appris à se modérer depuis la dernière fois où elle a «bougé vite et cassé des trucs», même s’il incombera toujours aux internautes de plaider pour qu’on emploie et réglemente les nouvelles technologies à bon escient. Nul doute que des artistes parviennent à se servir de l’IA pour réaliser des œuvres évocatrices, voire profitables à la société… Mais doit-on nécessairement produire davantage de contenu? Un nombre incalculable de photos, de vidéos et de textes rivalisent déjà pour capter notre attention. Quel est l’intérêt de priver les graphistes de travail et d’avoir plutôt recours à l’IA pour créer des images qui sont d’emblée imitatrices, ne serait-ce qu’en regard de la façon dont elles sont produites?

  • Texte: Liara Roux
  • Images générées par IA: Gavin Park
  • Traduction: Francis Rose
  • Date: 3 avril 2023