L’IA en photographie : entre innovation et interrogations

Article paru dans le deuxième numéro du magazine Street Photography France.

L’intersection entre l’intelligence artificielle (IA) et la photographie a suscité un vif intérêt, engendrant une fascination naïve pour l’essor des images numériques créées ou assistées via cette technologie. Cependant, une exploration plus approfondie de cette convergence révèle un panorama plus complexe et potentiellement inquiétant.

Lorsqu’on interroge Google, par exemple, sur le fonctionnement de l’application-phare de génération d’images à partir de textes, MidJourney, on trouve quantité d’articles visant à montrer comment l’utiliser, avec des tutoriels pratiques, des exemples de commandes (prompt), mais finalement très peu de descriptions claires de son fonctionnement interne, et encore moins d’esquisses de critiques éclairées sur les tenants et aboutissants de ce type d’outil.

L’objectif de cet article n’est pas de vulgariser les aspects techniques de ses algorithmes, mais plutôt d’essayer de mettre en garde contre la généralisation des images produites par ceux-ci, et d’analyser les tenants et aboutissants de ce bouleversement.

Dans les processus de production numérique, où l’on a parfois l’impression que tout est égal, tout tend à se standardiser (l’interface web est la même pour tout le monde). On retrouve toutes les images générées par des algorithmes d’apprentissage automatique, avec des applications actuelles devenues très populaires comme Dall-E, MidJourney ou Stable Diffusion.

Les applications dédiées à la retouche photo ne sont pas en reste, comme Lightroom : de la correction automatique de l’exposition, en passant par la reconnaissance d’objets, d’arrière-plans ou de scènes, à la réduction du bruit numérique, en passant par l’augmentation de la résolution de l’image ou la suppression des objets indésirables, les processus sont désormais automatisés et ne sont pas tous égaux.

On peut distinguer les algorithmes « one-shot », qui réalisent une partie du processus, souvent dans l’idée de corriger une partie de l’image, une erreur technique déjà identifiée, et servir une intention artistique; ou bien créer cette image complète à l’aide d’un algorithme « d’apprentissage ». Nous nous concentrerons sur cette dernière catégorie.

Dans les applications de génération d’images à partir de textes, les programmeurs ont délibérément fait ingurgiter aux algorithmes aveugles, une quantité invraisemblable de créations humaines, glanées ci et là, sans qu’on puisse en deviner réellement la provenance, pose la question légitime de la parenté de l’image qui en résulte, en plus de celle de la propriété intellectuelle et, par conséquent, celle de son originalité.

L’esthétique à l’apparence lisse et sans défauts, extrêmement consensuelle de l’IA, risque fort bien de nous influencer dans nos choix créatifs futurs, que l’on réinjectera ensuite dans ces mêmes algorithmes, sorte de cannibalisme numérique ou régurgitation, pixel après pixel. La parenté de l’image générée dissoute par l’algorithme, un fantôme où ne reste plus qu’une sorte de création « à la manière de », l’humain s’auto-référençant à l’infini. Restent alors les créateurs des algorithmes, qui ne peuvent non plus prétendre à la paternité de l’œuvre.

L’image, créée pixel après pixel, tel un puzzle que la machine assemblerait aveuglément, ne rend pas compte du processus à l’œuvre, et diffère totalement de notre expérience de la vie. La machine expérimente et réalise une hybridation entre diverses caractéristiques d’images hétérogènes : en résulte alors un ultime pastiche généré en un temps éclair. L’IA génère alors des représentations sans référence directe à une réalité originale, et en ce sens, ce qui nous plonge tout droit dans ce que Jean Baudrillard nomme « l’hyper-réalité » : un monde constitué de copies qui n’ont pas de référent direct à une réalité authentique, et ont leur existence propre. La réalité perd alors de sa consistance, de sa tangibilité, et se transforme en une ombre, un spectre de ce qu’elle était avant l’avènement de la simulation généralisée, et de l’hyper-production d’images.

Apologie du temps long

Pour beaucoup de personnes, être créatif consiste à avoir des idées créatives. C’est vrai en partie, mais on oublie souvent l’aspect « exécution », le fait de s’adonner à une tâche créative sur le temps long. Les outils et les techniques artistiques servent à mettre en œuvre cette création.

Créer une image avec une IA telle MidJourney, c’est d’abord une idée ou une représentation mentale que l’on transforme en description textuelle, lisible par l’algorithme, et ensuite, une sélection d’images basée sur ce que nous propose cet algorithme.

La virtuosité de l’artiste réside alors dans la génération du texte de commande (le prompt), verbalisation d’une idée ou image mentale, chose ô combien différente d’un processus artistique classique, où l’idée et la réalisation se nourrissent l’une et l’autre, dans un processus de co-émergence.

Quand l’on crée, l’idée que nous avons est souvent floue, puis nous la matérialisons, puis s’affine cette idée et sa mise en œuvre. Et ainsi de suite, jusqu’à l’émergence d’une œuvre avec un aboutissement, moment laissé au libre choix de l’artiste. Cet aboutissement n’est alors plus la marque de l’humain ou un choix délibéré, mais bien laissé au bon vouloir de l’algorithme.

C’est cette séparation entre l’idée et la réalisation qui interroge, car nos idées premières sont souvent de mauvaise qualité et il faut absolument les confronter à la réalité, aux autres notamment, pour qu’elles prennent sens et s’inscrivent dans l’expérience humaine.

En ce sens, créer avec l’IA générative, c’est contribuer à une vision idéalisée du travail artistique comme pure idée de l’esprit, avec l’appropriation de l’image qui en résulte, par l’élaborateur du prompt.

En 1977, Larry Sultan et Mike Mandel publient « Evidence », un livre où les photos ont été sélectionnées parmi plus de 2 millions d’images d’archives d’institutions de recherche, pendant plusieurs années, pour n’en sélectionner que 59. Sultan et Mandel, conscients du fait qu’ils n’ont, à proprement parler, produit aucune de ces images, choisissent de s’adonner à une longue sélection qui fait sens. C’est la technique de l’appropriation, telle qu’elle existe depuis longtemps dans l’art. C’est ce temps long qui est nécessaire dans toute pratique artistique et est le sceau véritable de toute démarche artistique de qualité.

L’artisan photographe répond aux gigantesques et vertigineuses bases de données qui nourrissent ses algorithmes et ce qu’elles génèrent. Il soit alors composer avec l’existence de ces images et se poser en vrai défenseur du temps long, de la singularité humaine et de l’imperfection. Car c’est bien un certain idéal de perfection qui est à l’œuvre dans les applications dites « intelligentes » avec leur aspect lisse et sans aspérités, que l’on retrouve très souvent. L’IA, dans son apparente neutralité de style, génère en fait une forme de médiocrité.

La question de l’honnêteté de l’artiste et de son éthique en tant que créateur d’images n’est pas non plus en reste. Il ne s’agit pas de rejeter en bloc les utilisations de l’IA, mais plutôt d’en faire un usage raisonné. Car on ne peut pas mettre sur le même plan la stabilisation optique assistée par IA, et la génération d’images complètes à partir d’un texte. Il y a une nuance entre corriger intentionnellement un aspect technique, afin de servir une démarche artistique, et laisser le champ libre aux machines pour interpréter à notre place cette démarche, et nous faire des propositions en conséquence.

Il s’agit donc, en tant qu’artistes, de savoir où placer le curseur. Eric Sadin, philosophe techno-critique, rappelle à juste titre que l’on ne devrait pas poser le problème des avantages et inconvénients de ces technologies, mais plutôt celui de la maîtrise, ou non, que l’on a dessus : « Est-ce que nous, dans la pluralité de la société, avons décidé que des systèmes puissent produire du langage, de la représentation, des images, de la musique ? Non ! Ce n’est pas un projet de société avec tout ce qu’il implique : de la concertation, des rapports de force, des accords, de la contradiction de façon organique, évolutive… ».

L’absence d’une compréhension claire du fonctionnement interne de ces algorithmes, car détenus par des intérêts privés, propriétaires des ses programmes informatiques, et le manque de critiques éclairées, soulèvent des questions cruciales quant à la généralisation des images qu’ils produisent. Face aux vastes bases de données alimentant les algorithmes, l’artisan photographe incarne la défense du temps long, de la singularité humaine et de l’imperfection.

En fin de compte, le monstre fantomatique de l’IA en photographie, évoque une réalité dissoute, une ombre de ce qu’elle était, conforme à l’hyper-réalité simulée. Les créateurs d’algorithmes, tout comme les machines qu’ils conçoivent, se perdent dans un processus de régurgitation numérique, tandis que l’artisan photographe, gardien du temps long, tente de préserver un lien au réel, dans un monde inondé d’images artificielles. La question fondamentale demeure : dans la quête de perfection automatisée, perdons-nous la trace de ce qui rend véritablement humaine l’expérience de la création artistique ?

Les algorithmes utilisant l’intelligence artificielle sont aujourd’hui omniprésents, quasi-omniscients, et nous avons le choix de les rendre omnipotents. Il est à noter que chacune des innovations en intelligence artificielle, surtout dans le traitement des images numériques, possède un potentiel d’utilisation, en tant que moyen de surveillance et de punition. Dans cette optique, il nous faut prendre garde à ne pas nourrir délibérément le fantôme dans la machine.

Laisser un commentaire