Cuatro vectores hacia una cultura de la IA

Ilustración © Romualdo Faura

Las habilidades creativas ya pueden ser replicadas a través de aprendizaje profundo (deep learning) y redes neuronales, pero su verdadero potencial reside en la posibilidad de la colaboración y no del reemplazo. Dos subjetividades distintas, una humana y otra automatizada, pueden encontrarse a mitad de camino y producir un espacio simbólico mutuo y tentador, lleno de posibilidades, pero también de vías muertas. Aventurar qué impacto artístico tendrá la IA a medio plazo es tan prematuro como soberbio.

El mito de la creatividad

El fantasma de la automatización y su impacto sobre el mercado laboral y la forma de la sociedad del mañana ha generado incontables análisis y pronósticos en lo que llevamos de siglo XXI. Durante un tiempo, en estos debates se aplicaba una regla lineal: cuanto más mecánica y rutinaria fuese una tarea, más sencillo sería automatizarla. Desde esta lógica, aquellas  profesiones en las que la creatividad jugase un papel central serían las que estarían más a salvo del reemplazo. Esta especie de “excepción creativa” reafirmaba, en cierta manera, un estatus especial de los artistas y creadores en la sociedad.

Si algún efecto revelador ha tenido la explosión —desde el verano de 2022— de herramientas de IA para la creación en múltiples ámbitos, ha sido acabar con este espejismo. La aplicación con fines productivos de herramientas como ChatGPT o Midjourney no busca, en la mayoría de los casos, la excelencia artística, sino la eficiencia rentable. “Suficientemente bueno (e infinitamente más barato)” es el factor decisivo en unas industrias creativas en las que la gran mayoría de tareas cotidianas  no aspiran a la originalidad extrema ni a la ruptura de los moldes establecidos. Desde esta posición, los dibujantes, músicos, periodistas o realizadores de video empiezan a reconocerse en la misma posición que cualquier otro colectivo sujeto a la imposición de un nuevo orden emergente, que no negocia sus condiciones.

Acumulación por desposesión (digital)

Cualquier aplicación creativa de IA opera a partir de un modelo entrenado con enormes cantidades de datos. Stable Diffusion, uno de los generadores de imágenes más populares, desarrolló su modelo a partir del conjunto de datos LAION-5B, publicado en abierto en internet en marzo de 2022. LAION-5B consta de casi 6.000 millones de archivos que combinan imágenes con etiquetas de texto que identifican su contenido. Cualquiera que tenga curiosidad por averiguar qué se encuentra en el interior del modelo puede descargarlo desde https://laion.ai/blog/laion-5b/, pero la respuesta es predecible: imágenes obtenidas en internet, producto del esfuerzo colectivo cotidiano realizado por todos nosotros, los usuarios de la red.

A lo largo de los últimos treinta años, pero en especial durante la era dorada del social media y la emergencia del smartphone a partir de 2007, la producción social de datos en grandes volúmenes ha sido parte del pacto implícito en el modelo económico de la industria de internet. El trato aceptado por todos era sencillo: a cambio de utilizar de manera gratuita toda clase de servicios digitales, se nos anima a producir y compartir activamente cuanta más información mejor. Inicialmente, la cadena de valor consistía en la agregación de datos personales a gran escala, que permitiesen la producción de perfiles de consumidores, empaquetarlas y convertirlas en mercancía.  

La industria del aprendizaje automático ha añadido una capa de valor adicional a estas montañas de contenido que la web atesora. Esta es la materia prima idónea para entrenar modelos con capacidad de producir lo que algunos llaman “inteligencia” y otros, simplemente, “capacidad de predicción estadística”. Un generador de imágenes automáticas puede producir un gato de cualquier raza y color con fidelidad y precisión, porque el modelo puede alimentarse de una infinita disponibilidad de imágenes de gatos procedentes de la web.

Detrás de cada una de esas imágenes subidas a una red social, a un álbum de fotos o a una noticia en un medio de comunicación, hay ciudadanos, autores, creadores, artistas, fotógrafos profesionales o aficionados, y cualquier otra categoría de productor imaginable. Por supuesto, ninguna compañía de deep learning ha hecho un esfuerzo previo por obtener los derechos de uso de esas imágenes. Tampoco se ha limitado a utilizar imágenes libres de derechos o amparadas en sistemas de licencias libres, como las Creative Commons. Los creadores de algunos de los servicios más populares, como Midjourney, se han excusado aludiendo a la imposibilidad de producir una herramienta como esta si tuviesen que obtener individualmente los derechos de uso de miles de millones de imágenes. La responsabilidad se ha invertido, y es el autor el que debe solicitar expresamente que sus imágenes sean excluidas del modelo.

El término acumulación por desposesión, acuñado por el geógrafo urbano y teórico social marxista David Harvey para designar la capacidad del capitalismo para mercantilizar lo que previamente era compartido y común, se expresa a la perfección en este proceso. Incluso si consideramos el potencial expresivo y creativo de estas nuevas herramientas como socialmente beneficioso y artísticamente productivo, el capital simbólico y cognitivo de una gran tarea colectiva vuelve a quedar controlado y capturado de manera extractiva por unos pocos.

Centauros

En todos los diagnósticos iniciales, la emergencia de la IA como una fuerza transformadora se considera desde la lógica de la sustitución: los robots y los sistemas automáticos ocuparán nuestro lugar. Pero tan cierto es que muchas habilidades pueden ser replicadas, como que el verdadero potencial de la IA como nuevo paradigma para la creación procede de la posibilidad de la colaboración, no del reemplazo. Dos  subjetividades distintas, una humana y otra automatizada, pueden encontrarse a mitad de camino y producir un espacio simbólico mutuo, con resultados diferentes a los que los creadores podrían llegar por si solos.

En realidad, que escritores, músicos o arquitectos deleguen decisiones fundamentalmente creativas en sistemas de reglas, procesos evolutivos autónomos o herramientas con capacidad de producir respuestas propias no es particularmente nuevo. Hay precedentes, desde la larga tradición de la escritura automática y el cut-up, el arte basado en instrucciones y el arte algorítmico de los años sesenta del siglo xx, hasta las múltiples herramientas generativas que productores de música electrónica o arquitectos parametricistas han utilizado de manera cotidiana en las últimas dos décadas. 

El diseñador de interacción Matt Jones utiliza la evocadora imagen del centauro, la criatura mitológica mitad humano y mitad caballo, para promover una visión simbiótica de la colaboración creativa entre humanos y máquinas. Cada una de las dos partes de ese creador híbrido aporta sus mejores activos y capacidades, descansando sobre la otra en aquellos aspectos en que está en desventaja.

El medio es el modelo

En julio de 2015, el programador de Google Alexander Mordvintsev lanzó el proyecto DeepDream, una herramienta que utiliza una red neuronal para buscar el rastro de imágenes posibles dentro de otras ya existentes. Las imágenes producidas por DeepDream son caleidoscopios visuales que es inevitable relacionar con la estética de la psicodelia, el referente más a mano para reconocerlas como parte de una tradición anterior. En los años siguientes, los artistas que exploraron el espacio de posibilidad de las redes neuronales y el aprendizaje profundo, se volcaron en el uso de las redes neuronales generativas adversarias (GAN), una metodología específica para la producción de imágenes. En los proyectos de Gene Kogan, Mario Klingemann o Anna Ridler, las GAN nos muestran todas las variaciones posibles que podrían existir en el proceso de transformar una imagen en otra distinta, en un flujo visual potencialmente infinito.

En julio de 2022, OpenAI, uno de los gigantes de la industria del deep learning, permitió el acceso público a su servicio DALL·E 2, la primera herramienta popular de generación de imágenes en utilizar una tecnología específica de aprendizaje profundo, llamada transformador (transformer). Las imágenes producidas a través de DALL·E 2 han inundado los canales digitales rápidamente. Se caracterizan por un fotorrealismo imperfecto que es capaz de producir imágenes a primera vista verídicas, pero que al ser exploradas con mayor detalle revelan inconsistencias, como rostros borrosos o deformados. Es fácil relacionar un retrato generado con DALL·E con un esbozo del pintor Francis Bacon.

A DALL·E 2 le han sucedido rápidamente otros transformadores, como Stable Diffusion o Midjourney, quizás el más popular de todos en el momento de escribir este artículo. Midjourney se ha convertido en una especie de atlas implícito de la historia de la cultura visual. Sus usuarios aprenden pronto que utilizar el comando “En el estilo de” permite producir imágenes que reproducen la estética de cualquier pintor, ilustrador o cineasta. Pero el modelo indudablemente tiene sesgos, como cualquier tecnología basada en el análisis estadístico. Por ejemplo, resulta sorprendentemente fácil producir imágenes que clonan el estilo del director de cine norteamericano Wes Anderson; sus colores saturados, encuadres planos y composiciones simétricas resultan relativamente sencillos de imitar para el modelo, por lo que se generan sin cesar imágenes “en el estilo de” Anderson.

Sin necesidad de ninguna formación especial, cualquiera podría diferenciar a simple vista una imagen producida con DeepDream de otras generadas con una GAN, con DALL·E 2 o con Midjourney. Pero además, los artistas más destacados en este medio (Refik Anadol, Holly Herndon y Mat Dryhurst) son los que están produciendo sus propios modelos, en vez de limitarse a utilizar las mismas herramientas genéricas que todos los demás emplean.

En menos de una década de prácticas artísticas frenéticas alrededor del aprendizaje profundo y las redes neuronales, los modelos grandes del lenguaje, las GAN y los transformadores generativos, las estéticas posibles de la inteligencia artificial se están revelando como un espacio tentador, lleno de posibilidades y de vías muertas, de lugares comunes, pero también de profundo extrañamiento. Cualquier conclusión rotunda y tajante sobre el impacto artístico de las tecnologías de IA a medio plazo sería tan prematura como soberbia.

 

El boletín

Suscríbete a nuestro boletín para estar informado de las novedades de Barcelona Metròpolis