inoticia

Noticias De Actualidad
Dele a esta IA unas pocas palabras de descripción y producirá una imagen impresionante, pero ¿es arte?

Una imagen puede valer más que mil palabras, pero gracias a un programa de inteligencia artificial llamado DALL-E 2, puede tener una imagen de aspecto profesional con muchas menos.

DALL-E 2 es un nuevo algoritmo de red neuronal que crea una imagen a partir de una frase u oración corta que usted proporcione. El programa, que fue anunciado por el laboratorio de investigación de inteligencia artificial OpenAI en abril de 2022, no se ha hecho público. Pero a un número pequeño y creciente de personas, incluido yo mismo, se les ha dado acceso para experimentar con él.

Como investigador que estudia el nexo entre la tecnología y el arte, estaba ansioso por ver qué tan bien funcionaba el programa. Después de horas de experimentación, está claro que DALL-E, aunque no sin defectos, está muy por delante de la tecnología de generación de imágenes existente. Plantea preguntas inmediatas sobre cómo estas tecnologías cambiarán la forma en que se hace y consume el arte. También plantea preguntas sobre lo que significa ser creativo cuando DALL-E 2 parece automatizar gran parte del proceso creativo en sí.

Una asombrosa variedad de estilos y temas.

Los investigadores de OpenAI construyeron DALL-E 2 a partir de una enorme colección de imágenes con subtítulos. Recolectaron algunas de las imágenes en línea y licenciaron otras.

El uso de DALL-E 2 se parece mucho a buscar una imagen en la web: escribe una frase corta en un cuadro de texto y obtiene seis imágenes.

Pero en lugar de seleccionarse de la web, el programa crea seis imágenes nuevas, cada una de las cuales refleja alguna versión de la frase ingresada. (Hasta hace poco, el programa producía 10 imágenes por mensaje). Por ejemplo, cuando algunos amigos y yo le dimos a DALL-E 2 el mensaje de texto “gatos con sombreros devo”, produjo 10 imágenes que venían en diferentes estilos.

Casi todos ellos podrían pasar plausiblemente por fotografías o dibujos profesionales. Si bien el algoritmo no captó del todo el “sombrero Devo”, los extraños cascos que usa la banda New Wave Devo, el casco en las imágenes que produjo se acercó.

En los últimos años, una pequeña comunidad de artistas ha estado utilizando algoritmos de redes neuronales para producir arte. Muchas de estas obras de arte tienen cualidades distintivas que casi parecen imágenes reales, pero con extrañas distorsiones del espacio, una especie de cubismo cyberpunk. Los sistemas de texto a imagen más recientes a menudo producen imágenes fantásticas y de ensueño que pueden ser deliciosas pero que rara vez parecen reales.

DALL-E 2 ofrece un salto significativo en la calidad y realismo de las imágenes. También puede imitar estilos específicos con notable precisión. Si desea imágenes que parezcan fotografías reales, producirá seis imágenes realistas. Si desea pinturas rupestres prehistóricas de Shrek, generará seis imágenes de Shrek como si hubieran sido dibujadas por un artista prehistórico.

Es asombroso que un algoritmo pueda hacer esto. Cada conjunto de imágenes tarda menos de un minuto en generarse. No todas las imágenes se verán agradables a la vista, ni necesariamente reflejan lo que tenías en mente. Pero, incluso con la necesidad de filtrar muchos resultados o probar diferentes mensajes de texto, no existe otra forma de obtener tantos resultados excelentes tan rápido, ni siquiera contratando a un artista. Y, a veces, los resultados inesperados son los mejores.

En principio, cualquier persona con suficientes recursos y experiencia puede hacer un sistema como este. Google Research anunció recientemente un impresionante sistema similar de texto a imagen, y un desarrollador independiente está desarrollando públicamente su propia versión que cualquiera puede probar ahora mismo en la web, aunque aún no es tan buena como DALL-E o el sistema de Google.

Es fácil imaginar que estas herramientas transformen la forma en que las personas crean imágenes y se comunican, ya sea a través de memes, tarjetas de felicitación, publicidad y, sí, arte.

¿Dónde está el arte en eso?

Tuve un momento al principio mientras usaba DALL-E 2 para generar diferentes tipos de pinturas, en todos los estilos diferentes, como “Odilon Redon pintura de Seattle”, cuando me di cuenta de que esto era mejor que cualquier algoritmo de pintura que haya desarrollado. . Entonces me di cuenta de que es, en cierto modo, mejor pintor que yo.

De hecho, ningún ser humano puede hacer lo que hace DALL-E 2: crear una gama variada de imágenes de tan alta calidad en cuestión de segundos. Si alguien te dijera que una persona hizo todas estas imágenes, por supuesto que dirías que son creativos.

Pero esto no convierte a DALL-E 2 en un artista. Aunque a veces parece magia, bajo el capó sigue siendo un algoritmo informático que sigue estrictamente las instrucciones de los autores del algoritmo en OpenAI.

Si estas imágenes tienen éxito como arte, son producto de cómo se diseñó el algoritmo, las imágenes en las que se entrenó y, lo que es más importante, cómo lo usan los artistas.

Es posible que se incline a decir que hay poco mérito artístico en una imagen producida con unas pocas pulsaciones de teclas. Pero, desde mi punto de vista, esta línea de pensamiento se hace eco de la opinión clásica de que la fotografía no puede ser arte porque una máquina hizo todo el trabajo. Hoy se reconoce la autoría humana y el oficio involucrado en la fotografía artística, y los críticos entienden que la mejor fotografía implica mucho más que simplemente presionar un botón.

Aun así, a menudo discutimos las obras de arte como si vinieran directamente de la intención del artista. El artista pretendía mostrar una cosa, o expresar una emoción, y por eso hizo esta imagen. DALL-E 2 parece acortar este proceso por completo: tienes una idea, la escribes y listo.

Pero cuando pinto a la antigua usanza, descubrí que mis pinturas provienen del proceso exploratorio, no solo de la ejecución de mis objetivos iniciales. Y esto es cierto para muchos artistas.

Tomemos como ejemplo a Paul McCartney, a quien se le ocurrió la canción “Get Back” durante una jam session. No comenzó con un plan para la canción; simplemente comenzó a jugar y experimentar y la banda lo desarrolló a partir de ahí.

Picasso describió su proceso de manera similar: “No sé de antemano lo que voy a poner sobre el lienzo más de lo que decido de antemano qué colores voy a utilizar… Cada vez que me propongo pintar un cuadro tengo la sensación de dar un salto”. en el espacio.”

En mis propias exploraciones con DALL-E 2, una idea me llevaba a otra que me llevaba a otra, y finalmente me encontraba en un nuevo terreno completamente inesperado y mágico, muy lejos de donde había empezado.

Incitar como arte

Yo diría que el arte, al usar un sistema como DALL-E 2, proviene no solo del mensaje de texto final, sino de todo el proceso creativo que condujo a ese mensaje. Diferentes artistas seguirán diferentes procesos y terminarán con diferentes resultados que reflejan sus propios enfoques, habilidades y obsesiones.

Empecé a ver mis experimentos como un conjunto de series, cada una de las cuales es una inmersión constante en un solo tema, en lugar de un conjunto de imágenes extravagantes independientes.

Las ideas para estas imágenes y series surgieron de todas partes, a menudo unidas por un conjunto de peldaños. En un momento, mientras creaba imágenes basadas en el trabajo de artistas contemporáneos, quise generar una imagen de instalación de arte específica del sitio al estilo del artista japonés contemporáneo Yayoi Kusama. Después de probar algunas ubicaciones insatisfactorias, se me ocurrió la idea de ubicarlo en La Mezquita, una antigua mezquita e iglesia en Córdoba, España. Le envié la foto a un colega arquitecto, Manuel Ladron de Guevara, que es de Córdoba, y comenzamos a pensar juntos en otras ideas arquitectónicas.

Esto se convirtió en una serie sobre nuevos edificios imaginarios en diferentes estilos de arquitectos.

Así que comencé a considerar que lo que hago con DALL-E 2 es tanto una forma de exploración como una forma de arte, incluso si a menudo es arte amateur como los dibujos que hago en mi iPad.

De hecho, algunos artistas, como ryan murdoch, han abogado por que la creación de imágenes basadas en indicaciones sea reconocida como arte. Él apunta a la la experimentada artista de inteligencia artificial Helena Sarin como ejemplo.

“Cuando miro la mayoría de las cosas de Midjourney”, otro sistema popular de texto a imagen, “muchas de ellas serán interesantes o divertidas”, me dijo Murdoch en una entrevista. “Pero con [Sarin’s] trabajo, hay una línea directa. Es fácil ver que ha pensado mucho en ello y ha trabajado en el oficio, porque el resultado es visualmente más atractivo e interesante, y sigue su estilo de manera continua”.

Trabajar con DALL-E 2, o cualquiera de los nuevos sistemas de texto a imagen, significa aprender sus peculiaridades y desarrollar estrategias para evitar errores comunes. También es importante conocer sus daños potenciales, como su dependencia de los estereotipos y los usos potenciales para la desinformación. Usando DALL-E 2, también descubrirá correlaciones sorprendentes, como la forma en que todo se vuelve antiguo cuando usa el estilo de un pintor, cineasta o fotógrafo antiguo.

Cuando tengo algo muy específico que quiero hacer, DALL-E 2 a menudo no puede hacerlo. Los resultados requerirían una gran cantidad de edición manual difícil después. Es cuando mis objetivos son vagos que el proceso es más placentero, ofreciendo sorpresas que conducen a nuevas ideas que a su vez conducen a más ideas y así sucesivamente.

Creando nuevas realidades

Estos sistemas de texto a imagen también pueden ayudar a los usuarios a imaginar nuevas posibilidades.

La artista y activista Danielle Baskin me dijo que ella siempre trabaja “para mostrar realidades alternativas con ejemplos ‘reales’: ya sea configurando escenarios en el mundo físico o haciendo un trabajo meticuloso en Photoshop”. DALL-E 2, sin embargo, “es un atajo increíble porque es muy bueno en el realismo. Y eso es clave para ayudar a otros a dar vida a futuros posibles, ya sea en sátira, sueños o belleza”.

Ella lo ha usado para imaginar un sistema de transporte alternativo y fontanería que transporta fideos en lugar de agualos cuales reflejan su sensibilidad de artista provocadora.

Del mismo modo, el artista Mario Klingemann representaciones arquitectónicas con tiendas de campaña de personas sin hogar podría tomarse como una réplica a Mis representaciones arquitectónicas de elegantes casas de ensueño..

Es demasiado pronto para juzgar la importancia de esta forma de arte. Sigo pensando en una frase del excelente libro “Art in the After-Culture”: “La estética dominante de la IA es la novedad”.

Seguramente esto sería cierto, hasta cierto punto, para cualquier nueva tecnología utilizada para el arte. Las primeras películas de los hermanos Lumière en la década de 1890 fueron novedades, no obras maestras cinematográficas; asombraba a la gente ver imágenes en movimiento.

El software artístico de IA se desarrolla tan rápido que hay novedades técnicas y artísticas continuas. Parece como si, cada año, hubiera una oportunidad de explorar una tecnología nueva y emocionante, cada una más poderosa que la anterior, y cada una aparentemente preparada para transformar el arte y la sociedad.