Buenos días compañeros! Hoy os vengo a hablar de un tema que está de actualidad y con el que he estado experimentando esta semana... Seguro que habéis oido hablar de la generación de imágenes usando inteligencia artificial con tan sólo describir en una frase escrita lo que quieres que tenga la imagen, que ha creado mucha polémica ya que muchos artistas creen que les puede quitar el trabajo (yo no lo pienso así, de hecho creo que es una herramienta muy útil). Algunos han llegado a demandar a las empresas que investigan dichas IA argumentando que al ser entrenadas a partir de imágenes de artistas humanos, las nuevas imágenes que crea la IA infringirían sus derechos de autor (algo absurdo, porque la IA no hace otra cosa diferente que cualquier artista humano cuando aprende a dibujar o pintar en algún estilo... todos nosotros nos basamos en el trabajo previo y la observación de creaciones anteriores, y adoptamos el estilo o mezcla de estilos de artistas anteriores a nosotros). También ha ocurrido que algunos bancos de imágenes se han negado a aceptar imágenes creadas de esta manera alineándose con ese grupo de artistas a los que no les gusta la IA.
De igual forma, otra polémica tiene que ver con temas eticos, ya que se pueden usar para crear deepfakes y porno, temas siempre espinosos.
Lo mejor que tienen es que son de uso muy sencillo y se pueden conseguir resultados espectaculares y cosas que parecen increíbles en cuestión de segundos. Las más famosas son Dall-E, Midjourney y Stable Diffusion. Yo las he probado las tres, aunque ahora sólo uso esta última. La más espectacular y avanzada es Midjourney, ya que con frases de por ejemplo cuatro o 5 palabras ya arroja resultados espectaculares, y es la más sencilla de usar. La pega es que tanto esta como Dall-E te ofrecen un número de usos gratis, y a partir de ahí tienes que pagar o suscribirte a un plan de pago.
Sin embargo, la que me tiene entusiasmado es Stable Diffusion, que a diferencia de las otras es open source, de uso gratuíto sin limitaciones, y sin censurar ningún tipo de contenido. Además de poderla usar online, se puede instalar localmente y tiene una enorme comunidad detrás creando modelos para ella para hacer todo tipo de imágenes y contenido (por ejemplo imágenes con el estilo artístico de los juegos de Vanillaware). Yo la tengo instalada tanto en mi ordenador de sobremesa como en mi portátil y la uso asiduamente.
Su uso es bastante sencillo como comenté antes... Veréis que aparece un formulario con dos líneas de texto, una para la frase 'positiva' y otra para la frase 'negativa'. En la primera escribimos bien la descripción, bien las palabras que definen los elementos que queremos que aparezcan en la imagen a generar (por ejemplo, mujer sueca de 21 años, pelo rubio, alta, bikini verde, atlética, observando atardecer en la playa), pudiendo marcar algunas palabras como más relevantes poniéndolas entre paréntesis (a más paréntesis, más relevancia) o entre corchetes (menos relevancia) para que se tenga en cuenta en el resultado. En la segunda línea, se hace lo mismo pero con todo lo que NO queremos que tenga o sea la imagen, y nos sirve no sólo para excluir elementos sino para acotar la calidad de la imagen y descartar imágenes que tengan defectos de generación (por ejemplo cuerpos deformes, menos dedos, más dedos, piernas faltantes, personajes fusionados, imágenes borrosas, etc...).
Y después tenemos una sección (esto sólo disponible usando la IA en local o con versiones online no oficiales de Stable Diffusion) en la que podemos indicar la resolución de la imagen, el número de iteraciones que queremos que haga la IA para generar la imagen final y un indicador en el que asignamos con un valor la fidelidad que queremos que tenga la IA con el texto que le hemos escrito a la hora de generar la imagen (que sea más o menos literal o estricta al tener en cuenta los elementos del texto).
Además tenemos un desplegable en el que podemos seleccionar otros modelos diferentes del oficial, que es donde salen los modelos descargados de la comunidad para cosas concretas, por ejemplo para generar anime, personas realistas, etc...
Por si fuera poco, además se nos ofrece un pequeño editor que permite importar una imagen (bien una imagen real, bien una previamente generada con la propia IA) y hacer la generación de la imagen basándose en el contenido de la imagen previa, e incluso podemos señalar con un marcador partes de la imagen para que sólo se modifique eso y deje el resto sin tocar, lo que nos dá posibilidades infinitas (por ejemplo cambiar de escenario en segundos sin tirarte horas en Photoshop). Además, es sencillísimo entrenar a la IA para incluir en la generación objetos, personas o nuevas características... Por ejemplo, para incluirme yo mismo en la generación de las imágenes sólo necesitaría unas 20 fotos mías, tres de cuerpo entero en varios ángulos, 5 o 6 del torso, y el resto de mi cara con diferentes expresiones. Con esas imágenes pones a la IA a entrenar y le asignas una eitiqueta, y para usar lo que has hecho en la imagen tan sólo tienes que escribir la etiqueta en la descripción.
Pero ahora vamos a lo interesante, los resultados... Y estos generados en cuestión de segundos, como comento. Se pueden generar personas indistinguibles de las reales (esto va a gustar a compañero @daninuyusio) como estas:







O imágenes en cualquier estilo artístico, por ejemplo unas waifus:







Luego, se puede guardar la 'semilla' de una imagen generada y que haga variaciones a partir de ella, para obtener imágenes similares en las que los personajes cambian menos y son más parecidos de unas a otras, además de controlar el grado de variación, por ejemplo con estas:




En fin, que aún estoy alucinando con todo esto y tiene muchas posibilidades de todo tipo... De hecho en el siguiente vídeo podéis ver cómo un diseñador usa Stable Diffusion para generar un personaje y luego animarlo haciendo uso de Photoshop y After Effects:
¿Qué os parece? Si os interesa el tema y queréis probar a instalar la IA y generar imágenes, sólo tenéis que seguir el siguiente tutorial:
https://rentry.co/UnofficialUnstableGuideNo es complicado de hacer pero hay que seguir paso a paso lo que dice la guía y dedicarle un par de horas... También que necesitaréis una gráfica más o menos potente, aunque la misma guía ya lo explica.