Autor Tema: La revolución que suponen las IA generativas de imágenes a partir de texto (Leído 5249 veces)

sirdrak · « **Respuesta #15 en:** Febrero 17, 2023, 11:54:09 am »

Cita de: zzgus en Febrero 17, 2023, 10:53:08 am

Muy interesante !!! sin duda que lo probaré.

Y es que estas IAs tanto te hacen un zurcido como te cosen un descosido !!!

El diseño de un personaje:

O un logo:

Un libro para colorear:

El diseño de un producto e incluso una página web:

O un logo para un foro !!!

Efectivamente... Y todo eso lo puedes hacer igual o mejor con Stable Diffusion. Midjourney la ventaja que tiene es que es más avanzada en el reconocimiento de las descripciones y da resultados espectaculares con pocas palabras, pero por el contrario no tiene ningún control que te permita evitar aberraciones o que salgan cosas que no quieres en las imágenes, además del problema de ser de pago por suscripción. Stable Diffusion, requiere de mejores 'prompts', descripciones más detalladas, pero a cambio tienes una línea de texto extra, el prompt negativo... Ahí pones todo lo que NO quieres que tenga la imagen, como que evite imágenes fotorrealistas si lo que quieres es una ilustración, que descarte imágenes borrosas, personajes deformes, manos extra, dedos extra, logos, texto, etc...

Además, Stable Diffusion la puedes instalar localmente en tu Pc por lo que no requiere de ningún tipo de servicio online y ni siquiera tienes que estar conectado a internet para usarla. Al ser Opensource, su uso es gratuíto y no hay limitaciones ni censura como en las otras. Te permite entrenar muy fácilmente tus propios modelos para incluir en las imágenes personas concretas, personajes, objetos o lo que necesites, estilos artísticos y nuevas funcionalidades, además de tener incluídas unas utilidades como img2img que permite usar la IA sobre una imagen ya previamente existente, o Inpaint, que hace eso mismo pero permite seleccionar 'pintando' con un puntero partes de la imagen y aplicar cambios sólo a lo que te interese, pudiendo hacer maravillas con esto. Es todo un mundo increíble esto...

empardopo · « **Respuesta #16 en:** Febrero 17, 2023, 02:39:47 pm »

Cita de: sirdrak en Febrero 17, 2023, 11:54:09 am

Cita de: zzgus en Febrero 17, 2023, 10:53:08 am
Muy interesante !!! sin duda que lo probaré.

Y es que estas IAs tanto te hacen un zurcido como te cosen un descosido !!!

El diseño de un personaje:

O un logo:

Un libro para colorear:

El diseño de un producto e incluso una página web:

O un logo para un foro !!!

Efectivamente... Y todo eso lo puedes hacer igual o mejor con Stable Diffusion. Midjourney la ventaja que tiene es que es más avanzada en el reconocimiento de las descripciones y da resultados espectaculares con pocas palabras, pero por el contrario no tiene ningún control que te permita evitar aberraciones o que salgan cosas que no quieres en las imágenes, además del problema de ser de pago por suscripción. Stable Diffusion, requiere de mejores 'prompts', descripciones más detalladas, pero a cambio tienes una línea de texto extra, el prompt negativo... Ahí pones todo lo que NO quieres que tenga la imagen, como que evite imágenes fotorrealistas si lo que quieres es una ilustración, que descarte imágenes borrosas, personajes deformes, manos extra, dedos extra, logos, texto, etc...

Además, Stable Diffusion la puedes instalar localmente en tu Pc por lo que no requiere de ningún tipo de servicio online y ni siquiera tienes que estar conectado a internet para usarla. Al ser Opensource, su uso es gratuíto y no hay limitaciones ni censura como en las otras. Te permite entrenar muy fácilmente tus propios modelos para incluir en las imágenes personas concretas, personajes, objetos o lo que necesites, estilos artísticos y nuevas funcionalidades, además de tener incluídas unas utilidades como img2img que permite usar la IA sobre una imagen ya previamente existente, o Inpaint, que hace eso mismo pero permite seleccionar 'pintando' con un puntero partes de la imagen y aplicar cambios sólo a lo que te interese, pudiendo hacer maravillas con esto. Es todo un mundo increíble esto...

Impresionante lo que sale a partir de los bocetos!!!

Y lo puedo instalar en mi ordenador de gratis??? Se necesita equipo muy potente?

Enviado desde mi MI MAX 2 mediante Tapatalk

sirdrak · « **Respuesta #17 en:** Febrero 17, 2023, 03:42:40 pm »

Cita de: empardopo en Febrero 17, 2023, 02:39:47 pm

Cita de: sirdrak en Febrero 17, 2023, 11:54:09 am
Cita de: zzgus en Febrero 17, 2023, 10:53:08 am
Muy interesante !!! sin duda que lo probaré.

Y es que estas IAs tanto te hacen un zurcido como te cosen un descosido !!!

El diseño de un personaje:

O un logo:

Un libro para colorear:

El diseño de un producto e incluso una página web:

O un logo para un foro !!!

Efectivamente... Y todo eso lo puedes hacer igual o mejor con Stable Diffusion. Midjourney la ventaja que tiene es que es más avanzada en el reconocimiento de las descripciones y da resultados espectaculares con pocas palabras, pero por el contrario no tiene ningún control que te permita evitar aberraciones o que salgan cosas que no quieres en las imágenes, además del problema de ser de pago por suscripción. Stable Diffusion, requiere de mejores 'prompts', descripciones más detalladas, pero a cambio tienes una línea de texto extra, el prompt negativo... Ahí pones todo lo que NO quieres que tenga la imagen, como que evite imágenes fotorrealistas si lo que quieres es una ilustración, que descarte imágenes borrosas, personajes deformes, manos extra, dedos extra, logos, texto, etc...

Además, Stable Diffusion la puedes instalar localmente en tu Pc por lo que no requiere de ningún tipo de servicio online y ni siquiera tienes que estar conectado a internet para usarla. Al ser Opensource, su uso es gratuíto y no hay limitaciones ni censura como en las otras. Te permite entrenar muy fácilmente tus propios modelos para incluir en las imágenes personas concretas, personajes, objetos o lo que necesites, estilos artísticos y nuevas funcionalidades, además de tener incluídas unas utilidades como img2img que permite usar la IA sobre una imagen ya previamente existente, o Inpaint, que hace eso mismo pero permite seleccionar 'pintando' con un puntero partes de la imagen y aplicar cambios sólo a lo que te interese, pudiendo hacer maravillas con esto. Es todo un mundo increíble esto...
Impresionante lo que sale a partir de los bocetos!!!

Y lo puedo instalar en mi ordenador de gratis??? Se necesita equipo muy potente?

Enviado desde mi MI MAX 2 mediante Tapatalk

Efectivamente y hasta puedes hacer porno si quieres xD No tiene ningún tipo de limitación. Sí que necesita de una gráfica más o menos potente, pero sobre todo que como mínimo tenga 6 GB de VRAM dedicada (para generar imágenes) u 8 GB o más para entrenar modelos (cuanta más VRAM mejor), algo, esto último, relativamente fácil de hacer y con posibilidades muy interesantes, como incluir a personas, personajes, animales concretos, etc... en las imágenes o incluir nuevos estilos artísticos (por ejemplo el estilo de Ibañez con Mortadelo y Filemón) con sólo un conjunto de fotos (bastan 20 o 30 para incluirte a tí mismo, por ejemplo).

Hay una guía de instalación que además proporciona los enlaces a todo lo necesario. No es complicado de hacer pero sí que requiere dedicarle un tiempo para instalar todo (el lenguaje Python, los repositorios, etc...). Yo en hora y media lo tenía ya funcionando. La guía la encuentras aquí: https://rentry.co/UnofficialUnstableGuide

Y luego, hay un sitio en el que encuentras miles de modelos ya entrenados para cosas específicas, como personas, personajes conocidos, especializados en fotorrealismo, en anime... en hentai, en porno... xD. Yo recomiendo al menos los siguientes:

- Anything V. 3 para anime
- Realistic Vision V 1.3 para imágenes fotorrealistas (es el que usé con los personajes del Gauntlet) y también es muy bueno Art & Eros en el mismo estilo
- DreamShaper para ilustraciones en todo tipo de estilos
- Los modelos de la serie Orangemix (AbyssOrangeMix, EerieOrangeMix y BloodOrangeMix) para anime y hentai (unos están más indicados para lo primero y otros para lo segundo, y también unos van más en un estilo de ilustración y otros más en estilo anime de Tv y cine)

Estos son los llamados 'Checkpoints', que son el modelo completo, pero hay 'minimodelos' (vamos a llamarlos así) como los LoRa o los Embbedings que sirven para incluir personajes concretos o estilos y poder usarlos conjuntamente con los modelos grandes... De estos hay miles y son los más fáciles de hacer para el usuario común.

El sitio este que digo es Civitai: https://civitai.com/

empardopo · « **Respuesta #18 en:** Febrero 18, 2023, 08:30:38 pm »

Cita de: sirdrak en Febrero 17, 2023, 03:42:40 pm

Cita de: empardopo en Febrero 17, 2023, 02:39:47 pm
Cita de: sirdrak en Febrero 17, 2023, 11:54:09 am
Cita de: zzgus en Febrero 17, 2023, 10:53:08 am
Muy interesante !!! sin duda que lo probaré.

Y es que estas IAs tanto te hacen un zurcido como te cosen un descosido !!!

El diseño de un personaje:

O un logo:

Un libro para colorear:

El diseño de un producto e incluso una página web:

O un logo para un foro !!!

Efectivamente... Y todo eso lo puedes hacer igual o mejor con Stable Diffusion. Midjourney la ventaja que tiene es que es más avanzada en el reconocimiento de las descripciones y da resultados espectaculares con pocas palabras, pero por el contrario no tiene ningún control que te permita evitar aberraciones o que salgan cosas que no quieres en las imágenes, además del problema de ser de pago por suscripción. Stable Diffusion, requiere de mejores 'prompts', descripciones más detalladas, pero a cambio tienes una línea de texto extra, el prompt negativo... Ahí pones todo lo que NO quieres que tenga la imagen, como que evite imágenes fotorrealistas si lo que quieres es una ilustración, que descarte imágenes borrosas, personajes deformes, manos extra, dedos extra, logos, texto, etc...

Además, Stable Diffusion la puedes instalar localmente en tu Pc por lo que no requiere de ningún tipo de servicio online y ni siquiera tienes que estar conectado a internet para usarla. Al ser Opensource, su uso es gratuíto y no hay limitaciones ni censura como en las otras. Te permite entrenar muy fácilmente tus propios modelos para incluir en las imágenes personas concretas, personajes, objetos o lo que necesites, estilos artísticos y nuevas funcionalidades, además de tener incluídas unas utilidades como img2img que permite usar la IA sobre una imagen ya previamente existente, o Inpaint, que hace eso mismo pero permite seleccionar 'pintando' con un puntero partes de la imagen y aplicar cambios sólo a lo que te interese, pudiendo hacer maravillas con esto. Es todo un mundo increíble esto...
Impresionante lo que sale a partir de los bocetos!!!

Y lo puedo instalar en mi ordenador de gratis??? Se necesita equipo muy potente?

Enviado desde mi MI MAX 2 mediante Tapatalk

Efectivamente y hasta puedes hacer porno si quieres xD No tiene ningún tipo de limitación. Sí que necesita de una gráfica más o menos potente, pero sobre todo que como mínimo tenga 6 GB de VRAM dedicada (para generar imágenes) u 8 GB o más para entrenar modelos (cuanta más VRAM mejor), algo, esto último, relativamente fácil de hacer y con posibilidades muy interesantes, como incluir a personas, personajes, animales concretos, etc... en las imágenes o incluir nuevos estilos artísticos (por ejemplo el estilo de Ibañez con Mortadelo y Filemón) con sólo un conjunto de fotos (bastan 20 o 30 para incluirte a tí mismo, por ejemplo).

Hay una guía de instalación que además proporciona los enlaces a todo lo necesario. No es complicado de hacer pero sí que requiere dedicarle un tiempo para instalar todo (el lenguaje Python, los repositorios, etc...). Yo en hora y media lo tenía ya funcionando. La guía la encuentras aquí: https://rentry.co/UnofficialUnstableGuide

Y luego, hay un sitio en el que encuentras miles de modelos ya entrenados para cosas específicas, como personas, personajes conocidos, especializados en fotorrealismo, en anime... en hentai, en porno... xD. Yo recomiendo al menos los siguientes:

- Anything V. 3 para anime
- Realistic Vision V 1.3 para imágenes fotorrealistas (es el que usé con los personajes del Gauntlet) y también es muy bueno Art & Eros en el mismo estilo
- DreamShaper para ilustraciones en todo tipo de estilos
- Los modelos de la serie Orangemix (AbyssOrangeMix, EerieOrangeMix y BloodOrangeMix) para anime y hentai (unos están más indicados para lo primero y otros para lo segundo, y también unos van más en un estilo de ilustración y otros más en estilo anime de Tv y cine)

Estos son los llamados 'Checkpoints', que son el modelo completo, pero hay 'minimodelos' (vamos a llamarlos así) como los LoRa o los Embbedings que sirven para incluir personajes concretos o estilos y poder usarlos conjuntamente con los modelos grandes... De estos hay miles y son los más fáciles de hacer para el usuario común.

El sitio este que digo es Civitai: https://civitai.com/

Que decepción con lo de la gráfica ya que mi equipo no tiene, jeje!

Oye, alguna recomendación de alguna gráfica con las 3 Bs? Ya sabéis, buena, bonita y barata...

sirdrak · « **Respuesta #19 en:** Febrero 18, 2023, 11:18:07 pm »

Cita de: empardopo en Febrero 18, 2023, 08:30:38 pm

Cita de: sirdrak en Febrero 17, 2023, 03:42:40 pm
Cita de: empardopo en Febrero 17, 2023, 02:39:47 pm
Cita de: sirdrak en Febrero 17, 2023, 11:54:09 am
Cita de: zzgus en Febrero 17, 2023, 10:53:08 am
Muy interesante !!! sin duda que lo probaré.

Y es que estas IAs tanto te hacen un zurcido como te cosen un descosido !!!

El diseño de un personaje:

O un logo:

Un libro para colorear:

El diseño de un producto e incluso una página web:

O un logo para un foro !!!

Efectivamente... Y todo eso lo puedes hacer igual o mejor con Stable Diffusion. Midjourney la ventaja que tiene es que es más avanzada en el reconocimiento de las descripciones y da resultados espectaculares con pocas palabras, pero por el contrario no tiene ningún control que te permita evitar aberraciones o que salgan cosas que no quieres en las imágenes, además del problema de ser de pago por suscripción. Stable Diffusion, requiere de mejores 'prompts', descripciones más detalladas, pero a cambio tienes una línea de texto extra, el prompt negativo... Ahí pones todo lo que NO quieres que tenga la imagen, como que evite imágenes fotorrealistas si lo que quieres es una ilustración, que descarte imágenes borrosas, personajes deformes, manos extra, dedos extra, logos, texto, etc...

Además, Stable Diffusion la puedes instalar localmente en tu Pc por lo que no requiere de ningún tipo de servicio online y ni siquiera tienes que estar conectado a internet para usarla. Al ser Opensource, su uso es gratuíto y no hay limitaciones ni censura como en las otras. Te permite entrenar muy fácilmente tus propios modelos para incluir en las imágenes personas concretas, personajes, objetos o lo que necesites, estilos artísticos y nuevas funcionalidades, además de tener incluídas unas utilidades como img2img que permite usar la IA sobre una imagen ya previamente existente, o Inpaint, que hace eso mismo pero permite seleccionar 'pintando' con un puntero partes de la imagen y aplicar cambios sólo a lo que te interese, pudiendo hacer maravillas con esto. Es todo un mundo increíble esto...
Impresionante lo que sale a partir de los bocetos!!!

Y lo puedo instalar en mi ordenador de gratis??? Se necesita equipo muy potente?

Enviado desde mi MI MAX 2 mediante Tapatalk

Efectivamente y hasta puedes hacer porno si quieres xD No tiene ningún tipo de limitación. Sí que necesita de una gráfica más o menos potente, pero sobre todo que como mínimo tenga 6 GB de VRAM dedicada (para generar imágenes) u 8 GB o más para entrenar modelos (cuanta más VRAM mejor), algo, esto último, relativamente fácil de hacer y con posibilidades muy interesantes, como incluir a personas, personajes, animales concretos, etc... en las imágenes o incluir nuevos estilos artísticos (por ejemplo el estilo de Ibañez con Mortadelo y Filemón) con sólo un conjunto de fotos (bastan 20 o 30 para incluirte a tí mismo, por ejemplo).

Hay una guía de instalación que además proporciona los enlaces a todo lo necesario. No es complicado de hacer pero sí que requiere dedicarle un tiempo para instalar todo (el lenguaje Python, los repositorios, etc...). Yo en hora y media lo tenía ya funcionando. La guía la encuentras aquí: https://rentry.co/UnofficialUnstableGuide

Y luego, hay un sitio en el que encuentras miles de modelos ya entrenados para cosas específicas, como personas, personajes conocidos, especializados en fotorrealismo, en anime... en hentai, en porno... xD. Yo recomiendo al menos los siguientes:

- Anything V. 3 para anime
- Realistic Vision V 1.3 para imágenes fotorrealistas (es el que usé con los personajes del Gauntlet) y también es muy bueno Art & Eros en el mismo estilo
- DreamShaper para ilustraciones en todo tipo de estilos
- Los modelos de la serie Orangemix (AbyssOrangeMix, EerieOrangeMix y BloodOrangeMix) para anime y hentai (unos están más indicados para lo primero y otros para lo segundo, y también unos van más en un estilo de ilustración y otros más en estilo anime de Tv y cine)

Estos son los llamados 'Checkpoints', que son el modelo completo, pero hay 'minimodelos' (vamos a llamarlos así) como los LoRa o los Embbedings que sirven para incluir personajes concretos o estilos y poder usarlos conjuntamente con los modelos grandes... De estos hay miles y son los más fáciles de hacer para el usuario común.

El sitio este que digo es Civitai: https://civitai.com/

Que decepción con lo de la gráfica ya que mi equipo no tiene, jeje!

Oye, alguna recomendación de alguna gráfica con las 3 Bs? Ya sabéis, buena, bonita y barata...

En realidad, aquí la potencia de la gráfica no es tan importante como en otras cosas de IA, como procesar vídeo, ya que lo único en lo que influye es en el tiempo que tardan en procesarse las imágenes. En mi caso tardan entre 20 y 50 segundos, nunca más tiempo que eso. Lo que sí es muy importante es la VRAM, por lo que comenté antes... Ahora el tema de conseguir gráfica con las tres B está bastante complicado, y eso que ha mejorado desde la caída de los mineros y el fin del confinamiento. A nVidia y a AMD se les ha ido totalmente la pinza con los precios de las gráficas de última generación (1200 € una 4070Ti es una burrada... Y pensar que yo pagué poco más de 800 € por mi RTX 3080 en su día y ya me parecía una salvajada). Casi terminas antes comprándote un portátil como hice yo con mi Lenovo Legion en Octubre, que me salió en una oferta flash de Amazon por 1049 € llevando todo esto:

- Pantalla de 15.6" FullHD 1920x1080 píxeles, IPS, 300nits, Anti-glare, 165Hz, 100% sRGB, Dolby Vision, G-Sync, DC dimmer
- Procesador Intel Core i7-11800H (8C / 16T, 2.3 / 4.6GHz, 24MB)
- Memoria RAM de 16GB (2x 8GB SO-DIMM DDR4-3200) ampliables hasta 32GB
- Almacenamiento de 1TB SSD
- Tarjeta gráfica NVIDIA GeForce RTX 3060 6GB GDDR6 (la versión más potente de las de portatátil, la de 130 W, más potente que muchas 3070 de portátil)
- La batería, cuando no usamos el portátil para jugar (es decir, cuando usa la gráfica integrada en lugar de la dedicada) le dura 10 horas.
- Conectores de todas clases incluyendo dos puertos Thunderbolt que permiten enchufarle gráficas externas.

sirdrak · « **Respuesta #20 en:** Febrero 25, 2023, 12:38:33 pm »

Ya he entrenado mis primeros dos LoRAs y es muy fácil de hacer, una vez tienes instalado todo lo necesario... Es adictivo esto jejeje. El primero ha sido para integrar a una amiga en las imágenes y el resultado es espectacular, aunque no puedo poner las imágenes por cuestiones de privacidad, pero en resumen, tras crear el LoRA a partir de 28 imágenes suyas (y eso que casi todas son de su cara, ya que la mayoría de fotos que me ha enviado son las típicas hechas con el móvil), la he podido sacar con el traje de IronMan, con el de Thor, con el aspecto de un Navii de Avatar, con el diseño de un personaje de las películas de Don Bluth (el creador de Dragon's Lair, Todos los perros van al cielo, etc...), como pintura al óleo, como personaje de anime, etc... Hasta como si fuera un personaje de Jojo's Bizarre Adventure... Todos estilos muy diferentes y en todos reproduce sus características perfectamente y es reconocible, sus ojos, su sonrisa y sus gafas, el estilo del pelo, etc...

El segundo que he entrenado sí que lo puedo mostrar, y aunque lo he hecho para echar una mano a un compañero con una cosilla que andamos haciendo, el resultado ha sido muy bueno. Un problema que veía hasta ahora con Stable Diffusion era que la mayoría de modelos que la gente crea son de Anime, es de lo que más hay... pero muy poco de otros estilos gráficos de creadores occidentales. Hay estilos muy interesantes pero que al haber sido entrenados con ese tipo de arte no son aplicables cuando quieres crear personajes con aspecto occidental. El asunto es que se me ocurrió crear un LoRA para un tipo de ilustración al óleo muy común entre los 60 y 80 como las que se usaban en las portadas de los libros juveniles, así que hice el entrenamiento con 24 portadas de los libros de la saga de Los Tres Investigadores (que inicielmente se llama Alfred Hitchcock y Los Tres Investigadores), y el resultado es satisfactorio: Usándolo en modelos de anime como Anything V3, por ejemplo, automáticamente todos los personajes salen con ropa ochentera y dejan de tener estilo anime, y los fondos se notan como a pinceladas como si fueran óleos, que además al ser un LoRA el efecto se puede regular y hacerlo más o menos intenso. Incluso funciona en modelos para fotografía realista... Voy a mostrar algunos ejemplos:

La verdad es que está genial poder introducir nuevos estilos... Se me ocurren mil ideas para hacer

empardopo · « **Respuesta #21 en:** Febrero 25, 2023, 08:46:55 pm »

Cita de: sirdrak en Febrero 25, 2023, 12:38:33 pm

Ya he entrenado mis primeros dos LoRAs y es muy fácil de hacer, una vez tienes instalado todo lo necesario... Es adictivo esto jejeje. El primero ha sido para integrar a una amiga en las imágenes y el resultado es espectacular, aunque no puedo poner las imágenes por cuestiones de privacidad, pero en resumen, tras crear el LoRA a partir de 28 imágenes suyas (y eso que casi todas son de su cara, ya que la mayoría de fotos que me ha enviado son las típicas hechas con el móvil), la he podido sacar con el traje de IronMan, con el de Thor, con el aspecto de un Navii de Avatar, con el diseño de un personaje de las películas de Don Bluth (el creador de Dragon's Lair, Todos los perros van al cielo, etc...), como pintura al óleo, como personaje de anime, etc... Hasta como si fuera un personaje de Jojo's Bizarre Adventure... Todos estilos muy diferentes y en todos reproduce sus características perfectamente y es reconocible, sus ojos, su sonrisa y sus gafas, el estilo del pelo, etc...

El segundo que he entrenado sí que lo puedo mostrar, y aunque lo he hecho para echar una mano a un compañero con una cosilla que andamos haciendo, el resultado ha sido muy bueno. Un problema que veía hasta ahora con Stable Diffusion era que la mayoría de modelos que la gente crea son de Anime, es de lo que más hay... pero muy poco de otros estilos gráficos de creadores occidentales. Hay estilos muy interesantes pero que al haber sido entrenados con ese tipo de arte no son aplicables cuando quieres crear personajes con aspecto occidental. El asunto es que se me ocurrió crear un LoRA para un tipo de ilustración al óleo muy común entre los 60 y 80 como las que se usaban en las portadas de los libros juveniles, así que hice el entrenamiento con 24 portadas de los libros de la saga de Los Tres Investigadores (que inicielmente se llama Alfred Hitchcock y Los Tres Investigadores), y el resultado es satisfactorio: Usándolo en modelos de anime como Anything V3, por ejemplo, automáticamente todos los personajes salen con ropa ochentera y dejan de tener estilo anime, y los fondos se notan como a pinceladas como si fueran óleos, que además al ser un LoRA el efecto se puede regular y hacerlo más o menos intenso. Incluso funciona en modelos para fotografía realista... Voy a mostrar algunos ejemplos:

La verdad es que está genial poder introducir nuevos estilos... Se me ocurren mil ideas para hacer

Menuda pintaca, compi!

¿Oye, esto del LoRa que es exactamante?

sirdrak · « **Respuesta #22 en:** Febrero 25, 2023, 10:44:26 pm »

Cita de: empardopo en Febrero 25, 2023, 08:46:55 pm

Cita de: sirdrak en Febrero 25, 2023, 12:38:33 pm
Ya he entrenado mis primeros dos LoRAs y es muy fácil de hacer, una vez tienes instalado todo lo necesario... Es adictivo esto jejeje. El primero ha sido para integrar a una amiga en las imágenes y el resultado es espectacular, aunque no puedo poner las imágenes por cuestiones de privacidad, pero en resumen, tras crear el LoRA a partir de 28 imágenes suyas (y eso que casi todas son de su cara, ya que la mayoría de fotos que me ha enviado son las típicas hechas con el móvil), la he podido sacar con el traje de IronMan, con el de Thor, con el aspecto de un Navii de Avatar, con el diseño de un personaje de las películas de Don Bluth (el creador de Dragon's Lair, Todos los perros van al cielo, etc...), como pintura al óleo, como personaje de anime, etc... Hasta como si fuera un personaje de Jojo's Bizarre Adventure... Todos estilos muy diferentes y en todos reproduce sus características perfectamente y es reconocible, sus ojos, su sonrisa y sus gafas, el estilo del pelo, etc...

El segundo que he entrenado sí que lo puedo mostrar, y aunque lo he hecho para echar una mano a un compañero con una cosilla que andamos haciendo, el resultado ha sido muy bueno. Un problema que veía hasta ahora con Stable Diffusion era que la mayoría de modelos que la gente crea son de Anime, es de lo que más hay... pero muy poco de otros estilos gráficos de creadores occidentales. Hay estilos muy interesantes pero que al haber sido entrenados con ese tipo de arte no son aplicables cuando quieres crear personajes con aspecto occidental. El asunto es que se me ocurrió crear un LoRA para un tipo de ilustración al óleo muy común entre los 60 y 80 como las que se usaban en las portadas de los libros juveniles, así que hice el entrenamiento con 24 portadas de los libros de la saga de Los Tres Investigadores (que inicielmente se llama Alfred Hitchcock y Los Tres Investigadores), y el resultado es satisfactorio: Usándolo en modelos de anime como Anything V3, por ejemplo, automáticamente todos los personajes salen con ropa ochentera y dejan de tener estilo anime, y los fondos se notan como a pinceladas como si fueran óleos, que además al ser un LoRA el efecto se puede regular y hacerlo más o menos intenso. Incluso funciona en modelos para fotografía realista... Voy a mostrar algunos ejemplos:

La verdad es que está genial poder introducir nuevos estilos... Se me ocurren mil ideas para hacer

Menuda pintaca, compi!

¿Oye, esto del LoRa que es exactamante?

Pues verás, la forma de entrenar a la IA y que haga más y mejores cosas que las hacía su modelo base, el que usaba por defecto, se puede hacer de varias formas:

- Mediante un Checkpoint, que en realidad se trata del modelo base reentrenado para especializarse en un ámbito concreto (por ejemplo anime, o fotorrealismo), lo que mejora su capacidad en dicho ámbito. La ventaja es que es un modelo completo y autónomo, por así decirlo, es decir, que puedes usar Stable Diffusion sin tener el modelo base, por ejemplo. También se pueden conseguir nuevos checkpoints fusionando varios existentes para obtener ventajas de unos y otros y así personalizarlos. La pega que tienen los Checkpoints son dos: Ocupan lo mismo que el modelo original (7 GB), y para entrenarlos tienes que tirar de Google Colab online sí o sí porque requiren de una cantidad exagerada de VRAM para el entrenamiento (es decir, que tienes que tener de una RTX 3090 con sus 24 GB de VRAM para arriba para entrenar el modelo localmente en tu Pc)

- Mediante un embedding o Textual Inversion, que era el metodo que había hasta hace poco para entrenar cosas muy muy concretas, como meter una persona o personaje, un nuevo estilo o un nuevo concepto. Consiste en sustituir uno de los términos ya conocidos por la IA por otro con lo que tu has entrenado, por eso tiene la ventaja de ser el tipo que menos ocupa de todos (unos pocos KB), permite usar al mismo tiempo tantos como quieras y además para invocarlo y ponerlo en uso basta con escribir su nombre. Se pueden usar con todos los modelos exitentes. Las desventajas que tienen son que son lentos de entrenar y están limitados a lo comentado antes: sólo un personaje, sólo un estilo o sólo un concepto. Por lo que llevo viendo, parece que es método preferido por la gente para meter personas reales, aunque no conozco exáctamente la razón.

- Los LoRA (Low Rank Adaptation) son los últimos en llegar con la idea de sustituir a los embbedings anteriores y además de poder usar características de los Checkpoints. Es una técnica inventada por Microsoft, y se lleva usando a penas tres meses pero ya se ha vuelto la más popular. Ocupa más que los Embeddings (entre 8 y 150 MB más o menos) pero sigue teniendo un tamaño muy aceptable en comparación con los Checkpoints. Al igual que los embeddings, se pueden usar con cualquier modelo y también se pueden usar varios, y el uso es el mismo, pero tienen la ventaja de que en un LoRA puede hacer varios personajes, estilos o conceptos a la vez, y que además, el efecto del LoRA es regulable... Se incluye en la descripción de la imagen que das a la IA con el siguiente formato: <nombre_del_LoRA:1> donde el '1' vendría a ser el efecto completo del LoRA (el 100%). Para suavizar su efecto, que se suele usar para mezclar características de un estilo en el caso de ser un LoRA de un estilo, o bien para crear personajes con más o menos elementos del personaje del LoRA, se pone otro porcentaje más pequeño pero en base uno (por ejemplo, un 0.8 para un 80%). Además, si hay varios estilos o personajes, se les invoca por una etiqueta con su nombre. Otra gran ventaja que tienen es que se entrenan muy rápido (los que yo he hecho, 20 minutos el de mi amiga y 30 el del estilo portada ochentera) y que se pueden entrenar en gráficas con tan sólo 6 o 7 GB de VRAM, por lo que está al alcance de la mayoría de usuarios con una gráfica más o menos actual. Además, se pueden extraer cosas de los Checkpoints y convertirlos en un LoRA, ocupando mucho menos y pudiendo usarlas conjuntamente con otros checkpoits diferentes.

- Y finalmente estás las Hypernetworks, que ya están en desuso y han quedado obsoletas. Hoy día sólo se encuentran de los otros tres tipos anteriores.

empardopo · « **Respuesta #23 en:** Febrero 26, 2023, 05:34:28 pm »

Gracias compi.

Oye, teniendo en cuenta que no dispongo de gráfica y que tendría que ser todo online:
1. Que web he recomiendas para empezar a probar? Te lo comento porque comentabas en el primer post algo de webs no oficiales con opciones extras y tal...
2. Se podría hacer esto de entrenar con fotos mías, etc pero online?

Perdona por el tostón, jeje

Enviado desde mi MI MAX 2 mediante Tapatalk

sirdrak · « **Respuesta #24 en:** Febrero 27, 2023, 12:32:23 pm »

Cita de: empardopo en Febrero 26, 2023, 05:34:28 pm

Gracias compi.

Oye, teniendo en cuenta que no dispongo de gráfica y que tendría que ser todo online:
1. Que web he recomiendas para empezar a probar? Te lo comento porque comentabas en el primer post algo de webs no oficiales con opciones extras y tal...
2. Se podría hacer esto de entrenar con fotos mías, etc pero online?

Perdona por el tostón, jeje

Enviado desde mi MI MAX 2 mediante Tapatalk

Si, se puede usar todo online mediante el sistema colaborativo Google Colab... En un sistema de trabajo online que se basa en 'cuadernos', una especie de formularios personalizados que permiten programar cosas e ir probándolas sobre la marcha al mismo tiempo y obtener el resultado. Para usarlos se requiere de una cuenta de Google Drive y se pueden usar de forma gratuíta. Google te cede una de sus gráficas profesionales para realizar el trabajo y se pueden usar gratis pero con limitaciones temporales (puedes usarla unas horas y superada la quota tienes que esperar un día -creo- para volverla a usar). Dichas gráficas son gráficas nVidia con una burrada de VRAM (una A100 con 48 GB de VRAM si no estoy equivocado) y que cuestan lo mismo que comprar un coche pequeño, por eso se usan para entrenar en ellas los Checkpoints, porque pocos usuarios tienen una RTX 3090 o similar con 24 GB de VRAM.

En el Discord de Unstable Diffusion, que recomiendo visitar, especialmente su sección en español, hay tutoriales y cuadernos preparados para usar Stable Diffusion, tanto para generar imágenes como para entrenar modelos de todo tipo. Allí lo que he visto que hace la gente es registrar 4 o 5 cuentas de Google Drive y las van alternando cuando se les acaba el tiempo gratuíto de uso de Google Colab para poder seguir generando imágenes ininterrumpidamente. Yo no he usado nunca Google Colab, aunque sí que he visto tutoriales y no parece complicado de hacer. Mi consejo es que vayas al Discord mencionado y eches un ojo a lo que tienen anclado en la parte de tutoriales para novatos, que también está lo de Google Colab.

Últimamente estoy viendo cosas alucinantes, como LoRAs que te transforman en una figura articulada japonesa de la marca Figma (a nivel fotorrealista), tanto personajes de cualquier tipo como personas (con él ya he probado el LoRA que cree de mi amiga y el resultado es espectacular), otro que te transforma en un Nendroid (los famosos muñequitos cabezones de personajes de juegos y series), o uno que te transforma en miniaturas pintadas de un wargame o RPG... Y uno espectacular que te transforma en una figura de vinilo... pero de 50 M de altura, caminando por una ciudad o escenario que le digas... He visto LoRAs que permiten hacer hojas de sprites de pixel art (y que la gente ya está usando para crear videojuegos, ojo), otras que crean una especia de mundos virtuales en perspectiva isométrica que son muy usables también para el tema de hacer videojuegos, y otros para hacer concept art... Luego la gente está también compartiendo hojas de posturas ya creadas para el modelo OpenPose de ControlNet, el que te permite clonar la postura de una persona de una imagen a la imagen generada por la IA, que las están usando para todo tipo de cosas como para crear concept art de personajes (te crea el mismo personaje desde varias porturas diferentes), gente que usa esto junto al LoRA de las miniaturas en su flujo de trabajo para imprimir miniaturas en 3D con su impresora 3D, he visto tutoriales para generar imágenes panorámicas en 360 grados, y hasta generar imágenes 3D a partir de una imagen 2D gracias al modelo de ControlNet Depth, que identifica el mapa de profundidad del escenario y los objetos de una imagen... Es brutal todo.

Varios ejemplos de algunas cosas que he mencionado:

Imágenes creadas con el LoRA de minis de Figma:

Imágenes creadas con el LoRA de miniaturas pintadas:

Imágenes creadas con los Checkpoints o LoRAs para hacer pixelart:

Los sprites creados, aunque algunos de primeras no parecen perfectos, una vez los reduces al 25% de resolución con el modo 'Por Aproximación (bordes definidos)' del Photoshop, se pueden usar directamente en la creación de videojuegos, ojo... Aquí van unos ejemplos de esto:

Y finalmente, algunas imágenes del que crea figuras 'gigantes' de vinilo:

Y sobre lo del Discord de Unstable Diffusion que mencioné antes, por si t quieres pasar por allí e informarte sobre lo de Google Colab, aquí está el enlace: https://discord.gg/unstablediffusion

zzgus · « **Respuesta #25 en:** Febrero 27, 2023, 04:58:26 pm »

Joder tío me encanta leerte.

He quedado alucinado con el LoRA de minis de Figma !!!
Me falta tiempo para probarlo todo !!!

Por cierto, una sugerencia si se me permite decir, cuando citéis a alguien y el texto contiene muchas imágenes podéis borrar parte del texto para que no sea tan largo, que me duelen los dedos de hacer scroll !!!!!

Saludos
Gus

sirdrak · « **Respuesta #26 en:** Febrero 27, 2023, 05:27:47 pm »

Cita de: zzgus en Febrero 27, 2023, 04:58:26 pm

Joder tío me encanta leerte.

He quedado alucinado con el LoRA de minis de Figma !!!
Me falta tiempo para probarlo todo !!!

Por cierto, una sugerencia si se me permite decir, cuando citéis a alguien y el texto contiene muchas imágenes podéis borrar parte del texto para que no sea tan largo, que me duelen los dedos de hacer scroll !!!!!

Saludos
Gus

Pues imagina yo, que lo probé todo el tiempo con el LoRA que hice de mi amiga... Todas las figuritas con su cara y su cuerpo (y su ropa en el caso de las Figma). Con las minis pintadas, primero probé con ella 'normal' pero luego con personajes de juegos de Rol y bueno... Hice minis como para llenar un Heroquest xD Incluyendo todos los héroes, los orcos, los goblins, la vampiresa, las arpías... Hasta una aldeana con una cesta de frutas. A ella le ha hecho muchísima gracia. Tengo pensado entrenar un LoRA de mí mismo para poder hacer imágenes similares y poder mostrarlas en público xD

Josepzin · « **Respuesta #27 en:** Febrero 27, 2023, 08:02:42 pm »

Esto es cosa e'mandinga...! :O

zzgus · « **Respuesta #28 en:** Febrero 27, 2023, 11:18:30 pm »

Por cierto veo que siguen fallando en los dedos de las manos !!!

Saludos
Gus

sirdrak · « **Respuesta #29 en:** Febrero 28, 2023, 12:22:01 pm »

Cita de: zzgus en Febrero 27, 2023, 11:18:30 pm

Por cierto veo que siguen fallando en los dedos de las manos !!!

Saludos
Gus

Es normal teniendo en cuenta que las manos son una de las cosas más difíciles de dibujar y representar para un artista, hasta el punto de que hay algunos que se dedican exclusivamente a estudiarlas y dibujarlas de forma exclusiva, ya que son de una complejidad extrema por su gran movilidad. La cosa varía de unos modelos a otros (hay algunos más propensos que otros a problemas con los dedos y las manos), pero ahora van a actualizar el modelo de ControlNet OpenPose (el que permite mimetizar en la imagen final una postura bien a partir de una imagen previa de una persona o personaje real, bien a partir de una representación esquemática de un monigote a base de segmentos de colores con un fondo negro) para poder hacer lo mismo con las manos y los dedos de los personajes, lo que debería arreglar el problema en gran medida.

iojukebox Theme, un JukeBox para Attract-Mode	Autor: gucaza	Foro: Themes AM	04/05/2024 (02:47)
Salón Recreativo #55 (27-04-2024 / 26-05-2024)	Autor: jordani11	Foro: Salón Recreativo FaseBonus	03/05/2024 (23:29)
Nuevo miniPc para mi vieja recre y juegos Windows compatibles formato 4:3	Autor: jmpuk	Foro: Offtopic	02/05/2024 (23:31)
Homenaje a Locomalito	Autor: beaches	Foro: Otros programas	02/05/2024 (23:03)
La inteligencia artificial ha llegado a la música	Autor: jmpuk	Foro: Offtopic	02/05/2024 (21:45)
[N3DS] Red Viper - Emulando Virtual Boy como Dios manda	Autor: Zael	Foro: Noticias de emuladores	02/05/2024 (21:06)
[Recomendación] Cine para los findes en casa (bueno, bonito y barato)	Autor: arquillos	Foro: Offtopic	02/05/2024 (09:39)
¿A qué estáis jugando ahora mismo?	Autor: joselopez	Foro: Offtopic	02/05/2024 (04:07)
[Recomendacion] Series para ver	Autor: jmpuk	Foro: Offtopic	01/05/2024 (21:54)
Etpa8: El Reino Subterráneo	Autor: jmpuk	Foro: ZX Spectrum	01/05/2024 (21:49)
Stop the express	Autor: jmpuk	Foro: ZX Spectrum	01/05/2024 (21:29)
Amiga Games + 1.9.2	Autor: empardopo	Foro: Emuladores	01/05/2024 (20:58)
West Bank para ZX Spectrum	Autor: empardopo	Foro: ZX Spectrum	01/05/2024 (20:07)
Recopilatorio Retos: Desde el 1 hasta .....	Autor: Zael	Foro: Competiciones y concursos	29/04/2024 (23:59)
Info sobre MARP	Autor: Zael	Foro: Records y wolfmame	29/04/2024 (23:45)
Patrocinador para el foro ArcadeSpain	Autor: empardopo	Foro: Noticias	29/04/2024 (19:37)
Retro 320 - Wizard of wor	Autor: empardopo	Foro: Competiciones y concursos	29/04/2024 (19:29)
Aprende a hacerte un PORTABLE de tu juego arcade favorito	Autor: empardopo	Foro: Records y wolfmame	29/04/2024 (19:27)
Screenshot de empardopo	Autor: empardopo	Foro: Otros programas	24/04/2024 (19:42)
Concurso Bytemaniacos 2025	Autor: empardopo	Foro: Creación de juegos	23/04/2024 (21:46)
Retro Portable Maker ArcadeSpain (RPMA)	Autor: empardopo	Foro: Otros programas	21/04/2024 (19:16)
Van dos y se cae el del medio - Hilo de cachondeo general	Autor: empardopo	Foro: Offtopic	21/04/2024 (18:47)
Hacer fondos de pantalla con Excel para Spectrum	Autor: empardopo	Foro: Creación de juegos	18/04/2024 (19:33)
Salón Recreativo FaseBonus - Preparativos y Sugerencias	Autor: Zael	Foro: Salón Recreativo FaseBonus	17/04/2024 (00:17)
Retropixel 2024	Autor: Zael	Foro: Eventos Arcades	14/04/2024 (12:24)
Ofertas Amazon	Autor: empardopo	Foro: Offtopic	11/04/2024 (20:29)
Restauración Terminator 2 + LightGun Gun4IR	Autor: HeroTonma	Foro: Diario de construccion de tu arcade	04/04/2024 (14:18)
Ojo con telegram	Autor: Zael	Foro: Noticias	29/03/2024 (19:30)
Galería de fotos en ArcadeSpain - sube las fotos a nuestro servidor -	Autor: empardopo	Foro: Noticias	24/03/2024 (16:49)
Flipando con la desinformación en el caso del emulador Yuzu	Autor: Zael	Foro: Offtopic	22/03/2024 (20:13)

Arcadespain

Autor Tema: La revolución que suponen las IA generativas de imágenes a partir de texto (Leído 5249 veces)

sirdrak

Re: La revolución que suponen las IA generativas de imágenes a partir de texto

empardopo

Re: La revolución que suponen las IA generativas de imágenes a partir de texto

sirdrak

Re: La revolución que suponen las IA generativas de imágenes a partir de texto

empardopo

Re: La revolución que suponen las IA generativas de imágenes a partir de texto

sirdrak

Re: La revolución que suponen las IA generativas de imágenes a partir de texto

sirdrak

Re: La revolución que suponen las IA generativas de imágenes a partir de texto

empardopo

Re: La revolución que suponen las IA generativas de imágenes a partir de texto

sirdrak

Re: La revolución que suponen las IA generativas de imágenes a partir de texto

empardopo

Re: La revolución que suponen las IA generativas de imágenes a partir de texto

sirdrak

Re: La revolución que suponen las IA generativas de imágenes a partir de texto

zzgus

Re: La revolución que suponen las IA generativas de imágenes a partir de texto

sirdrak

Re: La revolución que suponen las IA generativas de imágenes a partir de texto

Josepzin

Re: La revolución que suponen las IA generativas de imágenes a partir de texto

zzgus

Re: La revolución que suponen las IA generativas de imágenes a partir de texto

sirdrak

Re: La revolución que suponen las IA generativas de imágenes a partir de texto

Temas recientes