Autor Tema: La revolución que suponen las IA generativas de imágenes a partir de texto  (Leído 13740 veces)

0 Usuarios y 1 Visitante están viendo este tema.

Desconectado Zael

  • VIP
  • *
  • Mensajes: 2106
  • Gracias 11
    • Ancient Bits
  • Iniciales nick: ZAE
Re: La revolución que suponen las IA generativas de imágenes a partir de texto
« Respuesta #105 en: Diciembre 27, 2024, 12:42:52 am »
Advertisement

Joder con la faraona!!  ??? ??? :P

P.D.: Justo el otro día un colega que pinta figuras de Warhammer me enseñó cómo usa la IA para hacer simulación de cómo puede quedar, incluso para ponerle luego diálogos a los personajes de las figuras para subir vídeos promocionales, con voces que se adaptan al estilo de personaje... en fin, está claro que a nivel artístico esto ha puesto todo patas arriba.

P.D.2: Por cierto muchachos, esta Nochevieja el Especial de José Mota basado también en toda esta revolución IA (se titula "Operación IA, IA, OH!"), con los políticos sustituidos por IAs (¡por fin!) y parodiados a gusto... ¡eso yo no me lo pierdo!  ;D ;D






Desconectado jmpuk

  • Usuarios normales
  • *
  • Mensajes: 455
  • Gracias 4
  • Iniciales nick: PUK
Re: La revolución que suponen las IA generativas de imágenes a partir de texto
« Respuesta #106 en: Enero 01, 2025, 01:51:47 am »

Joder con la faraona!!  ??? ???

P.D.: Justo el otro día un colega que pinta figuras de Warhammer me enseñó cómo usa la IA para hacer simulación de cómo puede quedar, incluso para ponerle luego diálogos a los personajes de las figuras para subir vídeos promocionales, con voces que se adaptan al estilo de personaje... en fin, está claro que a nivel artístico esto ha puesto todo patas arriba.

P.D.2: Por cierto muchachos, esta Nochevieja el Especial de José Mota basado también en toda esta revolución IA (se titula "Operación IA, IA, OH!"), con los políticos sustituidos por IAs (¡por fin!) y parodiados a gusto... ¡eso yo no me lo pierdo!  ;D ;D
Ha sido el bueno el especial si!!!

@sirdrak se pueden hacer videos con esas maravillas de imagenes?
Menuda olaaaaaa

Enviado desde mi SM-G985F mediante Tapatalk


Desconectado sirdrak

  • VIP
  • *
  • Mensajes: 1358
  • Gracias 60
  • Ciudad: Sevilla
Re: La revolución que suponen las IA generativas de imágenes a partir de texto
« Respuesta #107 en: Enero 07, 2025, 08:40:39 pm »

Joder con la faraona!!  ??? ???

P.D.: Justo el otro día un colega que pinta figuras de Warhammer me enseñó cómo usa la IA para hacer simulación de cómo puede quedar, incluso para ponerle luego diálogos a los personajes de las figuras para subir vídeos promocionales, con voces que se adaptan al estilo de personaje... en fin, está claro que a nivel artístico esto ha puesto todo patas arriba.

P.D.2: Por cierto muchachos, esta Nochevieja el Especial de José Mota basado también en toda esta revolución IA (se titula "Operación IA, IA, OH!"), con los políticos sustituidos por IAs (¡por fin!) y parodiados a gusto... ¡eso yo no me lo pierdo!  ;D ;D
Ha sido el bueno el especial si!!!

@sirdrak se pueden hacer videos con esas maravillas de imagenes?
Menuda olaaaaaa

Enviado desde mi SM-G985F mediante Tapatalk

Por supuesto!!




Desconectado jmpuk

  • Usuarios normales
  • *
  • Mensajes: 455
  • Gracias 4
  • Iniciales nick: PUK
Re: La revolución que suponen las IA generativas de imágenes a partir de texto
« Respuesta #108 en: Enero 07, 2025, 09:40:42 pm »

Joder con la faraona!!  ??? ???

P.D.: Justo el otro día un colega que pinta figuras de Warhammer me enseñó cómo usa la IA para hacer simulación de cómo puede quedar, incluso para ponerle luego diálogos a los personajes de las figuras para subir vídeos promocionales, con voces que se adaptan al estilo de personaje... en fin, está claro que a nivel artístico esto ha puesto todo patas arriba.

P.D.2: Por cierto muchachos, esta Nochevieja el Especial de José Mota basado también en toda esta revolución IA (se titula "Operación IA, IA, OH!"), con los políticos sustituidos por IAs (¡por fin!) y parodiados a gusto... ¡eso yo no me lo pierdo!  ;D ;D
Ha sido el bueno el especial si!!!

@sirdrak se pueden hacer videos con esas maravillas de imagenes?
Menuda olaaaaaa

Enviado desde mi SM-G985F mediante Tapatalk

Por supuesto!!




La leche!!!!
Demasiado cortas esas animaciones

Enviado desde mi SM-G985F mediante Tapatalk


Desconectado sirdrak

  • VIP
  • *
  • Mensajes: 1358
  • Gracias 60
  • Ciudad: Sevilla
Re: La revolución que suponen las IA generativas de imágenes a partir de texto
« Respuesta #109 en: Febrero 09, 2025, 06:41:09 pm »
Hoy os voy a comentar un poco las novedades que hay en cuanto a generación de vídeos con IA pero en local y opensource, en contraposición a los servicios online por suscripción como Kling, Hailuo Minimax o Dream machine de Luma... Lo cierto es que en los últimos meses se está viendo un auténtico 'boom' con avances significativos similares a los que acontecieron en la generación de imágenes cuando apareció Stable Diffusion 1.5 en 2022, sobre todo con la aparición de cierto modelo del que os hablaré luego.

Al principio la adopción de estos modelos se ha hecho más complicada por las ya consabidas limitaciones técnicas referentes a la cantidad de VRAM cada vez más alta que piden los nuevos modelos para funcionar (con la honrosa excepción de LTX video), a la que no ayuda la tradicional racanería de nVidia a la hora de aumentar la cantidad de VRAM en las tarjetas gráficas de usuario. La salida de la nueva generación de gráficas RTX 50xx no ha hecho mas que empeorar las cosas, ya que nVidia, para seguir teniendo ventaja en el mercado profesional de IA y obligar a que si quieres más VRAM tengas que ir a una gráfica de este tipo, al contrario de lo que sería lo lógico, ha seguido manteniendo los 16 GB de VRAM como máximo (al menos por ahora, no sabemos si esto cambiará con futuras variantes Super de las mismas) en las gráficas de gama media alta como las 5070 y las 5080 en lugar de aumentar su VRAM a 20 o 24 GB, ya que aumentan la de la 5090 a 32 GB. Afortunadamente, ya que todos estos modelos tienen una arquitectura moderna basada en 'transformers', como los LLM, ha sido posible aplicar el mismo tipo de optimizaciones que a estos para hacer funcionar los modelos en equipos más humildes con menos VRAM.

A día de hoy han aparecido los siguientes modelos:

- Mochi: El primer modelo de vídeo de alta calidad con resultados cercanos a lo que ofrecen los servicios de suscripción de pago. La pega que ha impedido su popularización es que pide 64 GB de VRAM para funcionar y que no tiene modo 'image2video' (el que permite generar una animación a partir de una imagen suministrada)
- CogvideoX: Este es el primer modelo con unos requisitos altos pero aceptables que se empezó a popularizar, también de los primeros en aparecer, y que sí tiene los tres modos (video2video, txt2video e img2video)
- LTX video: Lo de este modelo supuso el primer 'Boom' y que hizo que el tema empezase a despegar. Sus puntos fuertes es que es un modelo muy ligero (más o menos como SD XL) que funciona en una gran cantidad de equipos y que es rapidísimo generando los vídeos, hasta el punto de que con gráficas potentes (una 4090 por ejemplo) la generación del vídeo se acerca al tiempo que tarda en reproducirse el vídeo. Además tiene los tres modos antes comentados, y habría sido el más popular de no ser por la llegada del último contendiente. Las pegas son que los vídeos que genera no son de tan buena calidad como los de CogvideoX, por ejemplo, y que para que de buenos resultados hay que escribir prompts muy largos y detallados, hasta el punto de que se recomienda generarlos con un LLM. Tampoco se le da bien animar cosas que no sean fotorrealistas, como dibujos animados.
- Hunyuan video: Tenemos un ganador, señores!! La llegada de este modelo, por varias cosas que ahora comentaré, ha sido una auténtica revolución similar a la que supuso la llegada de Stable Diffusion 1.5. Aunque pide bastante VRAM para funcionar, se puede utilizar incluso con sólo 8 GB de VRAM usando algunas de sus versiones pequeñas en GGUF. Su versión del modo img2video no ha sido publicada aún pero sus desarrolladores dicen que la publicarán en breve. Sin embargo, lo que le ha hecho destacar son los siguientes puntos:
      * Su calidad es la mayor de todos, cercana a la de los servicios de suscripción
      * Es muy fácil entrenar LoRas para él, de hecho igual de fácil que entrenarlos para un modelo de generación de imágenes, pudiendo usar en el entrenamiento imágenes o clips de vídeo. Esto implica poder entrenar personas, personajes, animaciones de todo tipo, estilos artísticos, etc... Algo que no ofrecen ni en sueños las IAs de suscripción de pago.
      * Es el único modelo que no tiene censura, siendo capaz de mostrar desnudos integrales tanto masculinos como femeninos, representar correctamente los genitales y hasta entender conceptos sexuales, por lo que, gracias a los LoRas, es capaz de generar todo tipo de porno muy realista (y ya se sabe que el sexo es una gran fuerza que hace avanzar curiosamente la tecnología, como está pasando aquí). También conoce bastante bien la anatomía y las manos suelen salir bien.
      * Es el mejor modelo que he visto representando anime y series de animación. Lo que he podido ver es bastante sorprendente (pondré algunos ejemplos luego).

Por estas razones, este último ha despertado un enorme entusiasmo en la comunidad y ya hay LoRas de todo tipo. En realidad ya lleva unos meses disponible, pero por unas cosas y otras no lo pude probar hasta esta semana y la verdad es que me han asombrado sus resultados... Ya estoy deseando entrenar LoRas para él y ver qué consigo...

Os voy a dejar con unos ejemplos de animación usando un LoRa con el estilo artístico de Katsuhiro Otomo (el creador de Akira), que lo que más me sorprende es que ha sido entrenado sólo con imágenes y no con clips de video:





























Me parece impresionante teniendo en cuenta que son imágenes 100% generadas por Hunyuan sin partir de una imagen previa...
« Última modificación: Febrero 09, 2025, 06:44:48 pm por sirdrak »

Desconectado empardopo

  • Admin
  • *
  • Mensajes: 22129
  • Gracias 763
  • Espero mejorar al KungFu Master!
    • Mi canal de Youtube
  • Ciudad: Norte de África
  • Pais: Escoña
  • Iniciales nick: EPP
Re: La revolución que suponen las IA generativas de imágenes a partir de texto
« Respuesta #110 en: Febrero 17, 2025, 07:17:47 pm »
@sirdrak, qué gráfica tenías tú??

Por cierto, he dejado otra preguntilla por aquí.

Thanks
« Última modificación: Febrero 17, 2025, 07:25:57 pm por empardopo »

Desconectado sirdrak

  • VIP
  • *
  • Mensajes: 1358
  • Gracias 60
  • Ciudad: Sevilla
Re: La revolución que suponen las IA generativas de imágenes a partir de texto
« Respuesta #111 en: Febrero 18, 2025, 05:59:20 pm »
@sirdrak, qué gráfica tenías tú??

Por cierto, he dejado otra preguntilla por aquí.

Thanks

Antes tenía una 3080, pero hace un año me compré una RTX 3090 24 GB de VRAM de segunda mano por 650 € y contentísimo con ella.

Desconectado jmpuk

  • Usuarios normales
  • *
  • Mensajes: 455
  • Gracias 4
  • Iniciales nick: PUK
Re: La revolución que suponen las IA generativas de imágenes a partir de texto
« Respuesta #112 en: Febrero 19, 2025, 09:20:21 pm »
@sirdrak Algun motor IA LLM que admita tambien imagenes que recomiendes para generar tilesets de 16x16 32x32 etc... en incluso sprites?

Hasta ahora lo que he probado es de traca....luego si encuentro algun ejemplo quw no haya borrado lo subo porque son de coña marinera

Gracias!!!

Enviado desde mi SM-G985F mediante Tapatalk


Desconectado sirdrak

  • VIP
  • *
  • Mensajes: 1358
  • Gracias 60
  • Ciudad: Sevilla
Re: La revolución que suponen las IA generativas de imágenes a partir de texto
« Respuesta #113 en: Febrero 20, 2025, 12:08:37 pm »
@sirdrak Algun motor IA LLM que admita tambien imagenes que recomiendes para generar tilesets de 16x16 32x32 etc... en incluso sprites?

Hasta ahora lo que he probado es de traca....luego si encuentro algun ejemplo quw no haya borrado lo subo porque son de coña marinera

Gracias!!!

Enviado desde mi SM-G985F mediante Tapatalk

He visto cosas al respecto que generan sprites más o menos bien, pero el problema a la hora de crear tilesets es que los fotogramas de la animación no suelen tener lógica. Pero para crear sprites y tal sí que hay bastantes cosas. En A1111/Forge hay una extensión que permite redimensionar y escalar las imágenes generadas con estilo pixelart para que queden bien como sprites, hay muchos LoRas para generar sprites con muchos estilos (por ejemplo personajes con el estilo de Capcom de los Street Fighter), e incluso tilesets, tanto de SD XL como de Flux y otros modelos... En realidad los hay desde el principio, y estoy viendo que algunos sí los consiguen usar con éxito para hacer animaciones, por ejemplo:



La clave está en usar la extensión ControlNET con openpose para las posturas de cada sprite de la animación... Incluso hay workflows para ComfyUI ya preparados para hacerlo, como este:

https://civitai.com/models/448101/sprite-sheet-maker




Desconectado jmpuk

  • Usuarios normales
  • *
  • Mensajes: 455
  • Gracias 4
  • Iniciales nick: PUK
Re: La revolución que suponen las IA generativas de imágenes a partir de texto
« Respuesta #114 en: Febrero 20, 2025, 09:26:05 pm »
Ok gracias! Le echare un buen ojo a todo

Realmente busco algo mas basico que lo de las animaciones, que vendra luego claro y es en plan: generame tilesets de 16x16 para poder hacer mapa de castillo en 2d vista cenital no isometrica medieval con ventanas, puente levadizo, jardines, bla bla bla...

Enviado desde mi SM-G985F mediante Tapatalk

Desconectado empardopo

  • Admin
  • *
  • Mensajes: 22129
  • Gracias 763
  • Espero mejorar al KungFu Master!
    • Mi canal de Youtube
  • Ciudad: Norte de África
  • Pais: Escoña
  • Iniciales nick: EPP
Re: La revolución que suponen las IA generativas de imágenes a partir de texto
« Respuesta #115 en: Febrero 22, 2025, 01:52:09 pm »
@sirdrak, qué gráfica tenías tú??

Por cierto, he dejado otra preguntilla por aquí.

Thanks

Antes tenía una 3080, pero hace un año me compré una RTX 3090 24 GB de VRAM de segunda mano por 650 € y contentísimo con ella.
Jolín, se les ha ido la pinza con los precios de la tarjeta con 24 gigas, jeje

Enviado desde mi 2306EPN60G mediante Tapatalk


Desconectado sirdrak

  • VIP
  • *
  • Mensajes: 1358
  • Gracias 60
  • Ciudad: Sevilla
Re: La revolución que suponen las IA generativas de imágenes a partir de texto
« Respuesta #116 en: Febrero 25, 2025, 08:27:18 pm »
@sirdrak, qué gráfica tenías tú??

Por cierto, he dejado otra preguntilla por aquí.

Thanks

Antes tenía una 3080, pero hace un año me compré una RTX 3090 24 GB de VRAM de segunda mano por 650 € y contentísimo con ella.
Jolín, se les ha ido la pinza con los precios de la tarjeta con 24 gigas, jeje

Enviado desde mi 2306EPN60G mediante Tapatalk

El 'Chino Juan' (Jensen Huang, CEO de nVidia), que se aprovecha de que tienen el monopolio en IA y ya mismo va a ser imposible comprarse una gráfica a este paso... Hasta 3000 € están pidiendo por las RTX 5090 (y eso con lo malas que han salido)

Desconectado empardopo

  • Admin
  • *
  • Mensajes: 22129
  • Gracias 763
  • Espero mejorar al KungFu Master!
    • Mi canal de Youtube
  • Ciudad: Norte de África
  • Pais: Escoña
  • Iniciales nick: EPP
Re: La revolución que suponen las IA generativas de imágenes a partir de texto
« Respuesta #117 en: Marzo 06, 2025, 07:17:42 pm »
@sirdrak, qué gráfica tenías tú??

Por cierto, he dejado otra preguntilla por aquí.

Thanks

Antes tenía una 3080, pero hace un año me compré una RTX 3090 24 GB de VRAM de segunda mano por 650 € y contentísimo con ella.
Jolín, se les ha ido la pinza con los precios de la tarjeta con 24 gigas, jeje

Enviado desde mi 2306EPN60G mediante Tapatalk

El 'Chino Juan' (Jensen Huang, CEO de nVidia), que se aprovecha de que tienen el monopolio en IA y ya mismo va a ser imposible comprarse una gráfica a este paso... Hasta 3000 € están pidiendo por las RTX 5090 (y eso con lo malas que han salido)

Precios prohibitivos a menos que te dediques a ello y puedas recuperar...

 


* Salón Recreativo #59 (01-03-2025 / 30-03-2025)  Autor: periko Foro: Salón Recreativo FaseBonus 21/03/2025 (14:36)
* [ZX Spectrum] Donkey Kong  Autor: Zael Foro: Recomendaciones de juegos 21/03/2025 (09:59)
* [Amiga] Donkey Kong  Autor: Zael Foro: Recomendaciones de juegos 21/03/2025 (09:49)
* Reto 324 - Vasara  Autor: empardopo Foro: Competiciones y concursos 20/03/2025 (19:40)
* Reto 325 - Car Action (set 2)  Autor: empardopo Foro: Competiciones y concursos 20/03/2025 (19:01)
* Van dos y se cae el del medio - Hilo de cachondeo general  Autor: empardopo Foro: Offtopic 20/03/2025 (18:52)
* Ofertas Amazon  Autor: empardopo Foro: Offtopic 20/03/2025 (18:41)
* Ayuda con Spectrum +2  Autor: empardopo Foro: Seccion Hardware 20/03/2025 (18:28)
* ¿A qué estáis jugando ahora mismo?  Autor: jmpuk Foro: Offtopic 18/03/2025 (05:32)
* Están muy callados los culerdos, no?  Autor: empardopo Foro: Offtopic 17/03/2025 (21:22)
* [Amiga] Rick Dangerous Pack  Autor: empardopo Foro: Recomendaciones de juegos 17/03/2025 (21:19)
* Amiga Games + F24.01022025  Autor: empardopo Foro: Emuladores 17/03/2025 (18:21)
* [N3DS] Red Viper - Emulando Virtual Boy como Dios manda  Autor: jmpuk Foro: Noticias de emuladores 16/03/2025 (18:15)
* [Recomendación] Cine para los findes en casa (bueno, bonito y barato)  Autor: joselopez Foro: Offtopic 16/03/2025 (07:06)
* [Amiga] Night Shift  Autor: empardopo Foro: Recomendaciones de juegos 14/03/2025 (18:57)
* Duda entre dos tarjetas gráficas para usar con IA  Autor: treme Foro: Offtopic 14/03/2025 (01:59)
* ¿Cómo poner scanlines en mameUI64 versión 0.130?  Autor: Zael Foro: Seccion Video 09/03/2025 (13:14)
* Salón Recreativo FaseBonus - Preparativos y Sugerencias  Autor: Zael Foro: Salón Recreativo FaseBonus 09/03/2025 (12:57)
* [Amiga] Operation Wolf  Autor: empardopo Foro: Recomendaciones de juegos 08/03/2025 (13:37)
* La revolución que suponen las IA generativas de imágenes a partir de texto  Autor: empardopo Foro: Offtopic 06/03/2025 (19:17)
* [Amiga] Glubble  Autor: empardopo Foro: Recomendaciones de juegos 06/03/2025 (18:55)
* [Amiga] King's Valley  Autor: Zael Foro: Recomendaciones de juegos 02/03/2025 (19:07)
* [Amiga] Chuck Rock II:Son of Chuck  Autor: empardopo Foro: Recomendaciones de juegos 23/02/2025 (19:22)

Reto 324 - Vasara