MiniMax: La IA que transforma palabras en vídeo y desafía la imaginación

Hace poco más de un año, os hablaba en este mismo blog sobre GEN-2, la app que creía que cambiaría el panorama de la creación audiovisual mediante IA. Pero lo que acabo de experimentar con MiniMax ha superado con creces mis expectativas. Esta tecnología china ha llegado con una fuerza arrolladora y me ha dejado sin palabras. Y eso, amigos, no es algo que ocurra a menudo.

0
2267

Hace un año, probé la aplicación GEN-2, que prometía revolucionar la creación de vídeos a partir de descripciones textuales. Entonces me pareció una auténtica maravilla, y no lo neguemos, lo era para la época. Sin embargo, lo que acaba de caer en mis manos —o más bien, lo que acabo de generar con mis propias manos— deja a GEN-2 en el baúl de los recuerdos. La herramienta que os traigo hoy, MiniMax y su modelo Video-01, no solo se ha presentado como un digno sucesor de aquella primera incursión en la generación audiovisual, sino que ha elevado el listón a niveles insospechados.

Recuerdo perfectamente el escepticismo con el que abordé por primera vez GEN-2. ¿Una IA capaz de crear vídeos a partir de un simple texto? Sonaba a promesa vacía. Y si bien cumplió en su momento, dejaba un amargo sabor a «esto es solo el principio». Pues bien, amigos, parece que ese «principio» ha evolucionado de manera abrumadora.

Para los que todavía no habéis oído hablar de MiniMax, os explico: se trata de una empresa emergente china que ha desarrollado una herramienta de generación de vídeos llamada Video-01, capaz de crear clips de hasta seis segundos a partir de simples descripciones en texto. Lo probé con una mezcla de escepticismo y curiosidad, porque, ya sabéis, el que mucho promete… Pero esta vez, MiniMax no solo cumplió con lo prometido, sino que lo superó con creces.

El prompt que introduje fue el siguiente, en inglés (porque sí, la IA aún no admite otros idiomas para generar vídeos, al menos por ahora):

«A vast futuristic temple entrance surrounded by towering walls adorned with intricate carvings and ancient symbols. In the background, a giant circular structure with a smooth, glowing black orb dominates the architecture, emitting a soft light. The scene is filled with a large crowd of people dressed in flowing robes, walking and gathering in the grand plaza below the monumental entrance. The architecture is grandiose and monumental, blending futuristic elements with ancient, mystical designs. Warm sunlight casts long shadows on the ground, creating a sense of awe and majesty.»

Sí, lo sé. Puede parecer un conjunto de palabras elegantes para describir una escena que habríamos visto cientos de veces en películas de ciencia ficción o videojuegos. Pero lo impresionante es cómo esta IA transformó esas palabras en un vídeo tan visualmente potente que me dejó boquiabierto.

El vídeo, de solo seis segundos, logró capturar a la perfección no solo la imagen, sino la atmósfera que intenté describir. El resplandor tenue del orbe negro en el cielo, las figuras humanas moviéndose bajo la imponente estructura… Todo estaba ahí. No era simplemente un conjunto de imágenes estáticas, sino una escena con vida propia.

Para los curiosos, os adjunto el vídeo generado por MiniMax, y os recomiendo que lo veáis antes de continuar leyendo. No porque vaya a cambiar vuestras vidas (aunque quién sabe), sino porque quiero que experimentéis lo mismo que yo al verlo por primera vez.

Cuando hablé de GEN-2 hace un año, ya os comenté que la IA aún estaba en pañales en cuanto a generación de vídeos. Los resultados eran sorprendentes, sí, pero aún se notaba la falta de pulido en ciertos aspectos: movimientos bruscos, detalles imprecisos, colores que no terminaban de cuajar… Vamos, pequeños detalles que el ojo humano rápidamente detectaba. MiniMax ha mejorado todo esto. Ahora las transiciones son fluidas, los detalles están bien definidos, y lo más importante: el vídeo transmite emociones.

El nivel de detalle de MiniMax me tiene completamente descolocado. Desde las figuras humanas hasta la arquitectura del templo futurista, cada aspecto del vídeo parece cuidadosamente diseñado. No es simplemente una máquina lanzando píxeles al azar. Es una máquina creando, y lo hace mejor que muchas herramientas que han pasado por mis manos.

Otra cosa que me ha sorprendido es la rapidez. Con GEN-2, la generación del vídeo podía ser tediosa, y a menudo me encontraba esperando durante largos minutos para ver un resultado que, muchas veces, no estaba a la altura. Aquí, MiniMax tarda solo unos cinco minutos en generar vídeos de alta calidad. Sí, es cierto, cinco minutos no son nada para los que estamos acostumbrados a los tiempos de renderización de la animación 3D o incluso a las largas sesiones de edición de vídeo. Pero lo que impresiona es lo que MiniMax es capaz de hacer en ese corto período de tiempo.

MiniMax ha dado en el clavo. No solo porque ha creado una aplicación accesible y potente, sino porque ha elevado el listón de lo que una IA puede hacer en el ámbito audiovisual. Y mientras los gigantes de la tecnología —Google, OpenAI y compañía— siguen perfeccionando sus modelos, la carrera por dominar el futuro del contenido generado por IA ya ha comenzado.

Volviendo al vídeo que generé, me pregunto: ¿cuánto tardaremos en ver aplicaciones comerciales de esta tecnología en el cine, la televisión o incluso en nuestros dispositivos personales? Porque, aunque ahora mismo MiniMax solo permite crear vídeos cortos, es cuestión de tiempo que podamos generar contenido más largo y complejo. Y cuando llegue ese día, la línea entre lo que es creado por el ser humano y lo que es generado por una IA será aún más difusa.

Mientras tanto, os invito a que probéis MiniMax por vosotros mismos. Sé que muchos de vosotros sois escépticos, como lo era yo hace un año cuando hablé de GEN-2. Pero creedme, esta vez la IA no solo ha cumplido sus promesas. Las ha superado, y eso es algo que muy pocas veces ocurre en este mundo cada vez más digital.

Artículo anteriorMeco, su plaza de toros y las fiestas que mantienen viva la memoria de los encierros
Artículo siguienteTecnofeudalismo: El crepúsculo del capitalismo según Varoufakis
Enrique Pampliega
Desde hace más de 30 años ha estado ligado y promoviendo actividades relacionando la geología y geociencias con los recursos electrónicos, internet y las redes sociales y científicas. Jefe de administración del Ilustre Colegio Oficial de Geólogos (ICOG) desde el año 1990. En 1991-1996 Relaciones públicas y posteriormente responsable de marketing de la revista Tierra y Tecnología del ICOG. En 1993-1996 dirigió la publicación “El Geólogo” y en 1997 fundó “El Geólogo Electrónico”. Coordinador de las ediciones I a III del GEA-CD (recopilación y difusión de software para docentes y profesionales de las ciencias de la tierra y el medio ambiente en formato CD-ROM) entre los años 1996 a 1998. Colabora con la ONG Geólogos del Mundo creando su intranet y poniendo en marcha su página web institucional. Desde el año 2000 es responsable de calidad del ICOG (ISO 9001). Ha sido ponente en distintos eventos organizados por Unión Profesional y Unión Interprofesional de la Comunidad de Madrid, sobre la calidad aplicada al sector colegial. Asimismo, ha impartido charlas sobre búsqueda de empleo y redes sociales en el ICOG, Unión Profesional y Universidad Complutense. En 2005 implanta el visado electrónico de proyectos en el ICOG. En el ámbito de las webs y redes científicas, es Community manager del ICOG. Webmaster de la revista Tierra y Tecnología, de la página institucional del ICOG, de la Escuela de Geología Profesional, de la Red Española de Planetología y Astrobiología y de la International Association for Geoethics. Delegado de protección de datos del ICOG desde el año 2018. Experto en digitalización del sector de colegios profesionales ha sido ponente en el taller virtual sobre la "Transformación Digital del Sistema Colegial", organizado por Unión Profesional y Wolters Kluwer en 2020. Ha sido distinguido como Geólogo de Honor por la Asamblea General del ICOG el 15 de abril de 2023. En 2003 crea el “Blog de epampliega” un espacio personal que pasaría en 2008 a llamarse “Un Mundo Complejo” donde trata temas de: economía, redes sociales, innovación, sociedad, etc.

DEJA UNA RESPUESTA

Por favor ingrese su comentario!
Por favor ingrese su nombre aquí