Hace un año, probé la aplicación GEN-2, que prometía revolucionar la creación de vídeos a partir de descripciones textuales. Entonces me pareció una auténtica maravilla, y no lo neguemos, lo era para la época. Sin embargo, lo que acaba de caer en mis manos —o más bien, lo que acabo de generar con mis propias manos— deja a GEN-2 en el baúl de los recuerdos. La herramienta que os traigo hoy, MiniMax y su modelo Video-01, no solo se ha presentado como un digno sucesor de aquella primera incursión en la generación audiovisual, sino que ha elevado el listón a niveles insospechados.
Recuerdo perfectamente el escepticismo con el que abordé por primera vez GEN-2. ¿Una IA capaz de crear vídeos a partir de un simple texto? Sonaba a promesa vacía. Y si bien cumplió en su momento, dejaba un amargo sabor a «esto es solo el principio». Pues bien, amigos, parece que ese «principio» ha evolucionado de manera abrumadora.
Para los que todavía no habéis oído hablar de MiniMax, os explico: se trata de una empresa emergente china que ha desarrollado una herramienta de generación de vídeos llamada Video-01, capaz de crear clips de hasta seis segundos a partir de simples descripciones en texto. Lo probé con una mezcla de escepticismo y curiosidad, porque, ya sabéis, el que mucho promete… Pero esta vez, MiniMax no solo cumplió con lo prometido, sino que lo superó con creces.
El prompt que introduje fue el siguiente, en inglés (porque sí, la IA aún no admite otros idiomas para generar vídeos, al menos por ahora):
«A vast futuristic temple entrance surrounded by towering walls adorned with intricate carvings and ancient symbols. In the background, a giant circular structure with a smooth, glowing black orb dominates the architecture, emitting a soft light. The scene is filled with a large crowd of people dressed in flowing robes, walking and gathering in the grand plaza below the monumental entrance. The architecture is grandiose and monumental, blending futuristic elements with ancient, mystical designs. Warm sunlight casts long shadows on the ground, creating a sense of awe and majesty.»
Sí, lo sé. Puede parecer un conjunto de palabras elegantes para describir una escena que habríamos visto cientos de veces en películas de ciencia ficción o videojuegos. Pero lo impresionante es cómo esta IA transformó esas palabras en un vídeo tan visualmente potente que me dejó boquiabierto.
El vídeo, de solo seis segundos, logró capturar a la perfección no solo la imagen, sino la atmósfera que intenté describir. El resplandor tenue del orbe negro en el cielo, las figuras humanas moviéndose bajo la imponente estructura… Todo estaba ahí. No era simplemente un conjunto de imágenes estáticas, sino una escena con vida propia.
Para los curiosos, os adjunto el vídeo generado por MiniMax, y os recomiendo que lo veáis antes de continuar leyendo. No porque vaya a cambiar vuestras vidas (aunque quién sabe), sino porque quiero que experimentéis lo mismo que yo al verlo por primera vez.
Cuando hablé de GEN-2 hace un año, ya os comenté que la IA aún estaba en pañales en cuanto a generación de vídeos. Los resultados eran sorprendentes, sí, pero aún se notaba la falta de pulido en ciertos aspectos: movimientos bruscos, detalles imprecisos, colores que no terminaban de cuajar… Vamos, pequeños detalles que el ojo humano rápidamente detectaba. MiniMax ha mejorado todo esto. Ahora las transiciones son fluidas, los detalles están bien definidos, y lo más importante: el vídeo transmite emociones.
El nivel de detalle de MiniMax me tiene completamente descolocado. Desde las figuras humanas hasta la arquitectura del templo futurista, cada aspecto del vídeo parece cuidadosamente diseñado. No es simplemente una máquina lanzando píxeles al azar. Es una máquina creando, y lo hace mejor que muchas herramientas que han pasado por mis manos.
Otra cosa que me ha sorprendido es la rapidez. Con GEN-2, la generación del vídeo podía ser tediosa, y a menudo me encontraba esperando durante largos minutos para ver un resultado que, muchas veces, no estaba a la altura. Aquí, MiniMax tarda solo unos cinco minutos en generar vídeos de alta calidad. Sí, es cierto, cinco minutos no son nada para los que estamos acostumbrados a los tiempos de renderización de la animación 3D o incluso a las largas sesiones de edición de vídeo. Pero lo que impresiona es lo que MiniMax es capaz de hacer en ese corto período de tiempo.
MiniMax ha dado en el clavo. No solo porque ha creado una aplicación accesible y potente, sino porque ha elevado el listón de lo que una IA puede hacer en el ámbito audiovisual. Y mientras los gigantes de la tecnología —Google, OpenAI y compañía— siguen perfeccionando sus modelos, la carrera por dominar el futuro del contenido generado por IA ya ha comenzado.
Volviendo al vídeo que generé, me pregunto: ¿cuánto tardaremos en ver aplicaciones comerciales de esta tecnología en el cine, la televisión o incluso en nuestros dispositivos personales? Porque, aunque ahora mismo MiniMax solo permite crear vídeos cortos, es cuestión de tiempo que podamos generar contenido más largo y complejo. Y cuando llegue ese día, la línea entre lo que es creado por el ser humano y lo que es generado por una IA será aún más difusa.
Mientras tanto, os invito a que probéis MiniMax por vosotros mismos. Sé que muchos de vosotros sois escépticos, como lo era yo hace un año cuando hablé de GEN-2. Pero creedme, esta vez la IA no solo ha cumplido sus promesas. Las ha superado, y eso es algo que muy pocas veces ocurre en este mundo cada vez más digital.