La cosa no parecía gran cosa, al principio. Otra actualización más. Otro post técnico disfrazado de marketing. Pero no. Esto era otra cosa. ChatGPT, ese cuervo parlante que ya nos escribe artículos, guiones, diagnósticos y hasta poesías ñoñas si uno se descuida, ha cruzado una nueva frontera: ya genera imágenes sin necesidad de apoyarse en el viejo DALL·E 3.
Y eso, lector, no es una simple mejora. Es una revolución. Sorda, silenciosa… y definitiva.
Hasta ayer, si uno quería que ChatGPT generara imágenes, lo hacía por intermediación. Una especie de recadero entre tú y el modelo gráfico DALL·E, que construía las imágenes como un escultor ciego: quitando el ruido, afilando el contorno. Ahora no. Ahora ChatGPT lo hace por sí mismo. Gracias al modelo GPT-4o —el “omnimodal”, como les gusta decir a estos nuevos alquimistas— la máquina es capaz de procesar y generar texto, imagen, voz y vídeo, todo a la vez, todo junto, todo entendido. Y lo mejor: está ya disponible para casi todos los usuarios, desde el plan gratuito hasta los de pago, y llegará pronto vía API para los desarrolladores que no temen al fuego.

¿Y qué tiene este GPT-4o que lo hace diferente? Pues que ya no pinta al azar ni por eliminación. Ahora crea como el hombre del Renacimiento: de izquierda a derecha, de arriba abajo, como escribiendo con el pincel, en un proceso autorregresivo que le permite mantener coherencia, precisión y —milagro de los milagros— escribir texto legible en las imágenes. Ya no más letreros deformes, ya no más palabras que parecen escritas por un monje borracho. Ahora puedes pedirle una invitación de boda, un cartel, una infografía… y te la hace como Dios manda.
Y no solo eso. El condenado modelo entiende el contexto. Recuerda lo que le dijiste cinco mensajes atrás. Genera personajes y los mantiene coherentes en cada iteración. Le comenté que creara una imagen de portada de un cómic y luego que me diera una página interior y, ahí está. Además conserva estilos, modifica a petición, se adapta como un buen dibujante bajo contrato. Si le pides que te pinte un caballero medieval y luego le dices que lo convierta en astronauta sin cambiarle la cara, lo hace. Y sin pestañear.
¿Te parece poco? Pues escucha: maneja hasta veinte objetos distintos en una misma escena con atributos complejos —colores, formas, posiciones— sin confundirse. Algo que, hasta hace poco, era un dolor de cabeza para la IA. Puede pasar de bocetos rápidos a hiperrealismo, de caricatura a fotografía. Y hasta transforma imágenes que tú subes para adaptarlas a otros estilos. Es un camaleón con pinceles digitales.
Esto, además de asombrar, sirve. Y mucho. Diseñadores gráficos, profesores, desarrolladores de videojuegos, publicistas… todos tienen ahora una herramienta que, bien usada, puede ahorrarles horas de trabajo. Y mal usada, claro está, puede mandar a más de uno al paro.
Las aplicaciones son tan amplias como las intenciones del que las maneje:
- Diseñar logotipos, banners, promociones.
- Crear esquemas didácticos, infografías, mapas históricos.
- Prototipar personajes, entornos, interfaces.
- Desarrollar contenido visual para redes o presentaciones.
Y si uno se pone técnico, puede incluso pedirle imágenes con colores específicos mediante códigos hexadecimales, fondos transparentes, proporciones ajustadas, y un largo etcétera. Es decir: esto no es juguete. Es herramienta. Y de las peligrosas.
Claro que no es perfecta. Aún mete la pata. Algunas imágenes verticales salen recortadas, los textos pequeños se le atragantan, y los caracteres no latinos le provocan jaqueca. Tampoco le pidas que edite sólo una esquina sin afectar el resto, porque aún no distingue bien entre bisturí y hacha. Pero todo eso es cuestión de tiempo. Y lo saben.
En cuanto a la ética —esa palabra de moda que todos enarbolan y pocos entienden— OpenAI ha intentado cubrirse las espaldas. Cada imagen generada incluye metadatos que certifican su origen. Hay filtros automáticos contra pornografía, violencia, deepfakes o contenido tóxico. Y se ha relajado la política con figuras públicas adultas: si no hay violación de normas, se permite su uso, incluso para sátira, historia o educación. Y si alguien no quiere salir retratado, puede pedirlo. Civilización, lo llaman.
Lo que me llamó la atención fue lo que dijo Sam Altman, y que nadie en los medios ha citado con la seriedad que merece:
“La gente va a crear cosas asombrosas… y otras que pueden ofender. Queremos que la herramienta no genere contenido ofensivo salvo que se le pida. Dentro de lo razonable, lo hará. Pero escucharemos a la sociedad. Respetar los amplios límites que ésta decida es clave mientras nos acercamos a la inteligencia artificial general.”
Traducido al lenguaje llano: el monstruo ya está suelto, pero por ahora lleva correa. Y si mañana alguien decide quitarle el bozal, que Dios nos pille confesados.
Así que, sí, lo vi en X. Entre tonterías y memes de gatos. Una simple línea que anunciaba un cataclismo. Porque desde ayer, amigo, la máquina no sólo escribe, razona y habla. Ahora también ve… y dibuja. Y, peor aún: entiende lo que está pintando.
Mucho ojito con lo que se pide
Uno va y suelta, tan campante, aquello de “hazme un retrato”, creyendo que la máquina —esa maravilla posmoderna que ya pinta, escribe y hasta se da ínfulas de pensar— le va a devolver una imagen inocente, amable, incluso favorecedora. Pero no, amigo. A veces, en lugar de un retrato, lo que te devuelve es un espejo. Y no de esos que suavizan arrugas ni te dan el perfil bueno. No. Un espejo de los que no mienten. De los que devuelven la mirada y te recuerdan, con toda la impunidad de los píxeles, quién demonios eres.
De momento, yo me he limitado a pedir cuatro versiones de mí mismo. Una especie de galería de horrores simpáticos: estilo Simpson, estilo Muppets, estilo Pixar y estilo Animé. Ya ve usted, cosas de la curiosidad y del sentido del humor, que afortunadamente aún no se me han oxidado. El resultado tiene su gracia, para qué negarlo. Aunque no descarto que la próxima vez la inteligencia artificial me retrate al estilo Goya, y entonces sí que nos vamos a reír todos. Sobre todo ella.