Inicio TIC Inteligencia Artificial Cuando la máquina empezó a pintar sola

Cuando la máquina empezó a pintar sola

Lo vi ayer, casi por accidente, mientras buceaba entre idioteces en X —el antiguo Twitter, ese vertedero de ocurrencias, egos desatados y noticias que a veces importan. Y entre memes y profetas de saldo, ahí estaba Sam Altman, anunciando en voz baja que ChatGPT acababa de dar un salto que, si uno sabe leer entre líneas, significa que la bestia ya no sólo habla: ahora también pinta. Y con muy mala leche, si se lo pides.

0

La cosa no parecía gran cosa, al principio. Otra actualización más. Otro post técnico disfrazado de marketing. Pero no. Esto era otra cosa. ChatGPT, ese cuervo parlante que ya nos escribe artículos, guiones, diagnósticos y hasta poesías ñoñas si uno se descuida, ha cruzado una nueva frontera: ya genera imágenes sin necesidad de apoyarse en el viejo DALL·E 3.

Y eso, lector, no es una simple mejora. Es una revolución. Sorda, silenciosa… y definitiva.

Hasta ayer, si uno quería que ChatGPT generara imágenes, lo hacía por intermediación. Una especie de recadero entre tú y el modelo gráfico DALL·E, que construía las imágenes como un escultor ciego: quitando el ruido, afilando el contorno. Ahora no. Ahora ChatGPT lo hace por sí mismo. Gracias al modelo GPT-4o —el “omnimodal”, como les gusta decir a estos nuevos alquimistas— la máquina es capaz de procesar y generar texto, imagen, voz y vídeo, todo a la vez, todo junto, todo entendido. Y lo mejor: está ya disponible para casi todos los usuarios, desde el plan gratuito hasta los de pago, y llegará pronto vía API para los desarrolladores que no temen al fuego.

Ahora si puedes crear un cómic. Esto lo creo sin darle poco más que dos instrucciones. Puedes ajustar definiendo cada viñeta y el texto que le corresponde. De locos.

¿Y qué tiene este GPT-4o que lo hace diferente? Pues que ya no pinta al azar ni por eliminación. Ahora crea como el hombre del Renacimiento: de izquierda a derecha, de arriba abajo, como escribiendo con el pincel, en un proceso autorregresivo que le permite mantener coherencia, precisión y —milagro de los milagros— escribir texto legible en las imágenes. Ya no más letreros deformes, ya no más palabras que parecen escritas por un monje borracho. Ahora puedes pedirle una invitación de boda, un cartel, una infografía… y te la hace como Dios manda.

Y no solo eso. El condenado modelo entiende el contexto. Recuerda lo que le dijiste cinco mensajes atrás. Genera personajes y los mantiene coherentes en cada iteración. Le comenté que creara una imagen de portada de un cómic y luego que me diera una página interior y, ahí está. Además conserva estilos, modifica a petición, se adapta como un buen dibujante bajo contrato. Si le pides que te pinte un caballero medieval y luego le dices que lo convierta en astronauta sin cambiarle la cara, lo hace. Y sin pestañear.

¿Te parece poco? Pues escucha: maneja hasta veinte objetos distintos en una misma escena con atributos complejos —colores, formas, posiciones— sin confundirse. Algo que, hasta hace poco, era un dolor de cabeza para la IA. Puede pasar de bocetos rápidos a hiperrealismo, de caricatura a fotografía. Y hasta transforma imágenes que tú subes para adaptarlas a otros estilos. Es un camaleón con pinceles digitales.

Esto, además de asombrar, sirve. Y mucho. Diseñadores gráficos, profesores, desarrolladores de videojuegos, publicistas… todos tienen ahora una herramienta que, bien usada, puede ahorrarles horas de trabajo. Y mal usada, claro está, puede mandar a más de uno al paro.

Las aplicaciones son tan amplias como las intenciones del que las maneje:

  • Diseñar logotipos, banners, promociones.
  • Crear esquemas didácticos, infografías, mapas históricos.
  • Prototipar personajes, entornos, interfaces.
  • Desarrollar contenido visual para redes o presentaciones.

Y si uno se pone técnico, puede incluso pedirle imágenes con colores específicos mediante códigos hexadecimales, fondos transparentes, proporciones ajustadas, y un largo etcétera. Es decir: esto no es juguete. Es herramienta. Y de las peligrosas.

Claro que no es perfecta. Aún mete la pata. Algunas imágenes verticales salen recortadas, los textos pequeños se le atragantan, y los caracteres no latinos le provocan jaqueca. Tampoco le pidas que edite sólo una esquina sin afectar el resto, porque aún no distingue bien entre bisturí y hacha. Pero todo eso es cuestión de tiempo. Y lo saben.

En cuanto a la ética —esa palabra de moda que todos enarbolan y pocos entienden— OpenAI ha intentado cubrirse las espaldas. Cada imagen generada incluye metadatos que certifican su origen. Hay filtros automáticos contra pornografía, violencia, deepfakes o contenido tóxico. Y se ha relajado la política con figuras públicas adultas: si no hay violación de normas, se permite su uso, incluso para sátira, historia o educación. Y si alguien no quiere salir retratado, puede pedirlo. Civilización, lo llaman.

Lo que me llamó la atención fue lo que dijo Sam Altman, y que nadie en los medios ha citado con la seriedad que merece:
“La gente va a crear cosas asombrosas… y otras que pueden ofender. Queremos que la herramienta no genere contenido ofensivo salvo que se le pida. Dentro de lo razonable, lo hará. Pero escucharemos a la sociedad. Respetar los amplios límites que ésta decida es clave mientras nos acercamos a la inteligencia artificial general.”

Traducido al lenguaje llano: el monstruo ya está suelto, pero por ahora lleva correa. Y si mañana alguien decide quitarle el bozal, que Dios nos pille confesados.

Así que, sí, lo vi en X. Entre tonterías y memes de gatos. Una simple línea que anunciaba un cataclismo. Porque desde ayer, amigo, la máquina no sólo escribe, razona y habla. Ahora también ve… y dibuja. Y, peor aún: entiende lo que está pintando.

Mucho ojito con lo que se pide

Uno va y suelta, tan campante, aquello de “hazme un retrato”, creyendo que la máquina —esa maravilla posmoderna que ya pinta, escribe y hasta se da ínfulas de pensar— le va a devolver una imagen inocente, amable, incluso favorecedora. Pero no, amigo. A veces, en lugar de un retrato, lo que te devuelve es un espejo. Y no de esos que suavizan arrugas ni te dan el perfil bueno. No. Un espejo de los que no mienten. De los que devuelven la mirada y te recuerdan, con toda la impunidad de los píxeles, quién demonios eres.

De momento, yo me he limitado a pedir cuatro versiones de mí mismo. Una especie de galería de horrores simpáticos: estilo Simpson, estilo Muppets, estilo Pixar y estilo Animé. Ya ve usted, cosas de la curiosidad y del sentido del humor, que afortunadamente aún no se me han oxidado. El resultado tiene su gracia, para qué negarlo. Aunque no descarto que la próxima vez la inteligencia artificial me retrate al estilo Goya, y entonces sí que nos vamos a reír todos. Sobre todo ella.

Artículo anteriorLa hora del hombre fuerte
Artículo siguienteKit europeo de miedo y obediencia
Con más de tres décadas dedicadas a integrar la geología con las tecnologías digitales, he desempeñado múltiples funciones en el Ilustre Colegio Oficial de Geólogos (ICOG) desde 1990. Mi trayectoria incluye roles como jefe de administración, responsable de marketing y calidad, community manager y delegado de protección de datos. He liderado publicaciones como El Geólogo y El Geólogo Electrónico, y he gestionado proyectos digitales innovadores, como la implementación del visado electrónico, la creación de sitios web para el ICOG, la ONG Geólogos del Mundo y la Red Española de Planetología y Astrobiología, ente otros. También fui coordinación del GEA-CD (1996-1998), una recopilación y difusión de software en CD-ROM para docentes y profesionales de las ciencias de la Tierra y el medio ambiente. Además de mi labor en el ICOG, he participado como ponente en eventos organizados por Unión Profesional y la Unión Interprofesional de la Comunidad de Madrid, abordando temas como la calidad en el ámbito colegial o la digitalización en el sector. También he impartido charlas sobre búsqueda de empleo y el uso de redes sociales en instituciones como la Universidad Complutense o el Colegio de Caminos de Madrid. En 2003, inicié el Blog de epampliega, que en 2008 evolucionó a Un Mundo Complejo. Este espacio personal se ha consolidado como una plataforma donde exploro una amplia gama de temas, incluyendo geología, economía, redes sociales, innovación y geopolítica. Mi compromiso con la comunidad geológica fue reconocido en 2023, cuando la Asamblea General del ICOG me distinguió como Geólogo de Honor. En 2025 comienzo una colaboración mensual con una tribuna de actualidad en la revista OP Machinery.

SIN COMENTARIOS

DEJA UNA RESPUESTA

Por favor ingrese su comentario!
Por favor ingrese su nombre aquí

Salir de la versión móvil
Política de privacidad

Esta web utiliza cookies para que podamos ofrecerte la mejor experiencia de usuario posible. La información de las cookies se almacena en tu navegador y realiza funciones tales como reconocerte cuando vuelves a nuestra web o ayudar a nuestro equipo a comprender qué secciones de la web encuentras más interesantes y útiles.

Cookies estrictamente necesarias

Las cookies estrictamente necesarias tiene que activarse siempre para que podamos guardar tus preferencias de ajustes de cookies.

Básicamente la web no funcionará bien si no las activas.

Estas cookies son:

- Comprobación de inicio de sesión.

- Cookies de seguridad.

Si desactivas esta cookie no podremos guardar tus preferencias. Esto significa que cada vez que visites esta web tendrás que activar o desactivar las cookies de nuevo.

Cookies de terceros

Esta web utiliza Google Analytics para recopilar información anónima tal como el número de visitantes del sitio, o las páginas más populares.

Dejar esta cookie activa nos permite mejorar nuestra web.

¡Por favor, activa primero las cookies estrictamente necesarias para que podamos guardar tus preferencias!