Exclusivo
Buena Vida

El nuevo generador de imágenes en GPT-4o permite crear contenido sin necesidad de herramientas externas./EDICIÓN EXTRA

GPT-4o incorpora creación de imágenes en ChatGPT: así funciona la nueva herramienta

OpenAI introduce la generación de imágenes en ChatGPT con su modelo GPT-4o, eliminando la dependencia de DALL-E 3

Sam Altman, CEO de OpenAI, anunció que los usuarios de ChatGPT que empleen GPT-4o podrán generar imágenes sin necesidad de utilizar modelos externos como DALL-E 3. Según OpenAI, esta mejora permite generar contenido más útil y ajustado a las necesidades del usuario.

La compañía ha destacado que, a diferencia de otros modelos de IA que producen imágenes llamativas pero imprecisas en algunos detalles, el nuevo generador de imágenes de GPT-4o ha sido desarrollado para mejorar la precisión en la representación de elementos cotidianos y simbólicos. 

El anuncio fue realizado por Sam Altman, a través de su cuenta en X (antes Twitter) y posteriormente detallado en la cuenta oficial de la compañía. Altman resaltó la capacidad creativa del nuevo sistema, señalando que permitirá la generación de contenido variado.

Características y disponibilidad de la herramienta

El nuevo generador de imágenes está disponible para todos los usuarios de ChatGPT en los planes Free, Plus, Pro y Team, así como en la plataforma de video Sora. Próximamente, OpenAI habilitará esta función para los usuarios de Enterprise y Edu, además de integrarla en su API para desarrolladores.

Este avance permite que ChatGPT no solo genere imágenes desde cero, sino que también edite imágenes cargadas por el usuario o cree nuevas versiones basadas en referencias visuales. Entre sus principales ventajas, OpenAI destaca su capacidad para representar texto de manera precisa dentro de las imágenes, lo que facilita la creación de infografías, carteles y otros recursos gráficos.

(Te recomendamos leer: ChatGPT-4.5 ya está aquí: Novedades, mejoras y cómo acceder al nuevo modelo de OpenAI)

El modelo GPT-4o ha sido entrenado con una distribución conjunta de imágenes y texto, lo que le permite comprender mejor la relación entre estos elementos. Además, introduce la posibilidad de generar imágenes con fondo transparente y aplicar estilos visuales coherentes en distintos formatos.

Limitaciones y mejoras en desarrollo

A pesar de sus avances, OpenAI reconoce que el modelo aún presenta algunas limitaciones. Puede generar imágenes con recortes no deseados en formatos verticales largos, mostrar dificultades al representar más de 20 objetos con precisión o tener problemas con caracteres latinos en textos insertados, aunque mencionaron las mejoras en el futuro.

La función de generación de imágenes de GPT-4o ofrece mayor precisión en la representación de texto dentro de gráficos./PIXABAY

Además, en cuanto a seguridad, OpenAI refuerza las restricciones para evitar el uso inapropiado del sistema, limitando la generación de contenido que incluya violencia explícita, desnudez o representaciones no consentidas.

Con esta actualización, la compañía busca consolidar ChatGPT como una herramienta completa para la generación de contenido audiovisual, facilitando la producción de imágenes de alta calidad para diversos usos, desde redes sociales hasta entornos educativos y corporativos.

¿Quieres acceder a todo el contenido de calidad sin límites? ¡SUSCRÍBETE AQUÍ!