Altman dijo que la generación de imágenes nativas GPT-4o ahora está disponible en ChatGPT y en el producto de generación de video AI de OpenAI, Sora, disponible para los suscriptores del plan Pro de $ 200 por mes de la compañía. OpenAI dijo que la función pronto se implementará para los usuarios Plus y gratuitos de ChatGPT, así como para los desarrolladores que utilizan los servicios API de la compañía.
GPT-4o con salida de imagen "piensa" más que el modelo de generación de imágenes al que efectivamente reemplaza, DALL-E3, produciendo lo que OpenAI describe como imágenes más precisas y detalladas. GPT-4o puede editar imágenes existentes, incluidas imágenes con personas, transformándolas o "arreglando" detalles como objetos de primer plano y de fondo.
OpenAI no reveló qué datos de imágenes utilizó para implementar la nueva función de generación de imágenes. Muchos proveedores de IA generativa ven los datos de capacitación como una ventaja competitiva y, por lo tanto, guardan secretos sobre ellos y la información que los rodea. Pero los detalles de los datos de capacitación también podrían desencadenar litigios relacionados con la propiedad intelectual, otra razón por la que las empresas se muestran reacias a revelar demasiada información.
OpenAI proporciona un formulario de exclusión voluntaria que permite a los creadores solicitar que sus obras se eliminen de sus conjuntos de datos de entrenamiento. La compañía también dijo que respetaba las solicitudes para prohibir que sus robots de web scraping recopilen datos de entrenamiento, incluidas imágenes, de sitios web.
Las capacidades mejoradas de generación de imágenes de ChatGPT llegan inmediatamente después de la producción de imágenes nativas experimentales de Google para uno de sus modelos emblemáticos, Gemini 2.0 Flash. Esta poderosa característica se está volviendo viral en las redes sociales, y no necesariamente por buenas razones. El componente gráfico de Gemini2.0 Flash tiene pocas protecciones, lo que permite a las personas eliminar marcas de agua y crear imágenes que representan personajes protegidos por derechos de autor.