OpenAI está implementando más ampliamente su último generador de texto a imagen. El jueves, la compañía pondrá el nuevo modelo DALL-E3 a disposición de ChatGPTPlus y clientes empresariales para su uso en la aplicación ChatGPT. OpenAI dijo que ha preparado una pila de mitigación de seguridad para el modelo, lo que le permitirá ampliar su lanzamiento.
DALL-E3 se lanzó por primera vez el mes pasado y OpenAI mostró cómo mejoró con respecto al DALL-E2 anterior al permitir a los usuarios aprovechar ChatGPT para escribir mensajes más largos y visualmente descriptivos para su uso por parte de generadores de imágenes. DALL-E3 se agregó a Bing Chat y Bing Image Generator, lo que convirtió a la plataforma de Microsoft en la primera en ofrecer un acceso de modelo más amplio al público, incluso antes que ChatGPT.
Las medidas de seguridad anunciadas para reducir las imágenes dañinas no siempre funcionaron, y los usuarios generaron imágenes del World Trade Center que mostraban a Bob Esponja y otros personajes volando aviones hacia los edificios. Aunque Microsoft ha intentado bloquear ciertos mensajes, otras soluciones simples han producido resultados similares.
Los generadores de texto a imagen como Midjourney, StableDiffusion y versiones anteriores de DALL-E han causado controversia. La tecnología ha exportado material de imagen protegido por derechos de autor, desnudez no consensuada, sujetos que cambian de raza y tergiversaciones fotorrealistas de figuras públicas.
OpenAI promete un enfoque más amplio esta vez y ha proporcionado un sitio web que muestra la investigación realizada sobre DALL-E3. La compañía dice que "limitará la probabilidad de que los modelos generen contenido diseñado por artistas vivos e imágenes de figuras públicas, y mejorará la representación demográfica de las imágenes generadas". OpenAI también tiene una herramienta interna de "clasificador de procedencia", que, según dice, tiene una precisión del 99% para detectar si una imagen fue generada por DALL-E3.