OpenAI ha lanzado la tercera versión de su plataforma de artes visuales de inteligencia artificial generativa DALL-E, que ahora permite a los usuarios crear mensajes utilizando ChatGPT e incluye más opciones de seguridad. DALL-E convierte mensajes de texto en imágenes. Pero incluso el DALL-E2 comete errores, y a menudo pasa por alto una redacción específica. Los investigadores de OpenAI dicen que la última versión comprende mejor el contexto.
Una nueva característica de DALL-E3 es la integración con ChatGPT. Al utilizar ChatGPT, los usuarios no tienen que escribir indicaciones detalladas para guiar a DALL-E3; simplemente le piden a ChatGPT que presente un mensaje y el chatbot escribe un párrafo (DALL-E es mejor usando oraciones más largas) para que DALL-E3 lo siga. Otros usuarios también pueden utilizar sus propios consejos si tienen ideas especiales para DALL-E.
DALL-E se lanzó por primera vez en enero de 2021, por delante de StabilityAI y otras plataformas de arte de inteligencia artificial generativa de conversión de texto a imagen de Midjourney. Para cuando DALL-E2 se lance en 2022, OpenAI ha abierto una lista de espera para controlar quién puede usar la plataforma en medio de críticas de que DALL-E puede generar imágenes realistas y explícitas y mostrar sesgos en las fotos que genera. El pasado mes de septiembre, la empresa eliminó la lista de espera y abrió al público el DALL-E2.
La nueva versión de DALL-E se lanzará primero para los usuarios de ChatGPTPlus y ChatGPTEnterprise en octubre, seguida de los laboratorios de investigación y sus servicios API en el otoño. OpenAI planea escalonar el lanzamiento de DALL-E3, pero no se ha comprometido a cuándo se lanzará una versión pública gratuita.
OpenAI afirma que ha realizado un trabajo extenso en DALL-E3, enfocándose en crear fuertes medidas de seguridad para evitar la creación de imágenes obscenas o potencialmente odiosas. OpenAI dice que trabaja con redteamers externos (un grupo que intenta intencionalmente comprometer un sistema para probar su seguridad) y se basa en clasificadores de entrada, un método que enseña a los modelos de lenguaje a ignorar ciertas palabras para evitar indicaciones explícitas o de fuerza bruta. El DALL-E3 tampoco puede reproducir la imagen de una figura pública, siempre que el nombre se mencione explícitamente en el mensaje.
Sandhini Agarwal, investigadora de políticas de la empresa, dijo que tenía "mucha confianza" en las medidas de seguridad de la empresa, pero aclaró que el modelo mejora constantemente y no es perfecto. Un representante de OpenAI dijo en un correo electrónico que DALL-E3 ha sido entrenado para no generar imágenes al estilo de artistas vivos. A diferencia de DALL-E2, DALL-E2 puede imitar el estilo artístico de ciertos artistas cuando se le solicita.
Posiblemente para evitar posibles demandas, OpenAI también permitirá a los artistas optar por excluir sus obras de arte de futuras versiones del modelo de IA de texto a imagen. Los creadores pueden enviar imágenes cuyos derechos de autor poseen y solicitar su eliminación completando un formulario en el sitio. De esta manera, futuras versiones de DALL-E pueden bloquear resultados que se asemejen a la imagen y el estilo del artista. Los artistas demandaron a los competidores de DALL-E, StabilityAI y Midjourney, así como al sitio web de arte DeviantArt, acusándolos de utilizar sus obras protegidas por derechos de autor para entrenar modelos de texto e imagen.