ByteDance está expuesto al uso secreto de la tecnología OpenAI y la cuenta suspendida

El 16 de diciembre, hora de Beijing, los medios extranjeros informaron que ByteDance, que se está quedando atrás en la competencia de IA generativa, quiere "tomar atajos". La compañía ha estado utilizando en secreto la tecnología de OpenAI para desarrollar su propio modelo de lenguaje grande, lo que viola los términos de servicio de OpenAI. Actualmente, OpenAI ha suspendido la cuenta de ByteDance.

Los medios extranjeros dijeron que en el campo de la IA, el comportamiento de ByteDance suele considerarse un comportamiento "descortés" y una violación directa de los términos de servicio de OpenAI.Los términos de servicio de OpenAI establecen que los modelos exportados por la empresa no se pueden utilizar "para desarrollar ningún modelo de IA que compita con nuestros productos y servicios". ByteDance compró acceso a OpenAI a través de Microsoft, pero Microsoft también formuló la misma política que OpenAI.

Los documentos internos de ByteDance obtenidos por medios extranjeros confirman que ByteDance se basa en la interfaz de programación de aplicaciones (API) de OpenAI en casi todas las etapas de desarrollo para desarrollar su modelo básico de lenguaje grande denominado "Project Seed", incluidos los modelos de capacitación y evaluación. Los empleados involucrados en Project Seed son muy conscientes de las consecuencias negativas de esta práctica. Según los registros de chat de los empleados de ByteDance en Lark, la versión extranjera de Feishu, una plataforma de comunicación interna, discutieron cómo encubrir evidencia mediante la "desensibilización de datos".Los medios extranjeros dijeron que los empleados de ByteDance utilizaron ampliamente la tecnología de OpenAI, hasta el punto de que los empleados del "Proyecto Seed" a menudo alcanzaron el límite máximo de acceso a la API de OpenAI.

Los documentos internos muestran que ByteDance está utilizando más la tecnología OpenAI en las primeras etapas del "plan semilla". Hace unos meses, la compañía ordenó al equipo que dejara de usar texto generado por GPT "en cualquier etapa del desarrollo del modelo". Por esta época, la empresa recibió la aprobación para lanzar su propio modelo de IA de gran tamaño, "Beanbao", poniendo así en línea el "Proyecto Semilla". Sin embargo, ByteDance continúa usando la API de maneras que violan OpenAI y los términos de servicio de Microsoft, incluida la evaluación del rendimiento de los modelos detrás de Doubao. Una persona con conocimiento de primera mano de los asuntos internos de ByteDance señaló:"Dicen que quieren asegurarse de que todo sea legal, pero en realidad no quieren que los atrapen".

La portavoz de ByteDance, Jodi Seth, respondió que los datos generados por GPT se utilizaron para anotar el modelo en el desarrollo inicial del "Proyecto Semilla" y se eliminaron de los datos de entrenamiento de ByteDance a mediados de este año. "ByteDance ha obtenido permiso de Microsoft para utilizar la API de GPT. Usamos GPT para impulsar productos y funciones en mercados no chinos, pero utilizamos nuestro modelo de desarrollo propio para impulsar Doubao. Doubao sólo está disponible en China", dijo Seth en el comunicado.

El portavoz de OpenAI, Niko Felix, emitió un comunicado confirmando que la cuenta de ByteDance ha sido suspendida."Todos los clientes de API deben cumplir con nuestras políticas de uso para garantizar que nuestra tecnología se utilice para el bien. Aunque ByteDance rara vez usa nuestras API, hemos suspendido sus cuentas durante una investigación adicional. Si descubrimos que su uso no cumple con las políticas de la empresa, les exigiremos que realicen los cambios necesarios o cancelen sus cuentas". dijo Félix.

"Las soluciones de Microsoft AI, como el servicio Azure Open AI, son parte de nuestro marco de acceso limitado, lo que significa que todos los clientes deben solicitar y recibir la aprobación de Microsoft para acceder", dijo el portavoz de Microsoft, Frank Shaw, en un comunicado. "También establecemos estándares y brindamos recursos para ayudar a nuestros clientes a utilizar estas tecnologías de manera responsable y cumplir con nuestros términos de servicio. También contamos con procesos para detectar abusos y detener el acceso cuando las empresas violan nuestro Código de conducta".