Los demandantes en una demanda colectiva que acusaba a OpenAI de violar la privacidad de los datos de entrenamiento abandonaron su caso contra la empresa. El caso fue desestimado sin perjuicio y los demandantes tienen la opción de volver a presentar una demanda, según documentos judiciales.La demanda, presentada por primera vez en el Distrito Norte de California en junio, acusa a las arañas de OpenAI de "violar los derechos de propiedad y privacidad de todos los individuos cuya información personal fue extraída y apropiada indebidamente para su inclusión en productos [de OpenAI]".
La demanda no nombra a los demandantes, quienes se identifican únicamente por sus iniciales. Clarkson Law Firm presentó una demanda colectiva en su nombre.
OpenAI, al igual que otras empresas de IA generativa, extrae datos disponibles públicamente de Internet para ayudar a entrenar grandes modelos de lenguaje.
Se han presentado varias demandas sobre cómo las empresas de IA generativa como OpenAI obtienen y utilizan datos disponibles públicamente para entrenar sus modelos. La mayoría de los casos giran en torno a cuestiones espinosas de derechos de autor más que de privacidad. La comediante Sarah Silverman, los escritores Christopher Golden y Richard Kadrey demandaron a OpenAI y Meta, acusándolos de infracción de derechos de autor al entrenar GPT-4 y Llama2.
En julio, la Comisión Federal de Comercio de EE. UU. inició una investigación sobre el posible daño de OpenAI a los consumidores mediante la recopilación de datos y la publicación de información falsa.
En agosto, OpenAI dijo que los propietarios de sitios web ahora pueden bloquear sus rastreadores web. Algunos sitios web, incluidos editores de noticias como The New York Times, han bloqueado a OpenAI para que no pueda extraer sus datos.