Los investigadores descubren que ChatGPT puede filtrar información confidencial al repetir ciertas palabras

Un equipo de investigadores de Google descubrió que ChatGPT, el chatbot de inteligencia artificial de OpenAI, puede filtrar información confidencial en sus datos de entrenamiento, como información personal de personas reales. Se informa que ChatGPT es una nueva herramienta de chatbot de IA lanzada por OpenAI el 30 de noviembre de 2022. Puede generar rápidamente artículos, historias, letras, prosa, chistes e incluso códigos de acuerdo con los requisitos del usuario, y responder varias preguntas.

Apenas dos meses después de su lanzamiento, ChatGPT alcanzó los 100 millones de usuarios activos mensuales, lo que la convierte en una de las aplicaciones para consumidores de más rápido crecimiento de la historia. En la primera Conferencia de desarrolladores de OpenAI celebrada el 6 de noviembre de este año, el director ejecutivo de OpenAI, Sam Altman, anunció que el número de usuarios activos semanales de ChatGPT ha alcanzado los 100 millones.

Como todos los llamados modelos de lenguaje grande (LLM), los modelos de aprendizaje automático subyacentes que impulsan ChatGPT se entrenan utilizando grandes cantidades de datos extraídos de Internet. Pero lo preocupante es que algunos de los datos de entrenamiento extraídos contenían información de identificación sobre personas reales, incluidos nombres, direcciones de correo electrónico y números de teléfono.

Los investigadores de Google encontraron una manera de hacer que ChatGPT revelara algunos de los datos utilizados para el entrenamiento pidiéndole que repitiera ciertas palabras "para siempre". Los datos incluían información privada (por ejemplo, nombres personales, correos electrónicos, números de teléfono, etc.), fragmentos de trabajos de investigación y artículos de noticias, páginas de Wikipedia y más.

Katherine Lee, investigadora científica senior de Google Brain, dijo: "Descubrimos esta vulnerabilidad en julio y notificamos a OpenAI el 30 de agosto, y después del período de divulgación estándar de 90 días, liberamos la vulnerabilidad. Ahora que lo revelamos a OpenAI, la situación puede ser diferente ahora". Los investigadores dijeron que OpenAI solucionó la vulnerabilidad el 30 de agosto.

Los medios extranjeros dijeron que la vulnerabilidad en ChatGPT descubierta por los investigadores de Google planteó serias preocupaciones sobre la privacidad, especialmente para los modelos entrenados en conjuntos de datos que contienen información confidencial.