Los editores de Wikipedia adoptan una política de "eliminación rápida" de artículos spam generados por inteligencia artificial

Los editores de Wikipedia acaban de introducir una nueva política para ayudarles a hacer frente a la afluencia de artículos generados por IA que están inundando la enciclopedia en línea. La nueva política brinda a los administradores la capacidad de eliminar rápidamente artículos generados por IA que cumplan con ciertos criterios. Esto no sólo es crucial para Wikipedia, sino que también proporciona a la plataforma un ejemplo importante de cómo lidiar con el creciente caos causado por la inteligencia artificial.

Wikipedia es mantenida por una comunidad global colaborativa de contribuyentes y editores voluntarios, y parte de lo que la convierte en una fuente confiable de información es que esta comunidad pasa mucho tiempo discutiendo, deliberando y debatiendo todo lo que sucede en la plataforma, ya sean modificaciones a artículos individuales o las políticas que rigen esas modificaciones. Es normal eliminar un artículo completo de Wikipedia, pero el proceso de eliminación principal generalmente implica un período de discusión de una semana, durante el cual los usuarios de Wikipedia intentan llegar a un consenso sobre si eliminar el artículo.

Sin embargo, para abordar problemas comunes que claramente violan las políticas de Wikipedia, Wikipedia también tiene un proceso de "eliminación rápida", donde una persona marca un artículo, un administrador verifica si cumple con ciertas condiciones y luego elimina el artículo sin un período de discusión.

Por ejemplo, las entradas que consisten enteramente en galimatías alucinatorios, texto sin sentido o lo que Wikipedia llama "tonterías" pueden marcarse para su eliminación rápida. Lo mismo ocurre con las entradas que son meros anuncios y no tienen valor enciclopédico. Si alguien marca un artículo para su eliminación porque "probablemente no es digno de mención", esa es una evaluación más subjetiva que requiere una discusión completa.

Actualmente, los artículos marcados como generados por IA por los editores de Wikipedia caen en su mayoría en la última categoría porque los editores no están completamente seguros de si fueron generados por IA. Ilyas Lebleu es miembro fundador del Proyecto de limpieza de IA de Wikipedia y editor que contribuyó con lenguaje crítico a la política recientemente adoptada sobre artículos generados por IA y eliminación rápida. Ésta, me dijo, es la razón por la que las propuestas anteriores para regular los artículos generados por IA de Wikipedia han tenido problemas.

"Si bien es fácil saber que algo es generado por IA (por ejemplo, elección de palabras, guiones, listas con viñetas con encabezados en negrita, etc.), las señales a menudo no son tan obvias y no queremos eliminar contenido por error solo porque suena a IA", me dijo LeBrew en un correo electrónico. "En general, el aumento del contenido de IA generado fácilmente ha sido descrito como una 'amenaza existencial' para Wikipedia: dado que nuestros procesos están orientados hacia la discusión (a menudo larga) y la creación de consenso, la capacidad de generar rápidamente grandes cantidades de contenido falso es problemática si no tenemos una manera de eliminarlo rápidamente. Por supuesto, el contenido de IA no es único, y los humanos son perfectamente capaces de escribir contenido malo, pero ciertamente no a la misma velocidad. Nuestras herramientas están diseñadas para una escala completamente diferente".

La solución propuesta por los wikipedistas es permitir la rápida eliminación de artículos claramente generados por inteligencia artificial y que cumplan aproximadamente dos condiciones. Primero, el artículo contiene contenido "diseñado para comunicarse con los usuarios". Esto se refiere al lenguaje del artículo que es claramente un modelo de lenguaje grande (LLM) que responde a las indicaciones del usuario, como "Este es su artículo de Wikipedia sobre...", "A partir de mi última actualización de capacitación..." y "Como un modelo de lenguaje grande". Esto indica claramente que el artículo fue generado por un modelo de lenguaje grande, un enfoque que también hemos utilizado anteriormente para identificar publicaciones en redes sociales y artículos científicos generados por IA.

Lebleu me dijo que han visto estas situaciones "muchas veces" y, lo que es más importante, dijo, indican que los usuarios ni siquiera leyeron los artículos que enviaron.

"Si los usuarios no verifican estas cosas básicas, podemos asumir con seguridad que no verificaron nada de lo que copiaron y pegaron, y es tan inútil como el ruido blanco", dijeron.

Otra condición que hace que los artículos generados por IA se eliminen rápidamente es si sus referencias son obviamente incorrectas, lo cual es otro error que los modelos de lenguajes grandes (LLM) son propensos a cometer. Esto puede incluir la inclusión de enlaces externos a libros, artículos o artículos científicos que no existen y no pueden analizarse, o enlaces a contenido completamente ajeno. La nueva política de Wikipedia da un ejemplo: "Un artículo sobre una especie de escarabajo se cita en un artículo de informática".

Lebleu dijo que la eliminación rápida es una "medida provisional" que aborda los problemas más obvios, y que los problemas de IA persistirán a medida que más y más contenido generado por IA no cumpla con las nuevas condiciones para una eliminación rápida. También señalaron que la IA podría ser una herramienta útil que podría aportar fuerza positiva a Wikipedia en el futuro.

"Sin embargo, la situación actual es muy diferente, y la especulación sobre hacia dónde irá la tecnología en los próximos años puede fácilmente distraernos de la solución de los problemas actuales", dijeron. "Un pilar clave de Wikipedia es que no tenemos reglas fijas, y cualquier decisión que tomemos hoy puede ser revisada dentro de unos años a medida que la tecnología evolucione".

LeBrew dijo que la nueva política finalmente dejará a Wikipedia en una mejor posición que antes, pero no es perfecta.

La buena noticia (además de la rápida eliminación) es que hemos emitido oficialmente una declaración sobre los artículos generados por modelos de lenguaje grandes. Este ha sido un punto de discordia en la comunidad: si bien la gran mayoría se opone al contenido de IA, exactamente cómo abordarlo ha sido un punto de discordia, y los primeros intentos de desarrollar una política amplia fracasaron. Aquí, basándonos en avances previos en imágenes de IA, borradores y comentarios de discusión, discutimos un estándar más específico, pero que establece explícitamente que el contenido de modelos de lenguaje grande no moderado es espiritualmente incompatible con Wikipedia.

Artículos relacionados:

Wikipedia suspende el piloto de resumen de IA después de la protesta de los editores