Recientemente, Google reveló oficialmenteSu modelo insignia de IA, Gemini, está sufriendo ataques de destilación a gran escala impulsados ​​por la comercialización, lo que induce a los chatbots a filtrar mecanismos internos a través de preguntas repetidas.. Google dijo que el atacante envió sistemática y repetidamente palabras clave cuidadosamente diseñadas al modelo (más de 100.000 veces en un solo ataque) en un intento de realizar ingeniería inversa en la lógica de razonamiento interno y el mecanismo de toma de decisiones de Gemini para lograr la clonación del modelo o fortalecer su propio sistema de inteligencia artificial.

Estos ataques son llevados a cabo principalmente por "actores con motivaciones comerciales",Google consideró que las personas detrás de esto eran en su mayoría empresas privadas de inteligencia artificial o instituciones de investigación que esperaban obtener una ventaja competitiva. Un portavoz de la empresa dijo que la fuente del ataque provino de varias regiones del mundo, pero no reveló más información..

Se informa que el ataque de destilación (también conocido como destilación de conocimiento) es originalmente una tecnología de compresión de modelos que logra aligerar el modelo migrando el conocimiento de un "modelo de maestro" grande a un "modelo de estudiante" pequeño.

El atacante recopila las respuestas del modelo en diferentes escenarios a través de preguntas masivas sistemáticas y estructuradas, analiza diferencias sutiles como el contenido de la respuesta, el retraso y la confianza, y construye el límite de decisión y el mapa de ruta de razonamiento de Gemini.Finalmente, los datos de respuesta recopilados se utilizan para entrenar su propio "modelo de estudiante" para replicar las capacidades centrales de Gemini..

Google dijo que tales ataques de destilación son un robo de propiedad intelectual, aunque los principales fabricantes han implementado mecanismos que pueden identificar y bloquear los ataques de destilación.Pero como los principales servicios de modelos grandes están abiertos a todos, siguen siendo inherentemente vulnerables..