El mecanismo de detección de spam mediante IA de Gmail completa su mayor actualización de defensa en años. Se introduce RETVec para identificar caracteres especiales

Una publicación reciente en el blog de seguridad de Google detalla nuevas actualizaciones de los filtros de spam de Gmail, que Google llama "una de las mayores actualizaciones de defensa de los últimos años". La actualización se presenta en forma de un nuevo sistema de clasificación de texto llamado RETVec (Resilient Efficient Text Vectorizer). Google dice que esto ayuda a comprender la "manipulación de texto contradictorio": correos electrónicos llenos de caracteres especiales, emojis, errores tipográficos y otros caracteres basura que antes eran legibles para los humanos pero que las máquinas no entendían fácilmente. Anteriormente, el spam lleno de caracteres especiales escapaba fácilmente a las defensas de Gmail.

Si desea tener una idea de cómo es el "procesamiento de texto contradictorio", esto es lo que hay en mi carpeta de correo no deseado:

Mi experiencia personal es que en la primera mitad del año, estos correos electrónicos solían ser un gran problema y los veía en mi bandeja de entrada con bastante frecuencia. Sin embargo, esta actualización de la tecnología RETVec parece haber marcado la diferencia, ya que no he recibido ningún correo electrónico de este tipo en los últimos meses.

Correos electrónicos como este son difíciles de clasificar porque cualquier filtro de spam probablemente interceptará un correo electrónico que diga "¡Felicitaciones! El saldo de su cuenta ganadora es de $1000", pero el contenido real del correo electrónico no es ese. La mayoría de las letras aquí son "homófonas": al profundizar en las infinitas profundidades del estándar Unicode, puedes encontrar caracteres oscuros que parecen parte del alfabeto latino normal, pero no lo son.

Por ejemplo, el tema "Check_Your_Account" está extrañamente en negrita, no porque tenga un estilo en negrita, sino porque utiliza un glifo Unicode como "Math Bold Capital C". Es un símbolo matemático que para los humanos se parece a la letra "C", pero los robots de filtrado de spam lo ven con precisión como un símbolo matemático y no entienden su significado en inglés. Cuanto más de cerca miras un correo electrónico como este, peor se pone: el carácter "O" en "FELICIDADES" se reemplaza por un 0, la letra de subrayado en "Jackpot" es tan extraña que ni siquiera se puede encontrar en una búsqueda Unicode, y muchos espacios se reemplazan con puntos o guiones bajos. Como resultado, los filtros de spam se rinden cuando ven estos correos electrónicos desordenados.

Google dice que RETVec está aquí para salvarnos: "RETVec está entrenado para resistir operaciones a nivel de caracteres, incluidas inserciones, eliminaciones, errores tipográficos, homófonos, sustituciones LEET y más. Los modelos de RETVec están entrenados en un codificador de caracteres novedoso que codifica eficientemente todos los caracteres y palabras UTF-8. Como resultado, RETVec no requiere tablas de búsqueda ni vocabularios fijos y se ejecuta en más de 100 idiomas".

La eficiencia es muy importante. Otros métodos que utilizan "vocabulario fijo" o "tablas de búsqueda" homófonas consumen muchos recursos en tiempo de ejecución. Imagínese si uno o más caracteres de "felicitaciones" fueran reemplazados por números, símbolos matemáticos, letras cirílicas, hebreas o emoticones, entonces todas las posibles ortografías y errores ortográficos aparecerían en una lista que es casi interminable. Google dice que RETVec tiene sólo 200.000 parámetros, "no millones", por lo que, si bien la nube de filtrado de spam de Google puede ser lo suficientemente grande como para ejecutar cualquier cosa, es lo suficientemente pequeña como para ejecutarse incluso en dispositivos locales. RETVec es de código abierto y Google espera liberar al mundo de este tipo de ataque homófono en diferentes codificaciones.

RETVec parece funcionar de manera muy similar a cómo leen los humanos: es un modelo de TensorFlow de aprendizaje automático que utiliza "similitud" visual para identificar el significado de las palabras, en lugar del contenido real de los caracteres de las palabras. La demostración de "similitud" de Google utilizó la misma tecnología para identificar imágenes de gatos, por lo que convertirlo en el sistema óptico de reconocimiento de caracteres más avanzado del mundo parece factible.

Claramente, este enfoque ha llevado a grandes mejoras, y Google afirmó que "reemplazar el vectorizador de texto anterior en el clasificador de spam de Gmail con RETVec mejoró nuestra tasa de detección de spam en un 38 % con respecto a la línea de base y redujo los falsos positivos en un 19,4 %. Además, el uso de RETVec redujo el uso de TPU del modelo en un 83 %, lo que convirtió la implementación de RETVec en una de las mayores actualizaciones de defensa de los últimos años".

Google dijo que "ha estado probando RETVec internamente durante el año pasado y lo ha implementado en su cuenta de Gmail".