vx-underground, un equipo de investigación que afirma tener la colección de código fuente de malware más grande del mundo, publicó recientemente en la plataforma social X que la cantidad total de datos de malware que guarda actualmente es de aproximadamente 30 TB (terabytes). Poco después, Bernardo Quintero, fundador del servicio de escaneo de virus multimotor en línea VirusTotal, dijo en una respuesta que el número total de muestras de malware enviadas a VirusTotal por los usuarios a lo largo de los años ha alcanzado aproximadamente 31 petabytes (petabytes). Según las conversiones comúnmente utilizadas, un petabyte equivale aproximadamente a mil terabytes, lo que significa que la escala de datos de ambos ha superado con creces la imaginación intuitiva de los usuarios comunes.

Las empresas de ciberseguridad, los investigadores de inteligencia artificial y las agencias de inteligencia de amenazas generalmente consideran este tipo de biblioteca de muestras de malware como datos básicos clave para entrenar modelos de detección, estudiar la ruta de evolución de las técnicas de ataque y analizar nuevas amenazas. Sin embargo, cuando estos datos, a menudo medidos en terabytes y petabytes, se resumen en números, a menudo resulta difícil encontrar una referencia en el mundo físico de lo "grandes" que son. Por eso alguien planteó una pregunta bastante gráfica: si todos estos datos se almacenan en un disco duro tradicional y se apilan uno por uno, ¿a qué altura se pueden acumular estos "bancos de malware"? ¿Cómo se compara con los edificios emblemáticos del mundo real?

Un reportero de TechCrunch intentó hacerle esta pregunta a un chatbot de IA en la sala de redacción, pero la respuesta que obtuvo fue "tan escandalosa que era tan increíble" que tuvo que darse por vencido. Entonces, el equipo editorial optó por el método más directo: sacar lápiz y papel y hacer algunos "cálculos aproximados en el dorso de una servilleta" basándose en el sentido común. Teniendo en cuenta que tanto vx-underground como VirusTotal describen su volumen de datos en términos de "aproximadamente TB/PB", el periodista también siguió este enfoque "aproximado".

Para facilitar que los lectores se formen un concepto intuitivo, el periodista supone que se utiliza un disco duro mecánico de escritorio estándar de 1 TB y 3,5 pulgadas; este tipo de disco duro tiene básicamente el mismo tamaño físico para caber en un chasis general, con una altura de aproximadamente 1 pulgada (aproximadamente 2,54 cm). Bajo esta premisa, solo es necesario prestar atención a la dimensión de "altura" para simular el efecto de "levantar el disco duro uno por uno". El artículo también ignora la diferencia entre la capacidad nominal y la capacidad disponible del disco duro en uso real y la calcula directamente en función del 1 TB nominal para simplificar la deducción.

Según los resultados de una herramienta de conversión de unidades de almacenamiento en línea, vx-underground afirma tener alrededor de 30 TB de datos de malware, lo que equivale aproximadamente a la capacidad de 30 discos duros de 1 TB. Si estos 30 discos duros se apilaran de abajo hacia arriba, tendrían aproximadamente 30 pulgadas de alto, o aproximadamente 2,5 pies (menos de 1 metro). El autor del artículo utilizó su propia altura como comparación. En comparación con su altura de 6 pies (aproximadamente 1,83 metros), esa pila de discos duros se parece más a una pequeña caja apilada a sus pies.

Cuando la perspectiva se vuelve hacia VirusTotal, en esta comparación se produce inmediatamente un "salto de magnitud". Convirtiendo el volumen total de 31 PB, se necesitan aproximadamente 31,744 discos duros de 1 TB para acomodarlo completamente. Si se utiliza el mismo método de "apilado verticalmente", la altura teórica de esta "torre de datos" compuesta de discos duros alcanzará aproximadamente 2645 pies (aproximadamente 806 metros). En la lista mundial de edificios superaltos, esta altura ya se acerca a la del Burj Khalifa, el edificio más alto del mundo en Dubai, que mide aproximadamente 2722 pies (aproximadamente 829 metros).

En otras palabras, si la muestra de malware de VirusTotal se ve como una columna hecha enteramente de discos duros, su altura es sólo menos de 80 pies más corta que la del Burj Khalifa, lo que es suficiente para rivalizar con el horizonte de esta "ciudad vertical". El periodista también eligió otra referencia icónica: la Torre Eiffel de París, que mide aproximadamente 330 metros (1.083 pies) de altura. Según una estimación aproximada de este artículo, la cantidad de muestras de malware acumuladas actualmente por VirusTotal equivale aproximadamente a una pila de discos duros de la altura de "dos Torres Eiffel y media".

TechCrunch distribuyó un diagrama esquemático de visualización de información en el informe, organizando múltiples objetos de referencia horizontalmente de mayor a menor según la altura. De izquierda a derecha: el Burj Khalifa de aproximadamente 2722 pies de altura; la "torre de datos" de discos duros VirusTotal de aproximadamente 2.645 pies de altura; el One World Trade Center de aproximadamente 1,792 pies de altura; la Torre Eiffel de aproximadamente 300 metros de altura; el propio reportero de 6 pies de altura; y una pequeña pila de discos duros, de sólo 2,5 pies de altura, que representan los 30 terabytes de datos de vx-underground. A través de esta disposición, los lectores pueden sentir claramente la enorme brecha en el tamaño de los datos entre los diferentes "bancos de malware".

El informe finalmente señala que estas bibliotecas de muestras de malware asombrosamente grandes no sólo son "necesidades" para la investigación de seguridad, sino que también representan de manera invisible la enorme sombra de la situación actual de amenazas a la red. Cuando las empresas de seguridad y los investigadores buscan, etiquetan y modelan estas pilas de datos, en realidad están compitiendo contra "torres invisibles" para descubrir las pistas de la próxima ola de ataques lo antes posible.