Según las noticias del 17 de diciembre, según Jinyang.com, el 6 de este mes se celebró grandiosamente en Guangzhou la Conferencia de aplicaciones de innovación en supercomputación de 2023 con el tema "Fusión de superinteligencia, la informática comienza un nuevo capítulo". En esta conferencia, el Centro Nacional de Supercomputación de Guangzhou presentó oficialmente la nueva generación del sistema de supercomputación nacional del centro: "Tianhe Xingyi".
Según Lu Yutong, director del Centro Nacional de Supercomputación de Guangzhou, "Tianhe Xingyi" se centra en aplicaciones y se construye utilizando tecnologías clave como arquitectura informática avanzada nacional, procesadores multinúcleo de alto rendimiento, redes de interconexión de alta velocidad y almacenamiento a gran escala.
Ha duplicado la potencia informática general de la CPU, las capacidades de red, las capacidades de almacenamiento y las capacidades de servicio de aplicaciones en comparación con "Tianhe-2", y respalda las necesidades de diversos escenarios de aplicaciones, como computación de alto rendimiento, entrenamiento de modelos grandes de IA y análisis de big data.
Mejorará aún más las capacidades de servicios de aplicaciones multicampo del Centro Nacional de Supercomputación de Guangzhou, proporcionará una sólida potencia informática de alta gama y soporte de plataforma para avances científicos y tecnológicos de vanguardia, construcción de ingeniería estratégica y modernización y transformación industrial en Guangzhou, la provincia de Guangdong y la Gran Área de la Bahía de Guangdong-Hong Kong-Macao, mejorará de manera efectiva la fuerza central de innovación científica y tecnológica de Guangzhou como ciudad central nacional y ciudad de entrada integral, y apoyará el desarrollo de alta calidad de la ciencia, la tecnología, la economía y la sociedad regionales.
Chen Zhiguang, subdirector del Centro Nacional de Supercomputación de Guangzhou, dijo que "Tianhe Xingyi" adopta la tecnología de supercomputación más avanzada. En comparación con el sistema original, la potencia informática general se ha multiplicado por 5. También enfatizó la mejora de las capacidades de las aplicaciones y que hay espacio para un mayor desarrollo del software de aplicaciones.
El objetivo final de Internet de la supercomputación es lograr la creación de redes a nivel nacional, y el siguiente paso es lograr la creación de redes con Shenzhen Supercomputing y Wuxi Supercomputing.
La potencia informática general de Tianhe Xingyi aumentó 5 veces
Según los datos, el "Tianhe-2" está desplegado en el Centro Nacional de Supercomputación de Guangzhou. Utiliza Intel Watt, el rendimiento teórico es 54,9 PFLOPS (549 mil millones de veces) y el rendimiento máximo de Linpack es 33,86 PTFLOPS. Su desempeño no ha cambiado desde junio de 2013 a junio de 2016, y ha sido elegido campeón del TOP500 en seis ocasiones.
Tianhe-2 originalmente tenía un plan de actualización posterior, pero en 2015 el gobierno de Estados Unidos emitió una prohibición que prohibía a empresas como Intel exportar chips informáticos de alto rendimiento a los cuatro centros de supercomputación de China. Como resultado, Tianhe-2, que utiliza tarjetas aceleradoras Intel Xeon Phi, ya no puede utilizar chips de alto rendimiento de empresas estadounidenses.
En septiembre de 2017, el Centro de Supercomputación de Guangzhou anunció que actualizaría el sistema de supercomputación Tianhe-2 para finales de 2017.Utilice el acelerador doméstico Matrix2000 para reemplazar el acelerador IntelXeonPhi original.
Se entiende que la arquitectura de números enteros de Matrix2000 debería ser ARM, pero la unidad vectorial es una unidad vectorial VFU de 256 bits personalizada a nivel nacional.
Cada Matrix2000 consta de 128 núcleos, tiene una frecuencia de 1,2 GHz, puede realizar 16 operaciones de doble precisión por ciclo y tiene un rendimiento máximo de procesador de 2,45 TFLOPS. El Tianhe-2 actualizado se llama Tianhe 2A y su rendimiento máximo ha aumentado de los 54,9 PFLOPS anteriores a aproximadamente 100 PFLOPS.
Según el comunicado oficial, el rendimiento general de "Tianhe Xingyi" es 5 veces mayor que el del sistema original (el "Tianhe 2" actualizado, también conocido como Tianhe 2A) en términos de potencia informática general. En otras palabras, la potencia informática máxima de "Tianhe Xingyi" debería alcanzar aproximadamente 600 pflop/s (5 mil millones de veces por segundo).
Vale la pena señalar que en la "Quinta Conferencia China SC2023 sobre potencia de supercomputación de China", celebrada en Beijing el 10 de noviembre de este año, se publicó el ranking de los 100 mejores rendimientos de computadoras de alto rendimiento de China de 2023, que reveló los parámetros de rendimiento del "procesador heterogéneo de muchos núcleos del sistema host del centro de supercomputación" mejor clasificado instalado en el centro de supercomputación en 2023.
Su número de núcleos de CPU alcanza los 15.974.400 núcleos y su rendimiento máximo alcanza los 620 PFLOPS, superando a Sunway TaihuLight. Obviamente, estos datos son consistentes con la afirmación anterior sobre la potencia informática de "Tianhe Xingyi".
El 12 de agosto de este año, la Universidad Nacional de Tecnología de Defensa anunció el "Anuncio de negociación de fuente única (2023-YKJSJY-F5027) para los servicios de tiempo de máquina de nodo de computación inteligente de supercomputadora de nueva generación Tianhe nacional", que mostró que "está previsto comprar 360.000 horas de nodo de servicios de tiempo de máquina de nodo de computación inteligente de supercomputadora de nueva generación Tianhe nacional para probar y verificar las funciones y el rendimiento del software de cálculo dinámico del campo de viento. La cooperativa propuesta Proveedor: Centro Nacional de Supercomputación de Tianjin."
Las razones para elegir el Centro Nacional de Supercomputación de Tianjin como proveedor único son:
“Debido a que el proyecto necesita probar y verificar el entorno de software de cálculo dinámico del campo de viento en un sistema informático doméstico de alto rendimiento equipado con un procesador MT3000, es necesario comprar 360.000 horas nodo de servicios de tiempo informático del sistema informático nacional de alto rendimiento.
El sistema anfitrión de supercomputación de Tianjin es el sistema Tianhe-1 (TH-1A) y el sistema de nueva generación Tianhe (incluido el sistema de verificación de nivel E). Entre ellos, el sistema de nueva generación de Tianhe tiene nodos informáticos basados en procesadores MT3000, que pueden satisfacer las necesidades del proyecto. Actualmente, sólo Tianjin Supercomputer puede proporcionar un entorno informático nacional de alto rendimiento basado en procesadores MT3000. Por lo tanto, está previsto que esta adquisición se realice a partir de una única fuente. "
En julio de 2018, la agencia de noticias Xinhua informó que el prototipo de clase E "Tianhe-3", una "nueva generación nacional de supercomputadora exaescala desarrollada por el Centro de Supercomputación de Tianjin, ha sido desarrollado e implementado y ha pasado con éxito la aceptación detallada".
El sistema prototipo utiliza tres chips informáticos y de comunicación de alto rendimiento de producción nacional. "Posteriormente, en 2019, otros informes mostraron que" el prototipo de supercomputadora a exaescala 'Tianhe-3' de mi país completó pruebas de aplicaciones paralelas a gran escala para más de 30 unidades y abrió gradualmente los servicios".
Según la información anterior, el rumoreado "Tianhe-3" con potencia informática de nivel E utiliza exactamenteProcesador doméstico MT3000.
Es probable que el "Tianhe Xingyi" lanzado por el Centro de Supercomputación de Guangzhou se base en el procesador MT3000 y, por supuesto, también puede estar basado en el rumoreado Matrix2000+. Actualmente no hay más información sobre el procesador MT3000, pero lo que sí es seguro es que su rendimiento mejorará significativamente respecto a la generación anterior MT2000.
Supercomputadora doméstica de clase E Shenwei Ocean Light
Además, vale la pena mencionar que, en comparación con el sistema de supercomputadora "Sunway TaihuLight" más potente de Tianhe 2A,Utiliza 40.960 procesadores de muchos núcleos "Shenwei 26010" desarrollados de forma independiente en China.
Este procesador de muchos núcleos utiliza un sistema de instrucción Shenwei independiente de 64 bits, con una frecuencia operativa central de 1,45 GHz y un rendimiento máximo de 3,168 billones de operaciones por segundo. Hay 40.960 procesadores de este tipo instalados en Sunway TaihuLight. El rendimiento máximo general puede alcanzar 1250 millones de veces por segundo y el rendimiento sostenido es de 9300 millones de veces por segundo.
La rumoreada nueva generación de supercomputadora Sunway, Sunway Oceanlite (Sunway Oceanlite), utilizará el nuevo procesador Sunway SW26010-Pro, que se espera que brinde un rendimiento más potente.
En la SC23 (Conferencia Internacional sobre Computación, Redes, Almacenamiento y Análisis de Alto Rendimiento, una conferencia de primer nivel en el campo de la arquitectura y la computación de alto rendimiento) celebrada en noviembre de este año, los científicos chinos mostraron al mundo el nuevo procesador Sunway SW26010-Pro, que tiene un rendimiento cuatro veces superior al de la generación anterior. Esta es una serie de productos de procesador en los que mi país adopta su propio conjunto de instrucciones (basado en la expansión Alpha) y tiene derechos de propiedad intelectual completamente independientes.
Según los datos de PPT, SW26010pro es una versión mejorada de SW26010, que consta de 6 módulos centrales y 1 unidad de procesamiento de protocolo (PPU). Cada módulo tiene 1 núcleo para administrar subprocesos de Linux (MPE) y 64 núcleos informáticos, para un total de 384 núcleos. Por el contrario, la generación anterior SW26010 solo tiene 4 grupos de núcleos, lo que indica que el chip único SW26010pro debería tener una mejora de rendimiento del 50%.
La red del procesador SW26010Pro de 64 (8x8) núcleos informáticos es una unidad de procesamiento informático (CPE) con una caché de 256KBL2. Cada CPE tiene cuatro bloques lógicos y puede admitir FP64 y FP32 en un par, y FP16 y BF16 en el otro par.
Hay un controlador de memoria DDR4-3200 y 16 GB de memoria en cada módulo central del SW26010Pro, con un ancho de banda de memoria de 51,4 GB/s, por lo que todo el procesador tiene 96 GB de memoria principal (una mejora significativa en comparación con los 32 GB del SW26010) y un ancho de banda de 307,2 GB/s.
Los seis CPE están conectados a través de una interconexión en anillo y tienen dos interfaces de red que utilizan una interconexión patentada para conectarlos al exterior. El chip SW26010Pro tiene una precisión FP64 o FP32 de 14,03 PB y una precisión BF16 o FP16 de 55,3 PB.
Además, el núcleo MPE del SW26010Pro funciona a 2,1 GHz (el producto de la generación anterior era sólo 1,45 GHz) y el núcleo CPW funciona a 2,25 GHz. Junto con la nueva microarquitectura RISC de 64 bits y las mejoras en la arquitectura del sistema, su rendimiento informático FP64 también ha aumentado más de cuatro veces.
Según los informes, la configuración más grande de Sunway OceanLight tiene más de 100.000 nodos, con un total de más de 41 millones de núcleos distribuidos en unos 105 gabinetes. El rendimiento máximo de media precisión (FP16) supera los 5 exaflop/s, y el rendimiento máximo teórico del FP64 es de 1,5 exaflops, solo superado por la supercomputadora American Frontier.
Según un informe anterior de Thenextplatform, si la escala de Sunway Ocean Light se amplía a 120 gabinetes, el valor máximo bajo FP64pervision alcanzará 1,72 Exaflops.Esto superaría los 1,68 exaflops del superordenador "Frontier" del Laboratorio Nacional Oak Ridge.
Con 160 gabinetes, el rendimiento máximo del FP64 será cercano a 2,3 Exaflops, lo que se espera que supere a la supercomputadora de nueva generación "Aurora" basada en CPU y GPU Intel en el Laboratorio Nacional Argonne del Departamento de Energía de EE. UU., y a la supercomputadora "El Capitan" basada en chips AMDMI300 en el Laboratorio Nacional Lawrence Livermore de EE. UU. en construcción. El rendimiento FP64 de los dos últimos alcanzará más de 2 Exaflops.