A las 9 en punto de esta mañana, DeepSeek continuó cumpliendo con su compromiso de la Semana del Código Abierto y lanzó el código abierto.ProfundoGEMM. Una vez que esta publicación fue enviada, inmediatamente atrajo21.000La cantidad de lectura es suficiente para mostrar su popularidad en el país y en el extranjero. Se entiende que DeepGEMM es un proyecto enfocado a8PMLa biblioteca eficiente de multiplicación general de matrices (GEMM) respalda las necesidades de computación matricial de grupos de expertos (MoE) ordinarios y mixtos, y puede optimizar dinámicamente la asignación de recursos para mejorar la eficiencia de la potencia informática.
Esta biblioteca se basa enCUDAdesarrollar, adoptarMódulo ligero de compilación justo a tiempo (JIT), compila dinámicamente el kernel en tiempo de ejecución sin precompilación ni instalación.
Cabe mencionar que DeepGEMM está diseñado paraModelo DeepSeek-V3/R1Proporciona soporte subyacente simple y eficiente para el entrenamiento y la inferencia, especialmente paraOptimización de GPU de arquitectura Hopper (como H800), teniendo en cuenta el alto rendimiento y el bajo coste.
Como tercer resultado de la Semana del Código Abierto, el lanzamiento de DeepGEMM continúa la estrategia anterior de DeepSeek de modelos y herramientas de código abierto (como FlashMLA), reduciendo aún más el umbral de aplicación de la tecnología informática de alto rendimiento.
Además, este código abierto es el tercer proyecto de la "Semana del Código Abierto" de DeepSeek (del 24 al 28 de febrero), que se lanzó anteriormente.FlashMLA (núcleo de decodificación eficiente) y DeepEP (biblioteca de comunicación paralela experta).