El 27 de junio, Tencent lanzó públicamente un nuevo miembro de la familia de modelos Hunyuan: el modelo Hunyuan-A13B, y anunció que será completamente de código abierto. Según fuentes oficiales, el modelo Hunyuan-A13B se puede implementar en condiciones extremas con una sola tarjeta GPU de gama media a baja.

En el experimento de razonamiento matemático, el modelo completó con precisión comparaciones decimales y demostró capacidades de análisis paso a paso. Me tomó 3 segundos pensar profundamente.
El modelo Hunyuan-A13B también introdujo innovaciones tecnológicas. En el entrenamiento previo, el modelo utilizó un corpus de palabras de red de alta calidad de 20 billones y mejoró el sistema teórico de la Ley de Escala de la arquitectura MoE, proporcionando una guía de ingeniería cuantificable para el diseño de la arquitectura MoE.
Hunyuan también ha abierto dos nuevos conjuntos de datos para llenar los vacíos en los estándares de evaluación relevantes en la industria. Entre ellos, ArtifactsBench se utiliza principalmente para la evaluación de código y crea un nuevo punto de referencia que contiene 1825 tareas; C3-Bench diseña 1024 datos de prueba para la evaluación del modelo de escena del agente para descubrir deficiencias en las capacidades del modelo.

Actualmente, la API del modelo está en línea en el sitio web oficial de Tencent Cloud.