Los modelos nacionales grandes se actualizaron con frecuencia durante la última semana. Siguiendo el código abierto de GLM-5.1 y MiniMax 2.7, también está disponible la vista previa del código Kimi K2.6 de Dark Side of the Moon. Es un modelo grande con billones de parámetros especialmente optimizados para la programación de IA. El sitio web oficial afirma que ya está en línea.Sin embargo, para experimentar este modelo grande, necesita el plan de membresía de Kimi, que comienza en 39 yuanes por mes y se puede usar en Kimi Code.

Sin embargo, el modelo grande de vista previa de código K2.6 es relativamente discreto. No hubo mucha publicidad para la beta interna anterior. Sólo cuando se publicó en los últimos dos días vi a alguien mencionarlo. Los funcionarios de Kimi no lo promocionaron con mucha fanfarria. Incluso el sitio web oficial aún no ha visto ninguna actualización específica para este modelo de gran tamaño.

A juzgar por los comentarios internos de la beta y las presentaciones en las que la gente ha participado en Internet, la vista previa del código K2.6 se ha mejorado sobre la base de K 2.5, un modelo grande con billones de parámetros. La principal optimización sigue siendo la programación de IA. La puntuación de la lista SWE-Bench Verified de K 2.5 es del 76,8% y LiveCodeBench es del 85%.

La dirección de mejora de la vista previa del código K2.6 es principalmente la profundidad del razonamiento, la calidad de la planificación del agente y la confiabilidad de las llamadas a herramientas de varios pasos.Algunos evaluadores internos dijeron que la cadena de pensamiento tiene el estilo de Opus (esto es muy profundo).

En cuanto al nivel específico, hay un gran Versun que ha realizado su propia evaluación de la capacidad de programación.La puntuación de la vista previa del código K2.6 es 89, que es 6 puntos más alta que la puntuación de 83 de K 2.5.Sin embargo, todavía existe una brecha entre los mejores jugadores anteriores.

En comparación con otros fabricantes que siempre afirman que alcanzarán o superarán el Opus 4.6 en sus materiales promocionales, algunos internautas en la vista previa del código K2.6 actualmente lo evalúan como el nivel Sonnet 4.6, que también es muy fuerte.

Las críticas dadas por los internautas que lo han usado siguen siendo buenas. La capacidad de seguir instrucciones no es mala y la capacidad también es buena. Ahora, combinado con el paquete Coding Plan de Kimi, al menos proporciona una opción potente y rentable para la programación de IA.