JetBrains anunció recientemente que Mellum2, su modelo de aprendizaje automático de próxima generación para sistemas de ingeniería de software, ha sido oficialmente de código abierto. Esto es poco más de un año después de que la compañía abriera su primer modelo Mellum en 2025. En ese momento, Mellum era un modelo pequeño centrado en la finalización de código, con un tamaño de parámetro de aproximadamente 4 mil millones. En comparación, el número total de parámetros de Mellum2 se ha ampliado a 12 mil millones.Sin embargo, JetBrains enfatiza que al adoptar una arquitectura dispersa de Mezcla de Expertos (MoE), cada token en realidad participa en el cálculo de solo alrededor de 2,5 mil millones de parámetros activos, por lo que aún puede mantener una velocidad de inferencia rápida en hardware estándar.

A diferencia de Mellum "enfocado", que solo realiza tareas de finalización de código en el editor, Mellum2 se posiciona como un asistente de codificación inteligente completo. Puede generar y editar código, llamar a herramientas externas, ejecutar flujos de trabajo "Agentic" de varios pasos, admitir largas conversaciones y tener capacidades de razonamiento explícito. Los desarrolladores pueden utilizar sus modelos básicos, ajustados por directivas y "Think Edition" bajo la licencia Apache 2.0 para mantener un control total sobre sus datos al crear productos o herramientas internas.
En términos de especificaciones, Mellum2 tiene cambios significativos en múltiples indicadores clave en comparación con el Mellum de primera generación: el Mellum original utilizó un diseño de parámetros densos, mientras que Mellum2 cambió a una arquitectura MoE; el número total de parámetros aumentó de 4 mil millones a 12 mil millones, pero los parámetros activos cayeron de 4 mil millones a 2,5 mil millones; la ventana de contexto aumentó significativamente de 8192 tokens a 131072 tokens, lo que la hace más adecuada para procesar documentos largos y escenarios de ingeniería complejos; Ambas generaciones de modelos utilizan la licencia de código abierto Apache 2.0.
JetBrains dijo que Mellum2 es particularmente adecuado para enrutar y orquestar cargas de trabajo complejas de IA, construir canales de generación aumentada de recuperación (RAG) de baja latencia, brindar soporte de inferencia rápida para subagentes en sistemas grandes e implementar IA en entornos locales o privados. Para mejorar aún más el rendimiento del modelo en campos profesionales como el código y las matemáticas, el equipo adoptó un "curso" de datos de tres etapas en la etapa previa al entrenamiento, migrando gradualmente de diversos datos web a códigos y contenidos matemáticos más cuidadosamente seleccionados.
Además de Mellum2, JetBrains también anunció un ajuste en su línea de productos: la compañía dejará de mantener DataSpell, su IDE de ciencia de datos para desarrolladores de Python. Según información oficial, DataSpell se "retiró" oficialmente el 28 de mayo y las funciones relacionadas con la ciencia de datos se integrarán en la versión profesional de PyCharm. Las suscripciones activas existentes a DataSpell se convertirán automáticamente a PyCharm Pro el 1 de septiembre de 2026.