Según las últimas noticias de un importante fabricante, Meituan ha emitido un aviso interno para restringir el uso de modelos de puf grandes. El aviso muestra que todos los equipos comerciales deben completar un autoexamen de los negocios existentes relacionados con los pufs y planear migrar a modelos como LongCat y DeepSeek. Si no pueden migrar del modelo grande del volcán (doubao), deben presentar un motivo + explicación de necesidad y pasar por un proceso de aprobación por separado.

Se entiende que esta no es la primera vez que Meituan endurece el umbral para el uso de modelos grandes externos. En abril de este año, Meituan hizo ajustes en el uso de modelos internos grandes y ya no recomienda que las empresas utilicen el modelo Qwen proporcionado por Alibaba Cloud. Si la empresa aún necesita usarlo, se deben enviar e informar los motivos detallados del uso al nivel X3 (nivel de jefe) para su aprobación.

La información pública muestra que LongCat es un modelo de lenguaje grande desarrollado independientemente por Meituan. La investigación y el desarrollo se iniciaron en 2023. Ha sido de código abierto y se ha utilizado profundamente en múltiples escenarios comerciales dentro de Meituan, incluido el asistente de inteligencia artificial integrado "Xiaotuan" de la aplicación, el asistente de operaciones comerciales, etc.

Recientemente, Meituan lanzó una nueva generación de modelo grande LongCat-2.0 de billones de parámetros, que será de código abierto. Como modelo de un billón de parámetros que completa el entrenamiento y la inferencia de todo el proceso en un clúster informático doméstico de 50.000 ka (parámetros totales 1,6 T, activación promedio de aproximadamente 48 B, rango dinámico 33 B ~ 56 B), la escala de datos de preentrenamiento de LongCat-2.0 supera los 30 T tokens, cubriendo múltiples tipos de datos como chino, inglés, multilenguaje y código, y admite de forma nativa un contexto ultralargo de 1 millón.