Preguntas como caminar para lavar un auto y daltonismo rojo y verde fueron respondidas incorrectamente. Los internautas se quejaron de que la IA de programación más poderosa ha reducido drásticamente la inteligencia

Aunque Mythos, lanzado por Anthropic hace unos días, ha establecido un nuevo récord para el modelo grande de IA más potente, no está abierto para su uso. El modelo grande de programación de IA más potente actual es Claude Opus 4.6, que también es el más caro actualmente. Sin embargo, el reciente problema con la inteligencia de Claude ha provocado el descontento entre un gran número de desarrolladores que pagaron precios elevados.Anteriormente, incluso los ejecutivos del departamento de inteligencia artificial de AMD dijeron que el problema de la reducción de la inteligencia ha afectado el desarrollo y que el alcance del impacto es bastante grande.

En la comunidad nacional de Linux.do, muchos internautas también hablaron sobre el problema de la reducción de inteligencia de Opus 4.6 y también lo verificaron con dos conocidas preguntas de prueba de modelos grandes de IA.

Una de estas dos preguntas es si conducir o caminar hasta el túnel de lavado a una distancia de 50 metros. El otro trata sobre la crisis del padre debido al daltonismo de su hija.En esencia, todas son trampas lógicas, pero pueden poner a prueba la capacidad de la IA.

Muchas IA nacionales y extranjeras se han volcado antes en el problema del lavado de automóviles. El modelo grande de Claude es uno de los pocos modelos grandes que puede responder la pregunta correctamente, con ventajas obvias en cuanto al coeficiente intelectual.

Sin embargo, según las mediciones reales actuales, incluso el modelo grande Opus 4.6 más potente ha comenzado a responder estas dos preguntas incorrectamente y ha perdido su anterior capacidad de alto coeficiente intelectual.

Algunos internautas también publicaron fotografías de sus propias pruebas, diciendo que podían responder correctamente, por lo que esta pregunta no es completamente unilateral.

A juzgar por las quejas anteriores de AMD, está claro que la inteligencia de Cluade se ha reducido recientemente, pero es difícil decir el motivo de la reducción. Los ejecutivos de Anthropic no admitieron que hubiera un problema antes.

Una suposición más razonable es que está relacionado con la potencia informática. La pregunta de Musk hace unos días reveló inadvertidamente que el Sonnet 4.6 de Claude es un modelo grande con 1 billón de parámetros.Opus 4.6 tiene 5 billones de parámetros.Y no es del tipo MoE. El modelo denso requiere una potencia informática muy alta y es costoso, por lo que el precio de carga también es el más caro.

Las empresas de IA actuales siguen perdiendo dinero vendiendo suscripciones, lo que también puede explicar en parte la motivación de Anthropic para prohibir aplicaciones con un consumo de tokens extremadamente alto como Crayfish.

Para los desarrolladores nacionales, existe otra razón para reducir la inteligencia.Es decir, Anthropic apuntará a inteligencia basada en IP.Básicamente, también se trata de asignar potencia informática, pero no son los únicos que lo hacen en forma de IP/país objetivo. También se ha descubierto que otras empresas estadounidenses, como OpenAI, han utilizado este método para restringir a los desarrolladores y usuarios nacionales.