OpenAI lanzó hoy su nuevo modelo no inferencial, GPT-4.5, que es el modelo más grande y con mayor conocimiento hasta la fecha. Como sugiere el nombre, GPT-4.5 se basa en GPT-4o y se expande aún más durante el proceso de capacitación previa. OpenAI ha confirmado que GPT-4.5 no es un modelo de vanguardia, pero es su LLM más grande y tiene más conocimiento del mundo, mejores habilidades de escritura y una personalidad más refinada que GPT-4o.

Los datos de las pruebas comparativas muestran que GPT-4.5 no es una mejora significativa con respecto a GPT-4o. En la prueba comparativa SWE-benchVerified, GPT-4.5 alcanzó el 38%, que es entre un 2% y un 7% más que GPT-4o y un 30% menos que el modelo de investigación profunda basado en O3 de OpenAI. En comparación, Claude3.7Sonnet de Anthropic logró un rendimiento equivalente al 62,3% en SWE-benchVerified.

Recientemente, el equipo de preparación de OpenAI desarrolló un nuevo punto de referencia llamado SWE-Lancer para evaluar el rendimiento de LLM en tareas prácticas de ingeniería de software, incluido el desarrollo de funciones, el diseño, la corrección de errores, etc. En este nuevo punto de referencia, el modelo GPT-4.5 pudo resolver el 20 % de las tareas de ICSWE y el 44 % de las tareas de SWEManager, una ligera mejora con respecto al modelo o1 de OpenAI. 

Puedes leer los detalles del nuevo modelo aquí:

https://openai.com/index/introduciendo-gpt-4-5/

En el frente de seguridad, el Grupo Asesor de Seguridad de OpenAI clasificó el nuevo modelo GPT-4.5 como un riesgo medio general según los resultados de la evaluación de preparación. También obtuvo una puntuación más baja en ciberseguridad y autonomía del modelo.

La vista previa de la investigación del nuevo modelo GPT-4.5 ahora está disponible para los usuarios de ChatGPTPro y para los desarrolladores en todos los planes pagos a través de la API. La próxima semana, los usuarios de ChatGPTPlus también obtendrán la función.