El último modelo GPT Image 2 de OpenAI,Tuvo un desempeño sorprendente en la evaluación autorizada de Wenshengtu, superando con éxito a Google Nano Banana2 y ocupando el primer lugar en el mundo.Este modelo se lanzó oficialmente el 21 de abril. Después de muchos meses de actualizaciones iterativas, la calidad de la imagen, la comprensión y las capacidades de restauración de detalles han mejorado enormemente.

Los datos de evaluación de SuperCLUE muestran que,GPT Image 2 ha alcanzado la cima en muchas dimensiones centrales, como la generación de caracteres chinos, la reproducción de la realidad y la calidad de imagen, y su rendimiento es muy impresionante.
Su capacidad de generación de caracteres chinos alcanza los 93,07 puntos, con precisión de texto completo. Ya sea que se trate de letras de sello sobre porcelana azul y blanca o fuentes doradas sobre material acrílico, se pueden integrar perfectamente sin sensación de suspensión, resolviendo por completo el problema de los caracteres chinos confusos generados por modelos extranjeros.

Generación de caracteres chinos: ajuste de imagen y texto

Generación de caracteres chinos: ajuste de imagen y texto
En términos de restauración de escenas, el modelo puede reproducir con precisión escenas complejas como panaderías antiguas y herreros del patrimonio cultural inmaterial, con detalles realistas y naturales. Al mismo tiempo, tiene una buena comprensión de palabras largas y requisitos de razonamiento lógico, y puede generar con precisión imágenes profesionales, como diagramas esquemáticos científicos y diseños de carteles, y tiene un alto grado de cumplimiento de las instrucciones.

Reproducción de escena física
En comparación con el producto de la generación anterior, GPT Image 2 ha mejorado significativamente la consistencia de la imagen y el texto y la generación de caracteres chinos, superando al modelo de la generación anterior en todos los aspectos. En comparación con productos competidores como Google y Baidu, también ha logrado liderazgo en múltiples dimensiones, especialmente en razonamiento creativo y reproducción de la realidad.
En la actualidad, el modelo aún necesita optimizarse en aspectos como la comprensión de las relaciones espaciales y el razonamiento del conocimiento, pero el modelo general ha alcanzado el nivel más alto en la industria, lo que marca una nueva etapa en la tecnología de gráficos vicencianos.

Comparación de puntuaciones de dimensión de primer nivel de modelos de cabeza nacionales y extranjeros