El 9 de abril, ByteDance lanzó Seeduplex, un modelo de voz nativo full-duplex a gran escala, que ahora se lanzó por completo en la aplicación Doubao. Este modelo se basa en un nuevo diseño de marco de "escuchar y hablar al mismo tiempo". En comparación con el modelo de voz de extremo a extremo semidúplex de la generación anterior, logra una interacción en tiempo real de escuchar y hablar simultáneamente y mejora el ritmo de la conversación, la naturalidad y la capacidad antiinterferencias.

Según la introducción oficial, Seeduplex ha superado desafíos de ingeniería como el retraso y la estabilidad en condiciones de alta concurrencia mediante la innovación de la arquitectura del modelo y la optimización de la capacitación. En términos de antiinterferencia precisa, el modelo tiene la capacidad de "escuchar" continuamente, comprender el entorno acústico en el que se encuentra el usuario e ignorar con precisión el ruido de fondo y las conversaciones irrelevantes. En escenarios complejos, la tasa de respuestas falsas y la tasa de interrupciones falsas se reducen en un 50% en comparación con el modelo semidúplex. En términos de toma de decisiones dinámica, el modelo combina características semánticas y de habla para determinar de manera integral la intención del usuario. Puede escuchar pacientemente cuando el usuario duda y responder rápidamente una vez que el usuario ha terminado de hablar. La proporción de llamadas preventivas se reduce en un 40% en comparación con el modelo semidúplex y el rendimiento en la toma de decisiones mejora en un 8%.

La evaluación multidimensional muestra que Seeduplex es significativamente mejor que la solución tradicional semidúplex y la función de llamada de voz de las principales aplicaciones de la industria en términos de fluidez y ritmo de conversación. Este modelo ha sido el primero en la industria en lograr una implementación a gran escala y puede proporcionar una experiencia de interacción de voz continua, de alta calidad y en tiempo real para cientos de millones de usuarios.