Esta semana, AICopilot en el navegador Microsoft Edge agregó una función que genera resúmenes de texto en video. Pero como explicó Mikhail Parakhin, director ejecutivo de Microsoft Advertising and Network Services, las funciones de ahorro de tiempo de EdgeCopilot siguen siendo bastante limitadas y sólo funcionan con vídeos preprocesados ​​o vídeos con subtítulos.

"Para que esto funcione, necesitamos preprocesar el vídeo. Si el vídeo tiene subtítulos, siempre podemos restaurarlo; si no hay subtítulos y no lo hemos preprocesado, entonces no funcionará", escribió Parakhin.

En otras palabras, EdgeCopilot en sí no es tanto un vídeo resumido sino una transcripción que resume el vídeo. Copilot también puede realizar funciones similares en Microsoft 365, incluido resumir reuniones de video de Teams y llamadas de agentes de servicio al cliente; en ambos casos, Microsoft primero debe transcribir el audio. Copilot en Microsoft Stream también puede resumir cualquier video, pero nuevamente requiere que el usuario genere una transcripción escrita.

La conversación comenzó después de que el diseñador Pietro Schirano publicara una grabación de pantalla de EdgeCopilot resumiendo el vídeo de YouTube del avance de GTAVI. En este caso, Copilot parece haber hecho el trabajo a la perfección. El usuario en la grabación presiona el botón "Generar resumen de video" en la barra lateral de Copilot y, solo unos segundos después, Copilot genera un resumen de video con puntos clave y marcas de tiempo.

Por supuesto, muchas plataformas, incluidas YouTube y Vimeo, pueden generar transcripciones y subtítulos automáticamente si el usuario ha habilitado esta función. TheVerge preguntó a Parakhin sobre

Copilot es sólo el último ejemplo de cómo Microsoft se enfrenta a Google (y otros) en una carrera para generar IA generativa. El mes pasado, Google actualizó su chatbot Bard con una extensión de YouTube que le permite resumir contenido de video y mostrar información específica del mismo. Esta misma semana, Google anunció una actualización importante de Gemini, pero la actualización en sí tiene sus problemas: en una presentación, los editores de la compañía pueden haber tergiversado algunas de las capacidades de la IA, y Google no siempre aclara los hechos.

Parashin habló con franqueza en las redes sociales sobre las distintas etapas de desarrollo de Copilot.