Un enjambre de robots de audio autónomos permite conversaciones silenciosas en habitaciones abarrotadas

Investigadores de la Universidad de Washington dicen que ahora pueden silenciar diferentes partes de una habitación ruidosa o aislar una conversación en un ambiente desordenado, gracias a un enjambre de pequeños robots de audio que pueden localizar, identificar y rastrear de forma autónoma múltiples fuentes de sonido en movimiento.

Los humanos podemos localizar fuentes de sonido con los ojos cerrados, gracias a la matriz de micrófonos duales ligeramente distribuidos y al blindaje de audio que proporcionan nuestros oídos. Pero cuando el entorno de audio se vuelve complejo, las cosas pueden volverse muy confusas, algo que va en contra de nuestra tendencia idiosincrásica a buscar espacios ruidosos, abarrotados y llenos de energía (como una cafetería el domingo por la mañana) y luego intentar mantener una conversación en ellos.

En estos espacios de audio más abarrotados, la única forma de aislar fuentes de sonido individuales y silenciar otras es implementar conjuntos de micrófonos más grandes y luego procesar todas las corrientes de audio juntas para crear un mapa del espacio que triangule la ubicación de cada sonido y mida las pequeñas diferencias de tiempo en el tiempo que tarda el sonido en viajar por el aire y llegar a cada micrófono. Luego puede utilizar esquivos algoritmos de aprendizaje profundo para reprocesar todas las transmisiones de audio, creando transmisiones de audio independientes para cada fuente de sonido y eliminando todo el ruido de otras fuentes de sonido.

Al localizar y rastrear múltiples fuentes de sonido en una habitación, los conjuntos de micrófonos robóticos pueden aislar y silenciar diferentes áreas de audio. Imagen / Universidad de Washington

La idea en sí no es nueva, pero investigadores de la Universidad de Washington le han dado un nuevo giro al concepto, utilizando un enjambre de siete pequeños robots con micrófonos con ruedas, cada uno del tamaño de una trufa de chocolate, que se despliegan de forma autónoma desde una estación de carga y crean una matriz autooptimizada dentro del espacio disponible.

Los robots utilizan micrófonos y parlantes incorporados para navegar por la superficie de la mesa mediante un sonar, evitando obstáculos y extendiéndose lo más posible para maximizar la diferencia de tiempo entre los micrófonos. Desafortunadamente, esto significa que hay que moverlos uno por uno, pero una vez en su lugar funcionan de manera sorprendente, como puedes ver en el video a continuación.

¿Cuál es entonces el objetivo final? El equipo de investigación cree que conjuntos robóticos como este podrían usarse como conjuntos de micrófonos portátiles, desplegados automáticamente y con aislamiento de sonido para transmisiones en vivo en salas de conferencias y similares, dispersando teóricamente sus propias voces mejor que los humanos.

El equipo dice que no será de mucha utilidad en videollamadas bidireccionales porque, si bien funciona de manera eficiente, actualmente tarda aproximadamente 1,82 segundos en procesar cada bloque de sonido de tres segundos. La latencia también significa que no podrá transmitir audio limpio desde un interlocutor a los auriculares en un café ruidoso en poco tiempo, aunque ambas aplicaciones son posibles a medida que mejoran la potencia y la velocidad de procesamiento.

Por supuesto, también puede convertirse en una herramienta de monitoreo muy conveniente, eliminando el efecto de enmascaramiento del ruido de la multitud y grabando conversaciones privadas. Curiosamente, el equipo de investigación de la Universidad de Washington dice que puede hacer exactamente lo contrario.

"Tiene el potencial de beneficiar realmente la privacidad más allá de lo que permiten los parlantes inteligentes actuales", dijo el estudiante de doctorado Malek Itani, coprimer autor del estudio. "Podría decir 'No grabes nada alrededor de mi escritorio' y nuestro sistema registraría todo lo que me rodeara". pies (0,9 metros). Todo lo que esté en esta burbuja no quedará registrado. O, si hay dos grupos de personas hablando cerca, un grupo tiene una conversación privada mientras el otro grupo está grabando, la conversación de un grupo se puede colocar en una zona de silencio y permanecer privada.

Después de ser liberado de la estación de carga, el robot utiliza un sonar para distribuirse alrededor de una superficie para lograr el máximo aislamiento espacial.

En realidad, los conjuntos de micrófonos estáticos distribuidos pueden comenzar a usarse en diseños de habitaciones o hogares inteligentes, donde pueden aislar fácilmente los comandos de control de voz en diferentes áreas. Por ejemplo, puedes controlar el televisor simplemente escuchando los sonidos desde el sofá, o incluso elegir los pedidos de bebidas de la persona que está parada en la barra en un lugar ruidoso.

El artículo fue publicado en la revista Nature Communications.