La inteligencia artificial ha logrado grandes avances en la comprensión del comportamiento humano. Investigadores de la Universidad Texas A&M desarrollaron recientemente un nuevo sistema de inteligencia artificial llamado "OmniPredict". El sistema ha demostrado capacidades de "lectura de la mente" sin precedentes: no sólo puede ver los movimientos humanos, sino también predecir las próximas intenciones humanas en tiempo real mediante la interpretación de pistas visuales y ambientales.

El resultado de esta investigación marca un gran salto en la tecnología de conducción autónoma desde la "reacción pasiva" a la "intuición activa". Los sistemas de conducción autónoma tradicionales generalmente solo pueden identificar la ubicación actual y la trayectoria de movimiento de los peatones, mientras que OmniPredict introduce la tecnología de modelo de lenguaje grande multimodal (MLLM), que le otorga capacidades de razonamiento similares a las de los humanos. El sistema puede capturar claramente señales sutiles como cambios en la postura del peatón, momentos de vacilación, orientación del cuerpo e incluso presión ocular, infiriendo así si el peatón se está preparando para cruzar la calle, simplemente esperando al costado de la carretera o si tiene otros comportamientos repentinos.

El equipo de investigación señaló que la principal ventaja de OmniPredict es que ya no sólo "mira" varios píxeles, sino que intenta comprender el "por qué" detrás del comportamiento. Al analizar información de entrada mixta compleja, el modelo clasifica con precisión el comportamiento humano en categorías clave como cruzar la calle, oclusión de la vista, acciones específicas y dirección de la mirada. En las pruebas, OmniPredict demostró una precisión de predicción de hasta el 67%, 10 puntos porcentuales más que los modelos más avanzados actualmente en el mercado. Lo que es aún más impresionante es que incluso en escenarios complejos donde los peatones están parcialmente ocultos o interactúan con el vehículo sólo a través de sus ojos, el sistema aún mantiene una estabilidad de juicio extremadamente alta.

El líder del proyecto, el Dr. Srikanth Saripalli, dijo que OmniPredict le da a la máquina un nuevo tipo de "Street Smarts". Si los coches autónomos pueden leer el lenguaje corporal de los transeúntes y predecir sus próximas acciones, al igual que los conductores humanos, la seguridad del tráfico rodado dará un salto cualitativo. Además del campo de la conducción autónoma, también se espera que en el futuro esta tecnología que puede interpretar el lenguaje corporal y el estado psicológico desempeñe un papel clave en escenarios de alto riesgo, como operaciones militares y rescates de emergencia. Al dar "intuición" a las máquinas, cambiará por completo el modelo de colaboración entre humanos y máquinas.

Compilado de /ScitechDaily