Sony publica un nuevo conjunto de datos comparativos de IA para ayudar a los modelos de visión por computadora a reducir el sesgo

En respuesta al problema de sesgo común en los modelos visuales de inteligencia artificial actuales, el equipo de IA de Sony lanzó recientemente un nuevo conjunto de datos llamado "Fair Human-Centric Image Benchmark (FHIBE)", con el objetivo de promover la estandarización de las pruebas de imparcialidad y la recopilación de datos éticos.

Todas las imágenes de este conjunto de datos se recopilaron con mi consentimiento y abarcan 81 países y regiones de todo el mundo. Contiene un total de 10.318 imágenes y 1.981 temas independientes. Cada imagen está equipada con anotaciones detalladas, incluida información profesional como definiciones de bordes, máscaras de segmentación y parámetros de la cámara, para facilitar a los desarrolladores realizar una evaluación detallada del modelo.

Alice Xiang, jefa de gobernanza global de IA en Sony AI, dijo que un malentendido en el campo de la visión por computadora es que los modelos pueden reflejar objetivamente la realidad debido a su dependencia de datos y algoritmos. De hecho, el sesgo de datos en el proceso de formación del modelo afectará directamente el rendimiento real. Por ejemplo, en China, algunos sistemas de reconocimiento facial de teléfonos móviles alguna vez no tenían suficientes rostros asiáticos en los datos de entrenamiento, lo que provocó que los miembros de la familia desbloquearan accidentalmente el dispositivo y completaran los pagos, generando así riesgos de seguridad. Además, los modelos visuales existentes también han tenido problemas como clasificar erróneamente a las doctoras como enfermeras o reforzar inadvertidamente estereotipos ocupacionales, raciales y de género.

Anteriormente, la mayoría de los conjuntos de datos de visión por computadora utilizados para evaluar la equidad no obtenían el consentimiento de los sujetos e incluso rastreaban imágenes directamente desde plataformas de Internet, lo que desencadenó muchas disputas sobre derechos de autor y privacidad. Por el contrario, toda la recopilación de datos de FHIBE tiene registros totalmente públicos de procesos de consentimiento y compensación, y se considera que ha establecido un nuevo estándar ético para la industria.

Basándose en la prueba FHIBE, el equipo de IA de Sony descubrió que la precisión de algunos modelos disminuía cuando se trataba de pronombres de género designados (como "Ella/Ella/Ella") debido a la diversidad de peinados. El modelo también puede asociar injustificadamente actividades delictivas con ciertos grupos étnicos en la tarea de reconocimiento de la ocupación. El equipo enfatizó que FHIBE puede ayudar a los desarrolladores a descubrir y corregir estas desviaciones de manera oportuna, promover que la industria preste más atención a la ética y la justicia en la recopilación de datos y alentar al personal de I+D a invertir más recursos en mejorar la innovación de la capa de datos.

En la actualidad, aunque el nivel federal de EE. UU. aún no ha introducido políticas que apoyen específicamente la ética y la equidad de la IA, la Ley de IA de la UE y las regulaciones pertinentes en algunos estados de EE. UU. han comenzado a exigir la revisión del sesgo algorítmico en áreas de alto riesgo. El Grupo Sony ha adoptado el conjunto de datos FHIBE en el proceso de evaluación de la ética de la IA y revisa de forma proactiva la imparcialidad de sus modelos de negocio de conformidad con el código de ética de la IA.

Alice Xiang cree que el "nihilismo de datos" prevalece cada vez más en la industria, y la práctica de FHIBE muestra que la tecnología de IA se puede desarrollar enteramente basándose en datos consentidos y compensados. Aunque la escala actual de FHIBE es todavía pequeña y no suficiente para respaldar la capacitación en big data, su importancia es proporcionar demostraciones de métodos para la industria y atraer más atención a la innovación de la capa de datos, que sigue siendo un problema importante que debe resolverse en el campo actual de la IA.