El lunes (18 de diciembre), hora local, la empresa de investigación de inteligencia artificial (IA) OpenAI anunció un conjunto de directrices para prevenir los riesgos de la IA. Una regla que vale la pena señalar es que incluso si los líderes de la empresa, como el director ejecutivo, creen que un modelo de IA es seguro, la junta directiva puede impedir su publicación. El chatbot ChatGPT desarrollado por OpenAI se lanzó hace un año. Esta fenomenal aplicación ha promovido en gran medida el desarrollo del campo de la IA y, con ella, surge la preocupación por el desarrollo fuera de control de la IA.
Los reguladores de todo el mundo están formulando sus propias regulaciones sobre IA y OpenAI, líder en el campo de la IA, también está tomando medidas.
El 27 de octubre de este año, OpenAI anunció la formación de un equipo de seguridad llamado "Preparación" para minimizar los riesgos que trae la IA.
El equipo de Preparación está dirigido por Aleksander Madry, director del Centro de Aprendizaje Automático Implementable del MIT. El equipo llevará a cabo evaluaciones de capacidad y pruebas del equipo rojo de varios modelos de IA para rastrear, predecir y prevenir diversos tipos de riesgos catastróficos.
OpenAI publicó el lunes unas directrices denominadas "Marco de preparación", enfatizando que el conjunto de directrices aún se encuentra en una fase de prueba.
Se informa que el equipo de preparación enviará informes mensuales a un nuevo grupo asesor de seguridad interno, que luego los analizará y presentará recomendaciones al director ejecutivo de OpenAI, Sam Altman, y a la junta directiva.
Como uno de los cofundadores de OpenAI, Altman fue miembro de la junta directiva de la empresa no hace mucho, pero fue destituido de la empresa por un shock personal y dejó OpenAI por un tiempo. Aunque Altman finalmente pudo regresar a OpenAI y continuar como director ejecutivo, no tenía un puesto en la junta directiva "inicial" recién formada.
El equipo de Preparación evaluará repetidamente los modelos de IA más avanzados de OpenAI, aún por publicarse, y los clasificará en cuatro niveles según diferentes tipos de riesgos percibidos, de bajo a alto: "bajo", "medio", "alto" y "severo". Según las nuevas directrices, OpenAI sólo lanzará modelos clasificados como "bajo" y "medio".