El 15 de abril, Bloomberg informó que un nuevo estudio muestra que los chatbots impulsados por IA brindan respuestas a preguntas problemáticas aproximadamente la mitad de las veces cuando brindan asesoramiento médico. El descubrimiento pone de relieve los riesgos para la salud de la IA, una nueva tecnología que está cada vez más integrada en la vida diaria.
Investigadores de Estados Unidos, Canadá y el Reino Unido evaluaron cinco plataformas líderes de inteligencia artificial: ChatGPT, Gemini, Meta AI, Grok y DeepSeek, haciendo a cada plataforma 10 preguntas bajo cinco categorías de salud. Según una investigación publicada esta semana en la revista médica BMJ Open, alrededor del 50% de todas las respuestas de estos chatbots de IA se consideraron "problemáticas", y casi el 20% se clasificaron como "altamente cuestionables".
El estudio encontró que estos chatbots se desempeñaron de manera significativamente diferente en diferentes tipos de preguntas: obtuvieron resultados relativamente mejores en preguntas cerradas (las respuestas son seguras) y preguntas relacionadas con vacunas y cáncer, pero obtuvieron peores resultados en preguntas abiertas y áreas como la investigación de células madre y la nutrición.

Amarillo significa que hay un problema, naranja significa que hay un problema de altura
Los investigadores dijeron que las respuestas a menudo se daban en un tono seguro y seguro, pero ninguno de los chatbots proporcionó una lista de referencias completa y precisa en respuesta a alguna pregunta. A lo largo del estudio, el chatbot se negó a responder preguntas solo dos veces, ambas de Meta AI.
Los hallazgos resaltan una creciente preocupación por el hecho de que las personas utilizan cada vez más plataformas de inteligencia artificial generativa para obtener asesoramiento médico, pero estas plataformas no tienen licencia para brindar asesoramiento médico y carecen del criterio clínico necesario para hacer un diagnóstico.
La explosión de los chatbots de IA los ha convertido en una herramienta popular para las personas que buscan orientación sobre su enfermedad. OpenAI dice que más de 200 millones de personas recurren a ChatGPT cada semana para tener preguntas sobre salud y bienestar. La plataforma anunció en enero de este año que lanzaría herramientas de salud independientes para usuarios generales y médicos. Ese mismo mes, Anthropic también anunció que su producto Claude lanzaría un nuevo servicio de atención médica.
Los autores del estudio, publicado en BMJ Open, dijeron que un riesgo significativo si los chatbots se implementan sin educación y regulación pública es que podrían amplificar la difusión de información errónea.
Dijeron que los hallazgos "destacan importantes limitaciones de comportamiento de la IA y sugieren la necesidad de reevaluar cómo se implementan los chatbots de IA en las comunicaciones médicas y de salud de cara al público". También señalan que estos sistemas a menudo son capaces de generar "respuestas que suenan autoritarias pero potencialmente defectuosas".