Un estudio reciente publicado en la revista Radiology encontró que los radiólogos eran mejores que las herramientas de inteligencia artificial para identificar o descartar tres enfermedades pulmonares comunes a partir de más de 2000 radiografías de tórax. Los radiólogos superaron a la inteligencia artificial al detectar con precisión tres enfermedades pulmonares comunes a partir de radiografías de tórax, según un estudio publicado en la revista Radiology. La herramienta de IA, aunque sensible, produjo más falsos positivos, lo que la hace menos confiable para el diagnóstico autónomo pero útil para segundas opiniones.
En un estudio de más de 2000 radiografías de tórax, los radiólogos superaron a la inteligencia artificial al identificar con precisión la presencia o ausencia de tres enfermedades pulmonares comunes, según un estudio publicado el 26 de septiembre en Radiology, la revista de la Sociedad Radiológica de América del Norte (RSNA).
El papel de la radiografía.
"Las radiografías de tórax son una herramienta de diagnóstico común, pero interpretar correctamente los resultados requiere una amplia formación y experiencia", afirmó el investigador principal, Dr. Louis L. Plesner, médico residente e investigador doctoral en el Departamento de Radiología del Hospital Herlev y Gentofte en Copenhague, Dinamarca.
Aunque existen en el mercado herramientas de IA aprobadas por la FDA para ayudar a los radiólogos, la aplicación clínica de herramientas de IA basadas en aprendizaje profundo para el diagnóstico radiológico aún está en sus primeras etapas. "Aunque cada vez se aprueban más herramientas de inteligencia artificial para su uso en radiología, existe una necesidad insatisfecha de seguir probando estas herramientas en escenarios clínicos reales", afirmó el Dr. Plesner. "Las herramientas de inteligencia artificial pueden ayudar a los radiólogos a interpretar las radiografías de tórax, pero su precisión diagnóstica real sigue sin estar clara".
(A) Radiografía posteroanterior de tórax de un paciente masculino de 71 años que fue remitido para examen radiológico debido a disnea progresiva que mostraba fibrosis bilateral (flecha B). La radiografía posteroanterior de tórax de una paciente de 31 años que fue remitida para un examen radiológico debido a una tos de un mes de evolución muestra una sutil opacidad en el espacio aéreo en el borde derecho del corazón (flecha). (C) Radiografía anterior de tórax de un paciente varón de 78 años remitido después de la colocación de un catéter venoso central que muestra un pliegue cutáneo derecho (flecha). (D) Radiografía posteroanterior de tórax de un paciente masculino de 78 años remitido para exclusión de neumotórax que muestra un neumotórax muy sutil (flecha) en el ápice derecho. (E) Radiografía de tórax anteroposterior posterior que muestra un redondeo crónico del ángulo costofrénico (flecha) en un paciente masculino de 72 años que fue remitido para examen radiológico sin ningún motivo en particular. (F) La radiografía anterior de tórax de una paciente de 76 años remitida debido a sospecha de congestión y/o neumonía muestra un derrame muy pequeño en el lado izquierdo del tórax (flecha) que no fue detectado por las tres herramientas de IA que analizan los derrames pleurales en las radiografías anteriores de tórax. Fuente: Sociedad Radiológica de América del Norte
Resultados de la investigación
El Dr. Plesner y el equipo de investigación compararon el rendimiento de cuatro herramientas de inteligencia artificial disponibles comercialmente y 72 radiólogos en la interpretación de 2040 radiografías de tórax de adultos tomadas consecutivamente durante dos años en cuatro hospitales de Dinamarca en 2020. La edad media de la población de pacientes fue de 72 años. Entre las muestras de radiografía de tórax, 669 (32,8%) tuvieron al menos un hallazgo objetivo.
Se evaluaron las radiografías de tórax para detectar tres hallazgos comunes: enfermedad de las células aéreas (un patrón de radiografías de tórax causado por cosas como neumonía o edema pulmonar), neumotórax (colapso del pulmón) y derrame pleural (acumulación de agua alrededor de los pulmones).
La herramienta de IA tuvo una sensibilidad del 72% al 91% para enfermedades de las vías respiratorias, del 63% al 90% para neumotórax y del 62% al 95% para derrame pleural.
"Las herramientas de IA mostraron una sensibilidad de moderada a alta comparable a la de los radiólogos para detectar enfermedades del espacio aéreo, neumotórax y derrame pleural en las radiografías de tórax", dijo. "Sin embargo, produjeron más resultados falsos positivos (prediciendo enfermedades cuando no estaban presentes) que los radiólogos, y su desempeño se degradó cuando estaban presentes múltiples hallazgos y objetivos más pequeños".
Comparación de valores previstos
Para el neumotórax, el valor predictivo positivo del sistema de IA (la probabilidad de que un paciente con resultado positivo realmente tuviera la enfermedad) osciló entre el 56% y el 86%, en comparación con el 96% para los radiólogos.
"La IA tuvo peores resultados en la identificación de la enfermedad de neumotórax, con un valor predictivo positivo de entre el 40 y el 50 por ciento", dijo el Dr. Plesner. "En esta difícil muestra de pacientes de edad avanzada, la IA predijo una enfermedad inexistente entre 5 y 6 de cada 10 veces. No se podía tener un sistema de IA funcionando por sí solo a esa velocidad".
El objetivo de los radiólogos es lograr un equilibrio entre la capacidad de detectar y descartar enfermedades, tanto para evitar que se pasen por alto enfermedades importantes como para evitar el sobrediagnóstico. "Los sistemas de IA parecen ser muy buenos para detectar enfermedades, pero no tan buenos como los radiólogos para determinar la ausencia de enfermedades, especialmente cuando las radiografías de tórax son más complejas", afirmó. "Demasiados diagnósticos falsos positivos pueden provocar imágenes innecesarias, exposición a la radiación y mayores costos".
La mayoría de los estudios suelen tender a evaluar la capacidad de la IA para determinar la presencia o ausencia de una sola enfermedad, lo cual es mucho más fácil que en situaciones de la vida real donde los pacientes suelen sufrir múltiples enfermedades. En muchos de los estudios anteriores que afirmaban que la IA era superior a los radiólogos, los radiólogos solo veían las imágenes sin conocer la historia clínica del paciente ni los estudios de imágenes previos. En la práctica diaria, la interpretación que hace un radiólogo de un examen de imágenes es una combinación de estos tres puntos de datos. Los investigadores especulan que la próxima generación de herramientas de inteligencia artificial podría ser aún más poderosa si también pudieran realizar este tipo de síntesis, pero actualmente no existe tal sistema.
"Nuestra investigación muestra que los radiólogos generalmente superan a la IA en escenarios del mundo real con una amplia variedad de pacientes", dijo. "Si bien los sistemas de IA pueden identificar eficazmente radiografías de tórax normales, la IA no debería realizar diagnósticos de forma autónoma".
El Dr. Plesner señaló que estas herramientas de inteligencia artificial pueden aumentar la confianza de los radiólogos en su diagnóstico al realizar una segunda mirada a las radiografías de tórax.