Inteligencia artificial en radiografía simple de urgencias: monitorización tras su implantación e impacto clínico de los resultados erróneos

Artículo original: Brurberg KG, Kjelle E, Vardal J, Sivanandan R. Artificial intelligence in emergency skeletal X-ray: post-deployment monitoring and clinical impact of incorrect AI results. European Journal of Radiology. 2026;199:112805.

DOI: 10.1016/j.ejrad.2026.112805

Sociedad: European Society of Radiology (ESR) (@EJR_official_

Palabras clave: Artificial intelligence, Skeletal X-ray, Fractures, Emergency radiology, Diagnostic accuracy.

Abreviaturas y acrónimos utilizados: IA (Artificial Intelligence), PACS (Picture Archiving and Communication System), RIS (Radiology Information System), RM (Resonancia Magnética), TC (Tomografía Computarizada), 

Línea editorial: European Journal of Radiology es una revista internacional revisada por pares publicada por Elsevier,  centrada en todas las áreas de la radiología diagnóstica e intervencionista. Publica investigaciones originales, revisiones y artículos relacionados con la innovación tecnológica aplicada a la imagen médica. En los últimos años ha dedicado una atención creciente a la inteligencia artificial, la automatización de procesos y la integración de herramientas de apoyo a la decisión clínica en la práctica radiológica diaria.

El artículo seleccionado forma parte del volumen 199 de 2026. Entre los trabajos más destacados de esta edición se encuentran CT and MR evaluation of main pancreatic duct dilation: A radiologist’s guide to differentiating benign from malignant causes, un artículo de gran relevancia que nos permitirá mejorar el manejo del paciente ante la visualización de imágenes que secundariamente ocasionen una dilatación del Wirsung, y Cerebral small vessel disease imaging markers and disease severity in moyamoya disease: Insights from magnetic resonance imaging analysis centrado en la identificación de biomarcadores de resonancia magnética relacionados con la gravedad de la enfermedad de moyamoya, mejorando la evaluación pronóstica y el manejo clínico.

El artículo que he seleccionado aborda uno de los temas de mayor actualidad en nuestra especialidad: la evaluación del impacto clínico real de sistemas de inteligencia artificial una vez implantados en el entorno asistencial. A diferencia de muchos trabajos centrados exclusivamente en la precisión diagnóstica, este estudio analiza cómo la inteligencia artificial modifica los circuitos asistenciales y la toma de decisiones clínicas en un servicio de urgencias.

Motivos para la selección: He seleccionado este artículo por el creciente papel que está adquiriendo la inteligencia artificial en la práctica radiológica diaria, especialmente en el ámbito de la radiología de urgencias.  Actualmente, en mi hospital, el Gregorio Marañón (Madrid), ya se utiliza una herramienta de inteligencia artificial para la detección de hallazgos de patología musculoesquelética en urgencias. Detecta fracturas, luxaciones y presencia de derrames articulares para que el clínico en urgencias tenga más rápido y fácil su diagnóstico. Es por este motivo por el que me pareció interesante saber más si esta herramienta realmente impactaba en la práctica clínica.

Además, me resultó interesante que el artículo no se centra únicamente en evaluar la precisión diagnóstica de la inteligencia artificial, sino que analiza cómo se integra en el flujo asistencial, cuáles son las consecuencias de los errores diagnósticos y qué papel desempeñan los profesionales sanitarios en la supervisión de sus resultados. Este enfoque resulta particularmente útil para comprender las fortalezas y limitaciones actuales de estas herramientas y reflexionar sobre su aplicación segura en nuestro entorno clínico.

Resumen:

Los sistemas sanitarios se enfrentan actualmente a una creciente demanda asistencial y a una limitación progresiva de recursos humanos. En este contexto, lA ha emergido como una herramienta con potencial para mejorar la eficiencia diagnóstica y optimizar los flujos de trabajo radiológicos.

Los autores evalúan el comportamiento de BoneView™, un algoritmo basado en redes neuronales profundas diseñado para la detección de fracturas, derrames articulares, luxaciones y lesiones óseas en radiografías simples. El objetivo principal del estudio fue analizar su rendimiento tras su implantación clínica y valorar las consecuencias de los resultados erróneos sobre el manejo de los pacientes.

Se realizó un estudio retrospectivo en el Hospital de Bærum (Noruega), donde BoneView™ fue incorporado al flujo asistencial de radiología de urgencias en septiembre de 2023. Se incluyeron todos los pacientes remitidos para radiografía simple por sospecha de fractura durante enero de 2024, obteniéndose una muestra final de 1.248 pacientes.

El sistema clasifica los hallazgos como positivos, dudosos o negativos. Tras la adquisición de las imágenes, estas son enviadas automáticamente al algoritmo, que genera un resultado en pocos minutos. Posteriormente, los técnicos de radiología revisan las imágenes y la interpretación de la inteligencia artificial y deciden si el paciente puede ser dado de alta o requiere valoración adicional, manteniendo siempre la posibilidad de consultar con el radiólogo de guardia.

La edad media de los pacientes fue de 45 años y las localizaciones anatómicas más frecuentes fueron pelvis, muñeca, mano, tobillo, pie y rodilla. Comparando los resultados de la IA con los informes radiológicos finales, los autores obtuvieron una sensibilidad global del 95% y una especificidad del 90%.

La IA produjo 24 falsos negativos (2% del total) y 77 falsos positivos (6%). La sensibilidad fue especialmente elevada en muñeca, pie, codo y antebrazo, mientras que los peores resultados se observaron en las exploraciones de rodilla y pierna, principalmente debido a la dificultad para detectar derrames articulares mínimos.

Los falsos positivos estuvieron relacionados fundamentalmente con fracturas antiguas, variantes anatómicas normales, placas de crecimiento, superposición de estructuras, pliegues cutáneos o material protésico. Por otro lado, los falsos negativos se debieron principalmente a pequeños derrames articulares de rodilla y fracturas de escasa entidad clínica.

Un aspecto especialmente interesante del trabajo es el análisis del papel de los técnicos de radiología en la supervisión de la IA. Los profesionales modificaron la decisión inicialmente sugerida por el algoritmo en aproximadamente el 19% de los casos. Esta corrección fue significativamente más frecuente cuando la inteligencia artificial se equivocaba, demostrando el valor de la supervisión humana dentro del proceso diagnóstico.

Entre los 1.248 pacientes estudiados, únicamente se identificó un caso con posible repercusión clínica relevante. Se trataba de una fractura de dedo asociada a una deformidad tipo “drop finger” que no fue detectada por la IA, por lo que el paciente fue dado de alta inicialmente. Sin embargo, tras la revisión posterior por el radiólogo, el paciente fue contactado y recibió el tratamiento adecuado.

Los autores concluyen que la implantación de este flujo de trabajo asistido por IA permitió optimizar el manejo de los pacientes en urgencias manteniendo estándares elevados de seguridad clínica. La combinación entre IA y supervisión profesional parece minimizar el impacto de los errores diagnósticos y mejorar la eficiencia asistencial.

Valoración personal:

Me ha parecido un artículo muy interesante y especialmente relevante por tratar un escenario cada vez más frecuente en nuestros servicios de radiología. Mientras que muchos estudios se centran únicamente en comparar el rendimiento diagnóstico de la inteligencia artificial frente al radiólogo, este trabajo aporta información sobre un aspecto mucho más práctico: qué ocurre cuando estas herramientas se incorporan a la actividad clínica diaria.

Considero especialmente valioso que los autores analizan las consecuencias reales de los falsos positivos y falsos negativos, así como el papel que desempeñan los profesionales sanitarios en la supervisión de los resultados. Los hallazgos apoyan una visión de la inteligencia artificial como herramienta complementaria y no sustitutiva del radiólogo.

Como residente, me parece un artículo útil para comprender tanto las posibilidades como las limitaciones actuales de la  inteligencia artificial aplicada a la radiología de urgencias. Además, resulta fácilmente extrapolable a la realidad asistencial de muchos hospitales españoles donde estas herramientas están comenzando a implantarse.

Sociedad: European Society of Radiology (ESR)

Sección y órgano-sistema: Radiología musculoesquelética y radiología de urgencias.

Técnica radiológica: Radiografía simple.

Tipo de artículo: Estudio observacional retrospectivo.

Año de residencia recomendado: R2, R3, R4.

Elvira S. Trelles
Hospital General Universitario Gregorio Marañón, Madrid, R2

elvira.santos@salud.madrid.org

Tagged with: , , , ,
Publicado en European Journal of Radiology, European Journal of Radiology

Deja un comentario

Publicaciones del Club
Residentes SERAM
Autores