Cómo la inteligencia artificial podría llegar a mejorar la interpretación radiológica del tromboembolismo pulmonar

Artículo original: Cheikh AB, Gorincour G, Nivet H, May J, Seux M et al. How artificial intelligence improves radiological interpretation in suspected pulmonary embolism. Eur Radiol. 2022; 32(9):5831-5842.

DOI: https://doi.org/10.1007/s00330-022-08645-2

Sociedad: European Society of Radiology (ESR) (@myESR)

Palabras clave: Pulmonary embolism, Computed tomography angiography, Artificial intelligence, Sensitivity and specificity, Predictive value of tests.

Abreviaturas y acrónimos utilizados: Angio-TC (​​angiografía pulmonar por tomografía computarizada), COVID-19 (enfermedad por coronavirus 2019), DCNN (Deep convolutional neural network), IA (inteligencia artificial), IC (intervalo de confianza), PACS (Picture Archiving and communication system), RM (resonancia magnética), TEP (tromboembolismo pulmonar), VPN (valor predictivo negativo), VPP (valor predictivo positivo).

Línea editorial del número: European Radiology es la revista de la Sociedad Europea de Radiología y la publicación oficial de varias sociedades profesionales. Es una de las revistas europeas líderes en el campo de la imagen médica y cuenta con una gran difusión a nivel global, ya que contribuye a la actualización constante del conocimiento científico en radiología a través de la publicación de artículos originales y revisiones de vanguardia llevadas a cabo por radiólogos destacados; además de comunicaciones breves y actualizaciones sobre asuntos de la Sociedad que abarcan todos los ámbitos de la radiología.

En su número de septiembre, perteneciente al volumen 32, nos ofrece una recopilación de 75 artículos, siguiendo la misma estructura que en entregas anteriores, otorgando un gran protagonismo en su última edición a publicaciones sobre inteligencia artificial y radiómica. En este último grupo, se incluye el artículo de la revisión, así como otros de interés, destacando uno dirigido a la potencial aplicación de la radiómica en la medicina personalizada, que permita identificar biomarcadores capaces de predecir la respuesta al tratamiento y el pronóstico en pacientes con cáncer gástrico.

Dentro de la neurorradiología, cabe mencionar un metaanálisis que compara la precisión diagnóstica del sistema de puntuación de circulación colateral previo a trombectomía endovascular intraarterial  utilizando angiografía por sustracción digital y angiografía por tomografía computarizada.

Motivo para la selección: He seleccionado este artículo dado que combina dos aspectos que considero de interés para nuestro desempeño como radiólogos. Por un lado, la relevancia que tiene el TEP en nuestra labor asistencial diaria, cobrando especial protagonismo en el ámbito de urgencias, y, en segundo lugar, el auge de la inteligencia artificial y sus potenciales aplicaciones a nuestro trabajo. Por todo ello, y debido a la cada vez mayor presión asistencial del radiólogo por parte de otras especialidades, considero de gran utilidad disponer de herramientas de apoyo que ayuden a mejorar la precisión diagnóstica y la eficiencia de nuestras exploraciones.

Resumen: 

Debido a la alta carga asistencial y a la cada vez mayor cantidad de pruebas de imagen solicitadas desde los servicios de urgencias, la obtención de diagnósticos precisos y rápidos se está convirtiendo en un reto para los radiólogos. Es por ello, que la IA se está postulando como una potencial herramienta de apoyo en la interpretación de imágenes médicas.

En el contexto de la sospecha de TEP, esto es especialmente importante, ya que constituye la tercera causa de síndrome cardiovascular agudo y una detección temprana que permita el inicio de anticoagulación se asocia con mejores resultados. Su diagnóstico se basa en la combinación de la presentación clínica, marcadores de laboratorio como el Dímero D y pruebas de imagen, fundamentalmente el angio-TC de arterias pulmonares, donde se espera que la IA desempeñe un papel clave en el flujo de trabajo de los radiólogos de urgencias.

Aunando estos conceptos, los autores del artículo nos presentan un estudio que tiene por objetivo evaluar y establecer una comparación entre el rendimiento diagnóstico de un algoritmo de inteligencia artificial basado en DCNNs (AIDOC) para el diagnóstico del TEP por angio-TC, con el  de los radiólogos de urgencias, planteando la hipótesis de que la IA podría complementar nuestro trabajo.

Se trata de un estudio multicéntrico, observacional y retrospectivo, que incluyó a tres cohortes de pacientes procedentes de varios servicios de urgencias franceses que cumplieran unos criterios de inclusión consistentes en una sospecha clínica de TEP, así como disponibilidad de las pruebas de angio-TC en el PACS e informes radiológicos.

La cohorte principal (“cohorte 2019”), constituida por un total de 1202 pacientes adultos con sospecha de TEP entre septiembre y diciembre de 2019, fue empleada para la evaluación del objetivo primario de estudio: comparar la precisión diagnóstica, de forma independiente, por parte de los radiólogos y del algoritmo de IA, en la detección de TEP mediante angio-TC. El gold standard  fue la revisión retrospectiva de los angio-TC realizados por un radiólogo experimentado y un experto en IA con pleno acceso a los registros clínicos, informes radiológicos, a las predicciones de IA y a los resultados de los pacientes.

Otras dos cohortes fueron incluidas, constituidas por un total de 1667 pacientes con sospecha de TEP desde octubre hasta diciembre de 2018 (“cohorte 2018” o “pre-IA”), y 4454 pacientes con sospecha de TEP desde junio hasta agosto de 2020 (“cohorte 2020” o “con-IA”). La diferencia entre ambas fue que en la “cohorte 2020” los radiólogos tuvieron acceso al algoritmo de IA para la realización de sus informes, permitiendo el estudio de los objetivos secundarios: determinar el impacto de la implementación del algoritmo de IA, por una parte, en la tasa de detección de TEP, y por otro lado, en la satisfacción de los radiólogos y en la duración de la interpretación de sus exploraciones.

Los angio-TC fueron realizados con un protocolo estandarizado para todos los hospitales, y las imágenes fueron valoradas por un equipo de 150 radiólogos (104 senior y 46 residentes) procedentes de diferentes centros de interpretación especializados (Burdeos, Lyon y Marsella). Los informes radiológicos siguieron una estructura común, indicando la presencia/ausencia de defectos de repleción en la vasculatura arterial pulmonar, así como de artefactos respiratorios y la calidad de la inyección del medio de contraste. Adicionalmente se indicaron la edad y sexo de los pacientes, así como el protocolo de obtención de imágenes y la duración de la interpretación radiológica.

De forma paralela, los resultados positivos detectados por el sistema de IA, se transfirieron al PACS en forma de mapa codificado por colores que permitiera la visualización de la zona sospechosa.

En cuanto al análisis estadístico, para el objetivo primario se realizó un contraste de hipótesis con la prueba de McNemar, tanto en la cohorte principal como por subgrupos estratificados en función de la calidad de la técnica de imagen. Para comparar la prevalencia de TEP en las cohortes secundarias se realizó un test de Chi cuadrado, y para valorar la duración de la interpretación radiológica, un test de Wilcoxon. Los resultados que se obtuvieron fueron los siguientes:

  • En la cohorte 2019, la sensibilidad y los VPN más altos se obtuvieron con la IA (92,6% frente a 90% y 98,6% frente a 98,1%, respectivamente), sin embargo, estas diferencias no fueron estadísticamente significativas (p> 0,05). Por el contrario, la precisión diagnóstica, la especificidad y el VPP más altos correspondieron a los radiólogos (97,7% frente a 95,3%, 99,1% frente a 95,8% y 95% frente a 80,4%, respectivamente), siendo las diferencias estadísticamente significativas (p< 0,05), excepto en los subgrupos con una calidad de inyección de contraste mala/entre mala y media (p> 0,05).
  • La mayor tasa de discordancia entre los radiólogos tanto con la IA, como con el gold standard, se encontró en el subgrupo con calidad media-baja en la inyección de contraste.
  • En general, los TEP que los radiólogos no fueron capaces de detectar se interpretaron en menor tiempo, se presentaron con mayor frecuencia junto con otras enfermedades torácicas confusas y se caracterizaron por la longitud de coágulo más corta (p< 0,05).
  • En relación con los objetivos secundarios, no se logró demostrar un mayor rendimiento diagnóstico tras la implementación clínica de IA, como se muestra en las comparaciones entre la cohorte 2018 y la cohorte 2020 (16.3% frente a 12.7% respectivamente, p< 0,05), y la duración media de la interpretación se vio incrementada con el uso de la IA (14.55 ± 9.08 frente a 15.6 ± 9.77 minutos). Sin embargo, los radiólogos evaluaron positivamente el algoritmo de IA para reforzar sus conclusiones, confirmar hallazgos negativos o descartar la presencia de TEP en estudios de calidad técnica deficiente.

Las conclusiones que se obtienen del artículo, son que, a pesar de no haberse demostrado un rendimiento diagnóstico significativamente mejor del algoritmo de IA frente a la actuación de los radiólogos, puede ser de utilidad como herramienta complementaria en su trabajo, reforzando su confianza y resolviendo sus dudas diagnósticas, especialmente en aquellas exploraciones con baja calidad técnica.

Valoración personal:

A nivel personal, me ha resultado un artículo ameno y de fácil lectura.

Como aspecto positivo considero que se plantean unos objetivos de interés para los radiólogos, dado que la incorporación de la IA a nuestra labor asistencial es prácticamente una realidad y me parece esencial conocer de primera mano cómo podría mejorar el rendimiento diagnóstico de nuestras exploraciones, especialmente en patologías tan prevalentes en nuestro día a día como lo es el TEP. Además, destaco favorablemente su interés por mostrar la IA como una herramienta más para potenciar el papel del radiólogo, y no como un elemento que reemplace nuestro trabajo.

Como aspectos negativos, cabe destacar que se trata de un estudio retrospectivo, en el que además se realizan análisis por subgrupos, que permiten generar nuevas hipótesis, pero no confirmarlas. Solo un estudio comparativo prospectivo permitiría comparar adecuadamente los rendimientos diagnósticos de la IA y los radiólogos por separado y de forma conjunta, y sacar verdaderas conclusiones.

Por otro lado, aunque concluyen la utilidad de la IA para mejorar el diagnóstico por imagen del TEP, aumentando la sensibilidad y el VPN, no consiguen demostrar diferencias estadísticamente significativas, mientras que la mayor especificidad y VPP por parte de los radiólogos sí alcanza la significación estadística, no consiguiendo confirmar su hipótesis primaria.

Respecto a los objetivos secundarios del estudio, debemos tener en cuenta la valoración a favor de la implementación de la IA que realiza un 70% de los radiólogos, si bien, solo participa un 50% en las encuestas de satisfacción. Sin embargo, como ya he mencionado, no se ha demostrado una superioridad en los resultados y, además, el tiempo de estudio se vio ligeramente aumentado. Adicionalmente, la cohorte 2020 podría haber estado sesgada por la pandemia de COVID-19, que dio lugar a más solicitudes de TC de tórax, en general, y específicamente por sospecha de TEP.

Finalmente, como ellos mismos mencionan, no se tuvieron en cuenta otras características que podrían influir en los resultados de los radiólogos, como las horas de interpretación (especialmente durante la noche) o los períodos de alta carga de trabajo. Tampoco se tuvieron en consideración otros aspectos técnicos como el tipo de escáner, su adquisición y los parámetros de post-procesamiento que podrían haber influido en los resultados.

En resumen, los autores proponen una idea novedosa y de potencial interés para el radiólogo, sin embargo, son necesarios más estudios, con mayor tamaño muestral y en la medida de lo posible prospectivos o de tipo experimental que permitan extraer conclusiones válidas a favor de la implementación de la IA en el diagnóstico de TEP u otros tipos de imagen médica.

Ana Berasategui Criado

Hospital Universitario Marqués de Valdecilla (Santander), R2

anacriabera@gmail.com

Tagged with: , , , ,
Publicado en European Radiology

Deja una respuesta

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Salir /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Salir /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Salir /  Cambiar )

Conectando a %s

Publicaciones del Club
Residentes SERAM
A %d blogueros les gusta esto: