Deep learning de la detección de tuberculosis pulmonar activa en radiografía de tórax igualó los resultados de los radiólogos

Artículo original: Sahar Kazemzadeh BS, Jin Yu MS, Shahar Jamsha MSc, Rory Pilgrim BE et al. Deep Learning Detection of Active Pulmonary Tuberculosis at Chest Radiography Matched the Clinical Performance of Radiologists. Radiology. 2023; 306:124–137

DOI: https://doi.org/10.1148/radiol.212213

Sociedad: Radiological Society of North America (@RSNA)

Palabras clave: N/A

Abreviaturas y acrónimos: DLS (“Deep learning system”), IA (inteligencia artificial), NAAT (nucleid acid amplification test), OMS (Organización Mundial de la Salud),TBC (tuberculosis), TC (tomografía computarizada),VIH (virus de la inmunodeficiencia humana).

Línea editorial:

Radiology es una de las revistas más relevantes dentro del mundo del radiodiagnóstico. Sus números se publican mensualmente y contienen artículos de todas las subespecialidades que componen la radiología. En este primer número del año 2023, el uso de la inteligencia artificial en la práctica clínica del radiólogo presenta un gran peso, con hasta tres artículos originales entre sus páginas en los que se evalúa la capacidad de diagnóstico de los diferentes programas disponibles hoy día, con especial interés en el campo de la oncología. 

Otro tema que aún presenta una gran relevancia es la afectación pulmonar por SARS-CoV-2, con múltiples artículos sobre diferentes aspectos de esta enfermedad y con especial hincapié en las diferentes manifestaciones que presentan (tanto radiológicas como clínicas) las variantes Omicron y Delta.

Cabe destacar que en el año 2023 se cumplen 100 años desde la primera publicación de la revista Radiology. Respecto a este aniversario, se incluyen dos editoriales que tratan tanto del pasado de la revista (recopilando aquellos artículos que han tenido un mayor impacto en el mundo científico), como de su futuro, con el editorial “Radiology 2040”, en el que se enumeran 14 puntos sobre los que trabajar para hacer que siga avanzando esta rama de la medicina.

Motivos para la selección: 

La inteligencia artificial es un aspecto cada vez más presente en nuestras vidas, y la radiología no es una excepción. El desarrollo de programas diagnósticos es algo cada vez más extendido y los resultados están siendo muy prometedores, y es cada vez más evidente que su integración en la práctica totalidad de los servicios de Radiodiagnóstico es cuestión de tiempo. Por eso creo que el conocimiento de cómo funcionan estos sistemas y su utilidad es algo a lo que cualquier profesional de la radiología (ya sea adjunto o residente) debe de aspirar, desentenderse de estas herramientas no me parece una opción adecuada para el futuro de esta especialidad. 

Resumen:

En el mundo se estima que un cuarto de la población se encuentra infectada por Mycobacterium tuberculosis, de las cuales entre un 5-10% desarrollará tuberculosis activa en algún momento de su vida. Ante esta gran prevalencia mundial y la escasez de especialistas, la OMS recomienda la utilización de programas informáticos para la realización de programas de cribados de esta enfermedad. 

Los autores del artículo han desarrollado un “sistema de aprendizaje profundo” (Deep Learning System, un programa informático de inteligencia artificial) para interpretar los hallazgos de TBC activa en radiografías de tórax, comparando posteriormente su especificidad y sensibilidad frente a dos grupos de radiólogos. Para realizar esto, el programa analizó un total de 2309 pacientes, originarios de Estados Unidos, India, Sudáfrica, China y Zambia. Además, previo al estudio, el programa fue “entrenado” mediante otras 550297 imágenes procedentes de 22284 pacientes, ninguna de las cuales se utilizó posteriormente para el cálculo de la especificidad / sensibilidad.

En el estudio, el estándar de referencia para determinar que un paciente presentaba TBC activa era una prueba de microbiología positiva o un test de amplificación de ácidos nucleicos (Nucleotic Acid Amplification Test).

El DLS se compone de tres módulos:

  1. El primer módulo delimita qué parte de la radiografía de tórax que está analizando corresponde a los campos pulmonares.
  2. El segundo módulo identifica los hallazgos sospechosos de indicar TBC activa (nódulos, opacidades pulmonares, cavitaciones, derrames pleurales, tractos fibrosos, granulomas…).
  3. Por último, existe un tercer módulo que integra la información de los dos módulos previos para estimar la probabilidad del paciente de presentar un cuadro de TBC activa, así como otros hallazgos no sugestivos de TBC.

Por otra parte, los radiólogos con los que se comparó la sensibilidad y especificidad del programa se dividieron en dos grupos:

  • Grupo procedente de región endémica (India): 10 radiólogos de los cuales 1 de ellos fue excluido por baja sensibilidad.
  • Grupo procedente de región no endémica (Estados Unidos): 5 radiólogos.

Se les proporcionó información clínica de los pacientes (cuando fuese posible), consistente en la edad, sexo, síntomas y serología del VIH. Ninguna de esta información fue aportada al DLS.

→ Resultados y discusión:

Se realizaron dos test para valorar la utilidad de DLS:

  • Test con pacientes de cuatro países (China, India, Estados Unidos y Zambia), con 1236 pacientes. La edad media de los pacientes incluidos es de 38 años, con un porcentaje de mujeres de aproximadamente el 39%.
  • Test con 1073 pacientes de Sudáfrica, en su mayoría varones trabajadores en una mina de oro, un grupo de riesgo reconocido por la OMS.

Comparando la sensibilidad y especificidad frente a ambos grupos de radiólogos, se observó que el DLS desarrollado era no inferior en ninguno de los dos casos. Además, una vez se estratificaban los resultados para valorar la sensibilidad concreta para cualquiera de los hallazgos definidos como típicos en la TBC (por ejemplo, un patrón miliar), se obtuvo una clara mayor sensibilidad del sistema frente a los radiólogos (tanto de india como de Estados Unidos).

En el caso de los pacientes VIH+, pertenecientes en su mayoría a la muestra procedente de Zambia, las manifestaciones más frecuentes eran las denominadas como atípicas, lo que disminuyó en gran medida la sensibilidad y especificidad del DLS. Sin embargo, esta disminución también se produjo en ambos grupos de radiólogos, haciendo que una vez analizados los datos no se apreciasen variaciones estadísticamente significativas. Cabe recordar que la información de que un paciente era VIH+ no se aportó al programa de IA.

También se compararon los resultados obtenidos entre ambos grupos de radiólogos, siendo la especificidad de los especialistas asentados en la India mayor frente a los radiólogos pertenecientes a los Estados Unidos. Por otra parte, estos últimos mostraron una ligera mayor sensibilidad.

Por último se hizo una estimación del coste que supondría la instauración de un sistema de cribado en la India consistente en una radiografía de tórax inicial con posterior NAAT si esta prueba de imagen resulta positiva. Esta estrategia, frente a únicamente un NAAT, se estima que puede suponer un ahorro de costes de entre 40 y el 80% en entornos con una prevalencia de TBC de entre el 1 y el 10%. Este ahorro se incrementa según va bajando la prevalencia, algo muy a tener en cuenta si se quiere llegar a erradicar esta patología.

Los autores del artículo concluyen el mismo haciendo referencia a las principales limitaciones del estudio. Nos encontramos ante un estudio retrospectivo, lo que no permite valorar de manera adecuada cómo se integraría un DLS en el flujo de trabajo cotidiano en un servicio de radiodiagnóstico. Otra limitación viene dada por el hecho de que la mayoría de los países de los que se obtuvo la muestra a estudio presentan una prevalencia alta de la enfermedad, siendo necesario la realización de más estudios en áreas geográficas menos afectadas por el Mycobacterium Tuberculosis.

→Conclusión:

Los autores han desarrollado un programa de IA (DLS) que ha demostrado estadísticamente ha demostrado no ser inferior frente a dos grupos de radiólogos a la hora de diagnosticar TBC activa en una placa de tórax en una muestra con una gran variedad de razas y etnias al incluir pacientes de hasta 5 países.

Este DLS podría facilitar el screening de la TBC en áreas con recursos radiológicos limitados.

Valoración personal:

Me parece un trabajo muy interesante, de gran relevancia en el momento que estamos viviendo actualmente, y que muestra los buenos resultados que se están obteniendo al utilizar los sistemas de Deep Learning en el ámbito sanitario. 

El artículo además se encuentra bien redactado, siendo muy sencillo comprender los múltiples conceptos que expone, lo que lo convierte en una buena primera toma de contacto para cualquiera que aún no se haya introducido en el mundo de la IA.

Además, respecto a los aspectos del estudio retrospectivo, me parece muy relevante el gran número de pacientes que incluye, así como la gran cantidad de imágenes empleadas previamente para configurar el programa. El hecho de que hayan incluido población de diversas partes del planeta, así como la formación de dos grupos de radiólogos para la comparación, me parece todo un acierto.

Miguel Arribas Delgado

Hospital Universitario de Getafe, R3

m.arribasdelgado95@gmail.com

Tagged with: , , , , ,
Publicado en Radiology

Deja una respuesta

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Salir /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Salir /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Salir /  Cambiar )

Conectando a %s

Publicaciones del Club
Residentes SERAM
Autores
A %d blogueros les gusta esto: