Modelo de Deep Learning que usa radiografías de tórax para identificar pacientes con tuberculosis y enfermedad pulmonar micobacteriana no tuberculosa: Un estudio transversal

Artículo original: Liu CJ, Tsai CC, Kuo LC, Kuo PC, Lee MR, Wang JY, et al. A deep learning model using chest X-ray for identifying TB and NTM-LD patients: a cross-sectional study. Insights into imaging 2023;14(1):67. 

DOI: https://doi.org/10.1186/s13244-023-01395-9

Sociedad: European Society of Radiology (@myESR). 

Palabras clave: Nontuberculous mycobacteria, Tuberculosis, Chest radiography, Deep learning, Artificial intelligence. 

Abreviaturas y acrónimos utilizados: Área debajo de la curva (AUC), deep learning (DL), enfermedad pulmonar por micobacterias no tuberculosas (NTM-LD), inteligencia artificial (IA), interfaz de programación de aplicaciones (API), radiografía de tórax (CXR), redes neuronales profundas (DNN), tomografía computarizada (TC), tuberculosis (TB), valor predictivo negativo (VPN), valor predictivo positivo (VPP). 

Línea editorial del número: Insights into imaging es la revista oficial de la Sociedad Europea de Radiología (ESR), destacando por su compromiso con la divulgación de conocimientos actualizados sobre la radiología. Esta revista publica de forma continua artículos con acceso abierto a través de la plataforma SpringerOpen. En el mes de abril de 2023 se publicó un total de 20 artículos, la mayoría relacionados con la radiómica e inteligencia artificial. Entre ellos nos encontramos: “Machine learning combined with radiomics and deep learning features extracted from CT images: a novel AI model to distinguish benign from malignant ovarian tumors» el cual presenta un modelo de IA con alto rendimiento en la diferenciación de tumores malignos y benignos de ovarios, usando las características radiómicas y de DL extraídas de imágenes de TC; este otro artículo, “Intra- and peri-tumoral MRI radiomics features for preoperative lymph node metastasis prediction in early-stage cervical cancer”, se centra en la aplicación de la radiómica para predecir metástasis linfáticas preoperatorias en mujeres con cáncer cervical en estadio temprano, con el fin de ayudar a planificar el tratamiento de manera más efectiva. Otro artículo basado en el desarrollo de modelos de aprendizaje profundo para facilitar el diagnóstico de patologías, es el que analizaremos en esta revisión bibliográfica. 

Motivos para la selección: La TB es una enfermedad infecciosa causada por Mycobacterium tuberculosis que puede acarrear un mal pronóstico si no se diagnostica y trata a tiempo. La NTM-LD, por otro lado, es causada por diferentes especies de micobacterias no tuberculosas y también puede tener consecuencias graves. La detección temprana de ambas enfermedades es crucial para el éxito del tratamiento y la prevención de complicaciones. Sin embargo, el diagnóstico a menudo se basa en pruebas de laboratorio. Los hallazgos radiológicos pueden ser comunes y asociar ciertas limitaciones en cuanto a su precisión. En este contexto, el artículo presenta un modelo de DL que utiliza imágenes de CXR para identificar pacientes con TB y NTM-LD. Este modelo se entrenó y validó en un conjunto de datos de pacientes con estas enfermedades, alcanzando una precisión del 83% en la identificación de pacientes con TB y del 86% en pacientes con NTM-LD. Estos resultados sugieren que el modelo podría ser una herramienta útil para la detección temprana de ambas enfermedades, lo que podría mejorar la eficacia del tratamiento y prevenir complicaciones. Esta posibilidad ha sido la principal motivación para analizar el desarrollo de dicho modelo y valorar su aplicabilidad, ya que su uso podría ayudar a superar las limitaciones de las pruebas de diagnóstico tradicionales. 

Resumen: 

La TB y NTM-LD son enfermedades infecciosas pulmonares que afectan a millones de personas en todo el mundo. La detección temprana y el tratamiento adecuado son esenciales para prevenir la propagación de estas enfermedades y mejorar el pronóstico de los pacientes afectos. Las CXRs son una herramienta diagnóstica comúnmente utilizada en la valoración de estos pacientes.  Sin embargo, distinguir la TB pulmonar de la enfermedad NTM-LD sigue siendo un desafío debido a la considerable superposición en los hallazgos clínicos y radiográficos. Esto genera la necesidad de desarrollar una herramienta eficiente y de bajo costo que permita distinguir entre la TB pulmonar y la enfermedad NTM-LD. La rápida evolución de la IA en los últimos años, ha demostrado resultados prometedores en la detección de TB pulmonar en CXR. La mayoría de los modelos desarrollados demostraron su utilidad en la clasificación entre la TB y pacientes sanos. El objetivo de este estudio es avanzar en el proceso de detección y clasificación, desarrollando un modelo de DNN que permita distinguir pacientes con TB y NTM-LD. 

Métodos:

El estudio se llevó a cabo en dos hospitales desde septiembre de 2008 hasta diciembre de 2019. En él se seleccionaron pacientes con TB (cultivo positivo en muestras respiratorias), NTM-LD (diagnóstico basado según la guía actual) u otras enfermedades pulmonares aparentemente micobacterianas pero con al menos tres esputos consecutivos negativos para micobacterias por lo que se le denominó “grupo imitador”. Las CXRs de estos pacientes se almacenaron digitalmente y se excluyeron aquellas que tuvieran una proyección anteroposterior o mostraran dispositivos médicos. 

Para desarrollar modelos de DNN, se utilizó el lenguaje Python y la librería Tensorflow con la API de Keras. Además, se apoyó en la red pre-entrenada DenseNet121, transfiriendo el aprendizaje al modelo. En el estudio se seleccionaron un total de 1500 CXRs (500 por cada grupo: TB/NTM-LD/imitador). Se asignaron 900 para la cohorte interna (300 de cada grupo) y 600 para la cohorte externa (200 de cada grupo). 

  • Las 900 CXRs de la cohorte interna se dividieron aleatoriamente en tres conjuntos: entrenamiento (n = 220 para cada grupo), validación interna (n = 40 para cada grupo) y prueba interna (n = 40 para cada grupo).
  • Las 600 CXRs de la cohorte externa se usaron para evaluar el modelo entrenado. 

Paralelamente, se llevó a cabo un estudio comparativo entre el rendimiento del modelo DNN y el de los neumólogos en el diagnóstico de estas enfermedades. Para ello, se reclutaron 12 neumólogos, 6 con más de 10 años de experiencia en el manejo de pacientes con enfermedades pulmonares micobacterianas y 6 con menos de 10 años de experiencia. Estos médicos, que desconocían la información clínica, evaluaron de manera independiente las mismas 120 radiografías del conjunto de pruebas internas y diagnosticaron si se trataba de TB, NTM-LD o un imitador, basándose en los hallazgos de la CXR. En la radiografía analizaban fundamentalmente el patrón (consolidación, cavitación, derrame pleural u otros) y extensión (multifocal o focal). 

El modelo fue evaluado en tres diferentes escenarios de prevalencia de enfermedades micobacterianas. Se calcularon varias medidas de rendimiento, incluyendo: AUC, sensibilidad, especificidad, VPP, VPN y reducción de pruebas adicionales (como TB-PCR). Además, se evaluó la importancia de la inclusión de pacientes con NTM-LD en el desarrollo del modelo DNN comparándolo con un modelo análogo desarrollado sólo con pacientes con TB e imitadores.

El análisis estadístico incluyó la prueba ANOVA para variables continuas y la prueba de Chi-Cuadrado para variables categóricas. El rendimiento del DNN se evaluó utilizando la precisión de diagnóstico y las matrices de confusión. 

Para la visualización de los resultados, se usó Grad-cam. En el artículo se pueden ver casos representativos de mapas de calor resultantes de miembros de cada uno de los grupos. 

Resultados:

En los tres grupos predominó la población masculina. Acorde a los hallazgos en CXRs, los pacientes con TB tenían una mayor tasa de derrame pleural y en los pacientes con NTM-LD era más probable la presencia de bronquiectasias. 

El rendimiento de las DNN fue similar para cada grupo. Para el test interno, se adquirió un AUC de 0.83 ± 0.005 para TB, 0,86 ± 0,006 para NTM-LD y 0,77 ± 0,007 para el grupo imitador. Cuando se aplicó el test externo, el modelo logró un AUC de 0,76 ± 0,006 para TB, 0,64 ± 0,017 para NTM-LD y 0,74 ± 0,005 para el grupo imitador. 

El modelo DNN logró una tasa de precisión media más alta en la clasificación de las 3 clases en comparación con los expertos humanos (66,5 ± 2,5% VS 49,2 ± 3,4%, p < 0,001). Al observar los tres grupos individuales, el DNN tiene un 18% más de precisión en la predicción de TB (74,0% vs. 55,6%, p < 0,001) y es el doble de preciso en la detección de NTM-LD (65,0% vs. 32,7%, p < 0,001) que los neumólogos. No se detectó ninguna diferencia significativa entre los médicos y el DNN en la predicción de los “imitadores” (59,2% vs. 60,6%, p = 0,816). Por otro lado, se examinó el coeficiente de correlación intraclase (ICC) de los neumólogos y el DNN. En el conjunto de pruebas internas, la puntuación del ICC es de 0,244 (IC del 95%: 0,188-0,312) para los 12 médicos y de 0,799 (IC del 95%: 0,754-0,841) para el DNN.

Discusión:

El modelo de DL pudo distinguir pacientes con TB y NTM-LD mediante CXR y superó significativamente a los neumólogos expertos. Además, el modelo fue capaz de proporcionar un adecuado rendimiento incluso en entornos con diferentes prevalencias micobacterianas. Este estudio destaca el potencial de los modelos basados en DNN como herramientas de cribado para reducir el aislamiento aéreo innecesario y el tratamiento inapropiado de los pacientes con NTM-LD. Con ello, este estudio enfatiza en la necesidad de incluir pacientes con NTM-LD en el desarrollo de estos modelos, ya que su prevalencia no es despreciable en la población. Por otro lado, este estudio ha incluido un grupo control (grupo imitador), que hace más desafiante la tarea de distinguir pacientes con TB y NTM-LD de múltiples enfermedades imitadoras, lo cual es común en la práctica clínica real.

Sin embargo, el estudio también tiene limitaciones, como no incluir un grupo de control de pacientes sanos o pacientes con coinfección TB y NTM-LD en el estudio. Otra limitación ha sido la intervención de neumólogos, en lugar de radiólogos experimentados. Además, no se les ha proporcionado casos de entrenamiento adicional antes del estudio de lectores, por lo que la métrica de precisión podría haberse infraestimado para los neumólogos.

Valoración personal: 

El artículo presenta un enfoque innovador y útil para el diagnóstico de enfermedades pulmonares mediante el uso de un modelo de DL basado en CXR. Los resultados del estudio son muy interesantes, ya que el modelo de DNN superó significativamente la tasa de precisión de los expertos. 

Entre las fortalezas del estudio se encuentran las explicaciones detalladas sobre el funcionamiento interno del modelo, acompañado de tablas y gráficos, que facilitan su comprensión. Por otro lado, la inclusión de un grupo de pacientes «imitadores» permite evaluar la capacidad del modelo para distinguir entre diferentes enfermedades pulmonares y reducir los errores de diagnóstico. Además, es muy interesante que se compare con otros estudios similares, insistiendo en la importancia de incluir pacientes con NTM-LD en el conjunto de entrenamiento. Por último, la visualización de los mapas de calor proporciona información útil para los usuarios del modelo, ya que permite descubrir lesiones no detectadas.  

Entre los puntos débiles del estudio nos encontramos la falta de un grupo de control de pacientes sanos para evaluar la capacidad del modelo para distinguir entre la ausencia y la presencia de enfermedad pulmonar. Por otro lado, la evaluación de los resultados se realizó en un conjunto de datos limitado, lo que podría afectar la generalización de los hallazgos a otros grupos de pacientes y entornos clínicos. Del mismo modo, los neumólogos que participaron en el estudio no representan necesariamente a todos los neumólogos, y los resultados podrían ser diferentes si se hubieran utilizado diferentes médicos para la comparación, como podrían ser radiólogos experimentados. Esto podría afectar a la capacidad para identificar patrones radiográficos y, por lo tanto, influir en la precisión de la evaluación del modelo.

Tania Marlem Chico González

Hospital Universitario de Canarias, Tenerife, R3.

tania.cg94@gmail.com

Tagged with: , , , ,
Publicado en Insights into Imaging

Deja una respuesta

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Salir /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Salir /  Cambiar )

Conectando a %s

Publicaciones del Club
Residentes SERAM
A %d blogueros les gusta esto: