Triaje automatizado de radiografías de tórax en adultos con inteligencia artificial.

Posted on 3 marzo, 2020 by Francisco Garrido Sanz — Deja un comentario

Artículo original:

Annarumma M, Withey SJ, Bakewell RJ, Pesce E, Goh V, Montana G. Automated Triaging of Adult Chest Radiographs with Deep Artificial Neural Networks. Radiology. 2019;(14):180921.

DOI: https://doi.org/10.1148/radiol.2018180921

Sociedad: Radiological Society of North America (@RSNA)

Palabras clave: N/A

Abreviaturas y acrónimos utilizados: IA (inteligencia artificial), DL (Deep learning), CNN (convolutional neural network), NLP (natural language processing)

Línea editorial del número:

En el número de abril de la revista Radiology se incluyen 29 artículos clasificados en distintas categorías y varios casos clínicos interesantes. Entre ellos destacaría revisiones como una sobre la enfermedad pulmonar intersticial u otra sobre la forma estandarizada de redactar informes en resonancia magnética para mieloma. Encontramos artículos originales en prácticamente todas las secciones radiológicas, de especial interés una comparación en términos de rendimiento diagnóstico sobre distintas guías para biopsiar nódulos tiroideos según sus características en imagen. Y no menos interesante, artículos sobre temas innovadores como puede ser uno sobre radiómica y su aplicación clínica.

Motivos para la selección:

Considero este artículo de interés por la potencial revolución que puede suponer la incursión de la IA en radiodiagnóstico. También ofrece una posible solución a un problema con el que tenemos que lidiar diariamente como es la sobrecarga de trabajo y el retraso en los informes. Creo que la actualización en ciencias computacionales es necesaria, por lo menos en las bases, en todo profesional del mundo de la radiología. Veo esta revisión como una pequeña introducción al mundo de la IA y una aplicación real y factible de la misma.

Resumen:

La creciente demanda en los departamentos de radiología hace que muchos de los informes tengan cierto retraso, y más en técnicas tan ampliamente usadas como es la radiografía de tórax, la cual se estima que es un 40% del total de pruebas de imagen que se realizan. Entendiendo este problema, se hace necesario un método de priorización sobre ciertos estudios que necesitan ser informados con más precocidad. Hoy en día este triaje va a cargo de los profesionales solicitantes y de los radiólogos, siempre teniendo en cuenta los datos clínicos del paciente. Sin embargo, este método no está exento de discrepancias entre los datos clínicos y los hallazgos en imagen que requieren atención urgente.

Los autores de este artículo proponen un sistema de triaje de placas de tórax, que en función de los hallazgos clasificaría los estudios para informarlos antes o después. Para ello se hace uso de un sistema basado en IA, potenciado con algoritmos de Deep learning (en nuestro caso con redes neuronales convolucionales) que identificarían hallazgos clave en placas de tórax para luego clasificarlos según el grado de urgencia. La idea final es tener un sistema de clasificación en tiempo real de radiografías de tórax, en función de la urgencia de los hallazgos y para dar prioridad a los informes más urgentes.

Por poner en contexto, la IA es la ciencia dedicada a la creación de sistemas que ejecutan tareas que normalmente requieren la inteligencia humana. El DL sería una rama de la IA en la que las máquinas están entrenadas por algoritmos para realizar estas tareas sin una programación previa, es decir, aprenden automáticamente cuales son los hallazgos clave para clasificar los datos proporcionados. En este artículo esos datos fueron los informes digitales de radiografías de tórax, que fueron analizados y clasificados por un algoritmo NPL según la gravedad.

El sistema de clasificación NLP analiza los informes digitalizados y clasifica los hallazgos en 15 categorías (colapso, neumotórax, consolidación, cardiomegalia, etc…) de la patología más frecuente en placa de tórax. Después asigna un nivel de priorización (normal, urgente, no urgente o crítico) según la categoría. Con esta información el CNN es capaz de entrenarse y asociar, en nuevas imágenes, un hallazgo en imagen a una categoría de patología y por tanto a un nivel de urgencia, colocando el estudio para informar antes o después según la misma.

Se realizó el estudio con 470388 radiografías de tórax probando ambos sistemas; de ellas casi un 80% se usaron para entrenamiento del algoritmo CNN, un 10% para pruebas y otro 10% para validación interna. El algoritmo NLP fue puesto a prueba observando los resultados que extraía en una muestra de 4551 informes introducidos manualmente por radiólogos. Asimismo, el sistema de triaje basado en el algoritmo CNN fue testeado con 15887 radiografías. Además, para comprobar el beneficio potencial en la práctica clínica real, se realizó un estudio de simulación en el que se presentaban radiografías para que el algoritmo las ordenase según la urgencia de los hallazgos.

El algoritmo NLP detectó casi todos los hallazgos radiológicos en los informes digitalizados, con sensibilidad y especificidad del 98% y 99% respectivamente. También fue capaz de asignar un nivel de prioridad correctamente con una sensibilidad y especificidad del 90 y 96%. Los resultados del sistema de triaje basado en CNN fueron buenos, aunque no tantos como los que obtuvo el NLP, con resultados variables dependiendo de la categoría (sensibilidad entre 48-76% y especificidad entre 76-95%). En cuanto al estudio de simulación, se comprobó que el tiempo medio de informe de radiografías de tórax urgentes se redujo a la mitad y del de críticas bajo hasta cuatro veces menos, independientemente de la justificación clínica. Aunque no todas las radiografías con hallazgos importantes fueron identificadas por el algoritmo de clasificación, el efecto general de la implementación fue positivo.

Otros estudios se han llevado a cabo con este fin, pero con ciertas limitaciones como no incluir proyección PA y lateral, solo evaluar radiografías normales o no, clasificar en menos categorías de patología, etc… El rendimiento de este sistema de clasificación superó el rendimiento de estos estudios, pero serían necesarios más estudios para mejorar la tasa de clasificación errónea, sobre todo el radiografías urgentes y críticas.

En conclusión, este estudio demuestra y ejemplifica la viabilidad de la inteligencia artificial en la práctica clínica. El sistema de DL desarrollado con las 470388 radiografías de tórax fue capaz de interpretar y priorizar los estudios, de modo que las radiografías anormales con hallazgos críticos o urgentes se podrían poner en cola para informarlas en tiempo real, reduciendo los tiempos de espera.

Valoración personal

Puntos fuertes:

Como punto clave considero la clasificación en tiempo real de radiografías de tórax, tanto en proyección postero anterior como lateral, lo que permitiría un mejor flujo de trabajo y mayor eficiencia en las urgencias. Con este estudio se comprueba la validez de dos sistemas, tanto el algoritmo de reconocimiento basado en DL como el sistema NLP que permite analizar y clasificar los informes de las pruebas de imagen, lo que sin duda es interesante de cara a entrenar otros algoritmos de IA para su uso en radiodiagnóstico.

Puntos débiles:

Este estudio presenta varias limitaciones. En primer lugar, aunque se han obtenido resultados satisfactorios, los casos mal clasificados como normales tendrían que reducirse mucho más. Otro problema que veo es que no se tiene en cuenta el espectro de gravedad de cada categoría de patología, así, no tienen la misma gravedad una atelectasia completa que una segmentaria. Por otro lado, el sistema de priorización no tiene en cuenta el contexto clínico del paciente y tampoco se incluyen pacientes ingresados ni radiografías de niños. Otro de los puntos débiles que le veo es que este algoritmo ha sido puesto en práctica en un centro médico con unos parámetros de adquisición y post procesado comunes, lo que puede resultar en una baja validez externa a la hora usarlo en otros hospitales. Por último, la no uniformidad en cuanto a la redacción de informes puede suponer un problema para el sistema de reconocimiento NLP de cara a su uso global.

Francisco Garrido Sanz.

HU Virgen de las Nieves (Granada), R1

@fransiegarrido

Fragarsan4@gmail.com

Tagged with: Experimental, Inteligencia artificial, R1, R2, R3, R4, Radiología convencional, RSNA, Tórax
Publicado en Radiology, Revistas

Triaje automatizado de radiografías de tórax en adultos con inteligencia artificial.

Tu voto:

Comparte esto:

Deja un comentario Cancelar la respuesta