Aprendizaje automático semi-supervisado para la generalización de detección y segmentación de hemorragia intracraneal

Artículo original: Lin, E., & Yuh, E. L. (2024). Semi-supervised Learning for Generalizable Intracranial Hemorrhage Detection and Segmentation. Radiology: Artificial Intelligence, 6(3), e230077. https://doi.org/10.1148/ryai.230077

DOI: https://doi.org/10.1148/ryai.230077

Sociedad: Radiological Society of North America (@RSNA)

Palabras clave: Semi-supervised Learning, Traumatic Brain Injury, CT, Machine Learning. 

Abreviaturas y acrónimos utilizados: AUC-ROC (Área bajo la curva ROC), IA (Inteligencia Artificial), TC (Tomografía Computarizada).

Línea editorial:  La revista bimestral Radiology: Artificial Intelligence, que forma parte de la RSNA, incide en las aplicaciones emergentes del Machine Learning y de la IA en el campo de la imagen de múltiples disciplinas. Entre sus objetivos se encuentran: mostrar aplicaciones nuevas, explicar metodologías innovadoras para trabajar con IA y demostrar el impacto que tiene la IA en el diagnóstico y manejo de los pacientes. Publica en su número 3 del volumen 6 (mayo de 2024) más de 15 artículos. El tema sobre el que más se ha incidido en este número es el cáncer de mama. Se incluyen dos investigaciones originales con modelos de IA, una sobre la detección del cáncer de mama por tomosíntesis, y otra sobre el cribado con mamografía en Noruega. Además, dos comentarios de autor versan sobre la implicación de la IA en la tomosíntesis y en el cribado con mamografía. Otros artículos de investigación original han abordado el screening del cáncer de pulmón, la segmentación automática de estructuras de fosa posterior en la evaluación de parálisis supranuclear progresiva y otro espectro de enfermedades neurodegenerativas, el efecto de la implementación de algoritmos de reconstrucción de imágenes de RM, detección y segmentación de hemorragia intracraneal, entre otros. Destaca por su complejidad y ambición un artículo de investigación de desarrollo de un modelo de IA para predecir el estado de mutación del gen BRAF en gliomas de bajo grado pediátricos a partir de imágenes de RM. Mención aparte a un reporte especial sobre el reto que ha supuesto para la RSNA organizar una competición anual de Inteligencia Artificial desde 2017 incidiendo en los problemas como la obtención de bases de datos de alta calidad.

Motivos para la selección: Se trata de un artículo que versa sobre una patología muy frecuente a la que los residentes están expuestos en cada guardia. Este tipo de modelos podrían cambiar la forma de trabajar en el futuro respecto a la hemorragia intracraneal aguda. Además, es un trabajo enriquecedor desde el punto de vista técnico para los interesados en el desarrollo de modelos de IA, incidiendo en el aprendizaje semi-supervisado.

Resumen: 

La detección de pequeñas hemorragias intracraneales puede ser una tarea difícil que requiere de mucha experiencia. Los algoritmos de IA de detección de hemorragia intracraneal se encuentran con la dificultad de la amplia variedad entre los parámetros de las diferentes TC de las casas comerciales y el ruido que suele haber en estos estudios. Por tanto, hay un problema de generalización del algoritmo a diferentes circunstancias. El método de aprendizaje semi-supervisado no se ha utilizado hasta la fecha para tratar de mejorar la generalización de un modelo de IA en la detección de hemorragia intracraneal. El objetivo de este estudio es desarrollar y evaluar un modelo de aprendizaje semi-supervisado para la detección y segmentación de hemorragia intracraneal, comparándolo con un modelo de aprendizaje supervisado.

A continuación, se ofrece una breve explicación para los que no estén familiarizados con el semi-supervised noisy student learning paradigm, o “modelo del estudiante ruidoso semi-supervisado”, que se aplica en este estudio. Consiste en enseñar a un primer modelo (“modelo profesor”) con datos etiquetados (aprendizaje supervisado). Una vez este modelo haya aprendido de manera supervisada, se empleará para clasificar datos no etiquetados, otorgándoles pseudo-etiquetas. Utilizando una mezcla de datos etiquetados y pseudo-etiquetados por el modelo profesor, se enseñará a un segundo modelo (“modelo estudiante”) después de aplicar técnicas que aumenten el ruido y hagan más difícil su aprendizaje, siempre con un tamaño igual o mayor al del modelo profesor. Finalmente, como se trata de un proceso iterativo, el modelo estudiante pasará a su vez a ser un nuevo modelo profesor que enseñará a futuros nuevos estudiantes.

Como base de datos etiquetados se utilizaron 457 escáneres de la base “Atlantis”. De esta base, el 26,7% presentaban hemorragia intracraneal. Dos neurorradiólogos con 15 y 10 años de experiencia anotaron las áreas de hemorragia. La base de datos no etiquetados (“Kaggle-25K”) incluyó más de 25000 TC de cráneo. También se usó una base de datos de validación de 93 TC de cráneo de hospitales diferentes a los de las otras dos bases. Finalmente, para examinar al modelo estudiante creado se utilizó una base de datos de prueba o test de un hospital de India (“CQ500”), evaluando la generabilidad del estudiante y comparándolo con un modelo supervisado como referencia.

Hay que destacar en la metodología del “estudiante ruidoso” empleada en este estudio, que se utilizaron tres estrategias diferentes de aumento de ruido como un ajuste del contraste de imagen diferente en cada TC. Además, para disminuir falsos positivos, se utilizó un valor límite de probabilidad de hemorragia en las pseudo-etiquetas del modelo profesor, considerando por encima hemorragia intracraneal y por debajo no hemorragia (proceso llamado ranker). El modelo semi-supervisado se desarrolló con PatchFCN (redes neuronales). Como análisis estadístico se comparó con un modelo supervisado (baseline model), empleando el área bajo la curva-ROC, índice de similitud de Dice y diferentes métricas de precisión.

Resumiendo los resultados más destacables, el modelo semi-supervisado obtuvo un mayor rendimiento que el modelo supervisado, con un AUC-ROC de 0.939 vs 0.907 (P<0.001). También demostró un mejor coeficiente de similitud de Dice: 0.848 vs 0.828 (P<0.001).

En conclusión, los autores de este trabajo, apelando a que una de las mayores limitaciones de los modelos de IA es su capacidad de generalización, han demostrado que el modelo semi-supervisado puede mejorar la generalización en la detección y segmentación de la hemorragia intracraneal en TC. También se ha mostrado la importancia que suponen el aumento de ruido y establecimiento de un rango límite de valores de probabilidad (ranker) en este tipo de modelos de aprendizaje. 

Valoración personal:

Se trata de un artículo complejo con una metodología muy técnica, pero del cual se pueden extraer enseñanzas útiles. En primer lugar, es un ejemplo del paradigma de modelo semi-supervisado “estudiante ruidoso” (semi-supervised noisy student learning), revisando apartados como la introducción de ruido o el establecimiento de rango límite de valores (ranker). Como puntos fuertes, la metodología es muy estricta y utilizan diversas bases de datos, siendo la de testeo de un continente diferente a las de desarrollo, haciendo énfasis en la evaluación de la generalización del modelo.

Los autores mencionan varias limitaciones, como el tamaño significativamente mayor de los datos no etiquetados respecto a los etiquetados. Además, el workflow de este estudio requeriría entrenar de cero al modelo ante nuevos aumentos en la base de datos no etiquetados, realidad que ocurre cada día en la práctica clínica, requiriendo gran capacidad computacional.

Alberto Ramírez García-Mina

Hospital Universitario Puerta de Hierro, Majadahonda, R3

albert_unit96@hotmail.com

Tagged with: , , , , , , ,
Publicado en Radiology: Artificial Intelligence

Deja un comentario

Publicaciones del Club
Residentes SERAM
Autores