Inteligencia artificial en la imagen de cabeza y cuello

Artículo original: Werth K, Ledbetter L. Artificial Intelligence in Head and Neck Imaging: A Glimpse into the Future. Neuroimagin Clin. 2020;30(3):359-368

DOI:  10.1016/j.nic.2020.04.004

Sociedad: Neuroimaging Clinics of North America

Palabras clave: Artificial intelligence, Automation, Deep learning, Head and neck imaging, Machine learning.

Abreviaturas y acrónimos utilizados: AA (aprendizaje automático), IA (inteligencia artificial), RN (redes neuronales), AP (aprendizaje profundo), RNC (redes neuronales convolucionales).

Línea editorial del número: Neuroimaging Clinics es una revista de edición trimestral. En esta edición de agosto se centra en conceptos alrededor de la cabeza y el cuello. Consta de 9 artículos de revisión, de entre los que destaco uno que versa sobre la técnica “Dual Energy TC” (“Dual Energy Computed Tomography in Head and Neck Imaging: Pushing the Envelope”), ya que me suscitó también interés.

Motivo para la selección: La patología de cabeza y cuello puede llegar a ser muy variada y florida, por lo que considero interesante conocer y formarse en las nuevas técnicas de inteligencia artificial aplicadas al radiodiagnóstico en este área anatómica.

Resumen

Aprendizaje automático

El aprendizaje automático (AA) es el subconjunto de inteligencia artificial (IA) más ampliamente utilizado en radiología. El término aprendizaje difiere del de programación; este último, hace alusión a una serie de instrucciones detalladas para obtener a través de una entrada, una salida determinada. El AA, por el contrario aborda situaciones donde no existe claramente una hoja de ruta de programación obvia: la entrada es conocida, pero los pasos óptimos para pasar de la entrada a la salida son desconocidos. Para alcanzar este objetivo en el AA se emplea una arquitectura basada en variables auto-modificables, también conocidas como pesos. El modelo de IA modifica los pesos repetidamente hasta que la salida coincide lo suficiente con el resultado deseado. Por ejemplo, una entrada puede ser una imagen de resonancia magnética potenciada en T2 de la cara y la salida deseada el área segmentada de las glándulas parótidas. El algoritmo manipula la información extraída para intentar clasificar los datos de la imagen original como tejido parotídeo normal versus tejido no parotídeo, y luego compara los resultados con los ejemplos previamente etiquetados de manera correcta (“ground truth”). Se repite el proceso, cada vez cambiando ligeramente los pesos para optimizar los resultados al máximo.

Se distinguen tres clases de algoritmos de AA: supervisados, sin supervisión o por refuerzo (“semisupervisados”). El aprendizaje supervisado es cuando el modelo se entrena con ejemplos etiquetados previamente. En el aprendizaje no supervisado los modelos evalúan los datos de entrada sin el ground truth; la IA intenta encontrar relaciones dentro de los datos y divide los resultados en similares grupos basados en su procesamiento. Por último, el aprendizaje por refuerzo utiliza conceptos de ambos modelos. El modelo inicialmente se construye utilizando datos etiquetados, pero continúa mejorando utilizando datos sin etiquetar.

  • Redes neuronales y aprendizaje profundo.

Una de las arquitecturas de aprendizaje automático más comunes es la de redes neuronales (RN). Estas se modelan tomando como referencia los sistemas neuronales biológicos y constan de múltiples nodos (análogos a las neuronas), dispuestos en capas con amplia interconectividad entre las mismas (axones). La entrada llega a un nodo y se multiplica por un peso. A continuación, cada nodo aplica una función de activación única. Si el valor resultante alcanza un umbral de activación, la información es pasada a los nodos en la siguiente capa.

El aprendizaje profundo (AP) es un subconjunto adicional del AA y de las RN. El AP se refiere al uso de numerosas capas, generalmente ocultas, dentro de la red neuronal; con frecuencia más de 20. El aumento de capas permite obtener más características y más complejas. Los modelos de AP requieren un alto nivel de potencia computacional y sólo han sido viables en las últimas décadas debido a los avances en las unidades de procesamiento de gráficos utilizadas comúnmente para videojuegos.

La orientación de imágenes, la selección de cortes, el movimiento, las rotaciones y variaciones de los tamaños y formas derivan en desafíos para la extracción de características. Aquí es donde aparecen las redes neuronales convolucionales (RNC). Estas, son más robustas en el manejo de variaciones en comparación con otras redes neuronales. En la entrada, los datos de cada capa se pasan a través de filtros, llamadas convoluciones, que reducen los parámetros necesarios para la detección de características. Este tipo de arquitectura domina la computación aplicada a técnicas de visión debido a su poder para manejar variaciones en imágenes. Otras técnicas de AA más sencillas pueden ser más poderosas pero suelen depender de que los datos sean más homogéneos y estandarizados.

Aplicaciones de IA en cabeza y cuello

  • Segmentación en cabeza y cuello

La segmentación se puede utilizar para identificar áreas de interés, patología o anatomía normal. Actualmente, los métodos de segmentación consumen mucho tiempo del operador y/o requieren experiencia en procesamiento en computación. Los modelos de aprendizaje automático se pueden aplicar a segmentación y etiquetado de la anatomía normal, sirviendo como recurso educativo o referencia durante la interpretación de un estudio de imagen. Esto, se ha empleado en la planificación del campo de radioterapia, específicamente con segmentación de anatomía para ayudar a identificar órganos en riesgo con el tratamiento. También se han empleado estas técnicas en la segmentación de tejido anormal en el asesoramiento de dimensiones, volúmenes, análisis de textura o cambios de exámenes previos.

  • Extracción y análisis cuantitativo de las características en imagen (“Radiomics”)

Con una resolución de imagen en constante aumento, cada estudio de la cabeza y el cuello contiene una gran cantidad de información extraíble. Es posible realizar una evaluación de las lesiones, extrayendo características que pueden ser invisibles a la percepción humana, como forma, intensidad y textura. Radiomics es la aplicación de estas cuantificaciones de imágen y la correlación con los marcadores moleculares y el comportamiento clínico de las patologías. Se publicó recientemente la extracción de 525 características radiómicas  a partir de imágenes de resonancia magnética de carcinoma nasofaríngeo junto con 5 características clínicas, consiguiendo predecir con precisión la progresión de la enfermedad en 3 años. Un grupo de investigación evaluó las características radiómicas del carcinoma orofaríngeo y encontró que, la firma radiómica generada por la IA, fue mejor para predecir la recurrencia después de la radioterapia que características clínicas tales como el virus del papiloma humano, el tabaquismo y la edad.

  • Caracterización de nódulos tiroideos

El diagnóstico asistido por computadora de nódulos tiroideos benignos versus malignos en imágenes de ultrasonido, usando un modelo basado en AA, demostró una precisión ligeramente mayor que la interpretación humana. Otro estudio reciente aplicó el AA a las imágenes de TC antes de tiroidectomía para relacionarlo con los marcadores inmunohistoquímicos y el modelo demostró con más del 80% de precisión la presencia tiroperoxidasa, galectina-3 y citoqueratina-19 según el preoperatorio.

  • Detección de la inflamación del complejo osteomeatal

La enfermedad inflamatoria nasosinusal o rinosinusitis se observa frecuentemente en imágenes con TC. Extraer los datos de imágenes para fines de investigación, sin embargo, es un proceso lento y no precisamente exento de desacuerdos interobservador. Específicamente, la imagen nasosinusal contiene una anatomía compleja con variaciones anatómicas únicas, lo cual resulta en dificultad aún mayor para ponerse de acuerdo. Unos investigadores aplicaron un modelo de AP a imágenes de TC axiales y coronales con inflamación nasosinusal y entrenaron el modelo para predecir si el complejo osteomeatal estaba abierto o cerrado. El modelo de prueba logró una clasificación con el 85% de exactitud.

Valoración personal: En mi opinión el artículo es adecuado a modo de introducción en los conceptos de inteligencia artificial aplicados al radiodiagnóstico. También es interesante el enfoque que muestra centrándose en un área anatómica tan variopinta como es la cabeza-cuello. A modo de crítica querría destacar que la figura citada como “Box 1”, contiene unos conceptos que desde mi punto de vista exceden de manera significativa el nivel del resto del trabajo.

 

Pablo Sanz Bellón

Hospital Universitario Marqués de Valdecilla (Santander). R3.

pablosb22@gmail.com

Tagged with: , , , , , ,
Publicado en Revistas

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión /  Cambiar )

Google photo

Estás comentando usando tu cuenta de Google. Cerrar sesión /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión /  Cambiar )

Conectando a %s

Publicaciones del Club
Residentes SERAM
Autores
A %d blogueros les gusta esto: