Diagnóstico diferencial de nódulos tiroideos benignos y malignos mediante radiología y deep learning de imágenes de ecografía tiroidea

Artículo original: Hui Zhou, Ying Hua Jin, Lei Dai, Meiwu Zhang, Yuqin Qiu, Kun wang, Jie Tian, Jianjun Zheng. Differential Diagnosis of Benign and Malignant Thyroid Nodules Using Deep Learning Radiomics of Thyroid Ultrasound Images. European Journal of Radiology.Volume 127(2020) 108992.

DOI: https://doi.org/10.1016/j.ejrad.2020.108992

Sociedad: European Journal of Radiology,  @ELS_Radiology

Palabras clave: Thyroid nodules, Thyroid ultrasound, Deep learning, Ultrasound,  Radiomics, Diagnosis

Abreviaturas: DLRT (Aprendizaje profundo en radiómica del tiroides), CNN (red neuronal convolucional), TL (aprendizaje de transferencia), ROC (curva característica de funcionamiento del receptor), AUC (área bajo curva), CI (intervalo de confianza), PAAF (Punción Aspiración con aguja fina), ROI (región de interés), LEVA (mapa de activación de clase ), PPV (valor predictivo positivo) y  VPN (valor predictivo negativo).

Línea editorial del número:

En este nuevo número de la European Journal of Radiology publicado en junio de 2020, vuelve a aparecer como tema estrella el COVID 2019 como eje de la publicación, con un protagonismo de 5 artículos monográficos sobre la pandemia. Además incluye un artículo muy interesante sobre la planificación prequirúrgica con ayuda de modelos 3d en disfunción femoropatelar así como varios artículos sobre inteligencia artificial (tema siempre recurrente) y sobre el controvertido índice kappa interobservador que tantos quebraderos de cabeza nos da a los radiólogos.  Especial mención merece un interesante artículo de investigación sobre imágenes de traumatismos en la unión cráneo-cervical, con un elenco de ilustraciones maravillosas sobre este tema.

Motivos para la selección:

Es un tema que siempre merece la pena revisar pues es tan habitual como importante su diagnóstico en el día a día. La inmensa cantidad de estudios ecográficos centrados en el nódulo tiroideo puede abrumar al que inicia sus estudios en ecografía cervical; tanto lo apasionante de su fisiopatología como las implicaciones de hacer un correcto diagnóstico son enormes y, una vez más, el Deep learning (aprendizaje profundo), nos viene a aportar ayuda y luz en un tema que nunca termina de completarse del todo.

Resumen:

El objetivo del estudio es proponer un modelo eminentemente automático y objetivo denominado Radiomics of Thyroid (DLRT), basado en Deep learning, que se centra en el diagnóstico diferencial de los nódulos tiroideos benignos y malignos de las imágenes de ecografía.

Los nódulos tiroideos se definen como lesiones radiológicamente distintas del parénquima tiroideo circundante y se detectan en hasta el 65% de la población general. La gran mayoría de ellos son benignos pero hasta un 10% de los pacientes que presentan nódulos tiroideos tienen riesgo de malignidad. Además, la incidencia de cáncer de tiroides ha aumentado continuamente en todo el mundo, lo que lleva a aumentar el interés en precisar el diagnóstico lo máximo posible.

Pese a que la PAAF se acepta como gold estándar para el diagnóstico definitivo de los nódulos tiroideos benignos y malignos, es un proceso invasivo y limitado por la recolección de muestras y la experiencia del operador. Actualmente, en EE. UU., la  primera opción clínica de detección de nódulos tiroideos es la ecografía, debido a su alta sensibilidad, no radiactividad, facilidad de uso y rápido diagnóstico.  Las pautas de la American Thyroid Association (ATA) resaltan la importancia de la ecografía en la detección de nódulos tiroideos, así como se enfatiza desde la Sociedad Europea de Oncología (ESMO) en emplearla como método de diagnóstico de primera línea.

Para diferenciar los tumores malignos de los nódulos tiroideos benignos se describe que una apariencia quística o espongiforme generalmente sugiere nódulo benigno y  solo necesitaría un seguimiento a largo plazo; mientras que la composición sólida, la hipoecogenicidad, los márgenes infiltrativos o irregulares y las microcalcificaciones generalmente se consideran factores de riesgo de malignidad pudiendo necesitar tratamiento adicional, como la resección.

La sensibilidad y la especificidad de la ecografía para el diagnóstico de cáncer de tiroides varía del 27% al 63% y del 78,0% al 96,6% en diversos estudios, lo que probablemente se deba a la variabilidad interobservador a la asignación de características ecográficas a los nódulos y a que la ecografía depende mucho del operador.

En la actualidad, una tecnología emergente llamada radiómica, basada en el aprendizaje automático, puede extraer y analizar miles de características de imagen calculadas cuantitativamente de imágenes médicas, lo que tiene el potencial de revelar características de la enfermedad que los humanos no pueden reconocer a simple vista en la práctica diaria. Sería adecuado investigar si un enfoque desde este punto de vista puede hacer un mejor uso de las imágenes y así lograr un diagnóstico más preciso para diferenciar los nódulos tiroideos malignos de los benignos.

En este estudio se desarrolla un método de aprendizaje de transferencia basado en la red neuronal convolucional (CNN) para el análisis cuantitativo de imágenes de ultrasonido de tiroides. Es un enfoque de aprendizaje profundo (Deep Learning) que no requiere segmentaciones manuales complicadas de los límites de los nódulos tiroideos.

Se desarrollan tres modelos de radiología basados ​​en el aprendizaje profundo:

  • el modelo CNN básico
  • el modelo TL
  • el DLRT.

Se analizan retrospectivamente imágenes ecográficas y datos de citología PAAF de 1750 nódulos tiroideos para comparar sus rendimientos. Su precisión diagnóstica se comparó con los observadores humanos y se investigó la validez sobre diferentes instrumentos de imágenes de ultrasonido.

En ambas cohortes la DLRT demostró mayor precisión diagnóstica en comparación con el modelo básico CNN y TL. Las AUC de DLRT resultaron en un  0,96 (IC 95%: 0,94-0,98), 0,95 (IC 95%: 0,93-0,97) y 0,97 (IC 95%: 0,95-0,99) respectivamente en cuanto a validez interna y externa, y fueron significativamente mejores que los otros dos métodos (ambos P<0.01).

El modelo TL mostró la segunda precisión diagnóstica más alta y el modelo CNN básico fue el peor. Además de estos, otra característica única de DLRT fue que su sensibilidad era mejor que la de los otros dos modelos, lo que es favorable para el cribado clínico de nódulos malignos. Estos resultados indicaron que la estrategia de múltiples ROI hizo una contribución crítica para la mejora de la precisión, porque permitió un análisis independiente dirigido a regiones dentro y fuera de cada nódulo tiroideo.

Además, con un ajuste parcial mediante el aprendizaje por transferencia, un modelo de radiología de Deep learning previamente entrenado diseñado para imágenes ecográficas, se puede aplicar de manera efectiva para otro escenario de diagnóstico en ecografía, siendo  incluso mejor que volver a entrenar todo el modelo desde cero.

Después de la comparación con observadores humanos, la DLRT ofreció una sensibilidad y especificidad significativamente mejores que los radiólogos ( P<0,001).

El DLRT realizó, en definitiva, un diagnóstico diferencial preciso y confiable de nódulos tiroideos benignos y malignos.

Después de observar su patrón analítico en los mapas de calor transferidos, se comprobó que el parénquima adyacente que rodeaba el nódulo era vital para la clasificación, especialmente para casos complejos para el ojo humano.

El trabajo demostró varias ventajas sobre otros estudios que intentaron diferenciar los nódulos malignos y benignos mediante el análisis asistido por computadora en imágenes de tiroides por ecografía. La mayoría de estos estudios utilizaron características ecográficas definidas por el ser humano y basado en aprendizaje automático, lo que inevitablemente trajo un trabajo intensivo para extraer características de las imágenes ecográficas.

DLRT realiza un enfoque de extremo a extremo altamente automático. Solo requirió un clic del ratón en el centro del nódulo como disparador manual. Luego, extrae automáticamente miles de características definidas por ordenador y adopta un patrón basado en Deep learning para optimizar el modelo de diagnóstico. Así pues, se puede integrar sin problemas en el flujo de trabajo convencional de los exámenes de tiroides ecográficos sin tiempo adicional ni costes de mano de obra.

Este método DLRT podría incorporarse en dispositivos de ultrasonido para proporcionar resultados de diagnóstico auxiliar para observadores clínicos.

El estudio presenta varias limitaciones:

  1. Los datos sólo provienen  de un solo centro y por lo tanto el rendimiento de DLRT necesita ser validado en un estudio multicéntrico. Es necesario un conjunto de datos más grande adquirido de diferentes hospitales con más tipos de ecógrafos para formar una cohorte de capacitación más integral, de modo que la precisión y confiabilidad de DLRT se pueda mejorar continuamente para cada ecógrafo.
  2. Es un estudio retrospectivo, por lo que cuenta con datos ya analizados y tratados, lo que no resulta tan extrapolable como si lo hiciésemos de forma prospectiva.

Conclusión

El artículo consigue demostrar que el DLRT logra el diagnóstico diferencial más preciso de los nódulos tiroideos benignos y malignos en comparación con otros modelos de aprendizaje profundo y que los diagnósticos realizados por observadores humanos. Su rendimiento no se vio afectado por diferentes ecógrafos por lo que tiene un buen potencial para mejorar la eficacia diagnóstica general en los exámenes de rutina de tiroides por medio de la ecografía.

Valoración personal:

Se trata de un artículo muy interesante debido a que toca dos temas muy de actualidad; por un lado ofrece al lector una actualización sobre el diagnóstico diferencial de los nódulos tiroideos benignos o malignos y por otro, realiza una puesta en escena de lo que nos vamos a formar en las próximas décadas, el Deep Learning.

Puntos fuertes:

El artículo ilustra las principales ideas mediante fotografías de los nódulos así como de las principales variables que utiliza el aprendizaje profundo para la evaluación de lesiones. Es un tema actual y atractivo, lo que mejora la lectura del mismo.

Puntos débiles:

Al ser un estudio tan limitado por tratarse de un centro único y ser un estudio retrospectivo, se puede caer en la consideración de que es poco fiable. En cualquier caso ofrece unos resultados esperanzadores al respecto.

 

Ramón de la Torre Colmenero

R2 Hospital Universitario de Puerto Real

ramondelatorrecolmenero@gmail.com

Tagged with: , , , , , ,
Publicado en Revistas

Deja una respuesta

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Salir /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Salir /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Salir /  Cambiar )

Conectando a %s

Publicaciones del Club
Residentes SERAM
Autores
A %d blogueros les gusta esto: