Precisión del diagnóstico generado por ChatGPT a partir de la historia clínica del paciente y de los hallazgos de imagen en casos de neurorradiología

Artículo original: Horiuchi, D., Tatekawa, H., Shimono, T. et al. Accuracy of ChatGPT generated diagnosis from patient’s medical history and imaging findings in neuroradiology cases. Neuroradiology 2023 (11). 

DOI: https://doi.org/10.1007/s00234-023-03252-4

Sociedad: European Society of Neuroradiology (@JNeurorradiology).

Palabras clave: Artificial intelligence, Chat Generative Pre-trained Transformer (ChatGPT), Generative Pre-trained Transformer (GPT)-4, Large language models.

Abreviaturas y acrónimos utilizados: ChatGPT (Chat Generative Pre-trained Transformer), IA (inteligencia artificial), SNC (sistema nervioso central). 

Línea editorial: Neuroradiology es la revista oficial de la European Society of Neuroradiology y de otras 20 sociedades nacionales más de neurorradiología incluyendo la española. Se trata de una revista de publicación mensual en la que tienen especial importancia los artículos de investigación originales. Abarca todos los aspectos de la neurorradiología del cerebro, la columna vertebral y la base del cráneo tanto de adultos como de niños, así como aspectos técnicos y clínicos del campo de la neurorradiología intervencionista. 

La publicación actual corresponde con un artículo publicado online en noviembre del 2023 no incluido en ningún volumen de la revista hasta esta fecha. 

Motivos para la selección: los motivos que me han llevado a revisar este artículo sobre IA, en concreto sobre el ChatGPT, es que se trata de un tema vigente, en continua expansión y con un amplio horizonte por explorar. Hasta la fecha no había leído ningún artículo sobre el papel del ChatGPT en la realización de diagnósticos, por lo que el artículo me ha parecido innovador e interesante. Debemos estar familiarizados con las potenciales aplicaciones de la IA ya que formarán parte de nuestro día a día como radiólogos. 

Resumen:

Introducción

ChatGPT es un modelo lingüístico avanzado de IA con capacidad para comprender y generar respuestas similares a las humanas. Ha demostrado su utilidad en numerosos campos, con una gran variedad de industrias y profesionales considerando su implementación para mejorar la eficiencia y los procesos de toma de decisiones.

La IA es cada vez más usada en radiología y ya se han descrito algunas aplicaciones del ChatGPT en este campo. Dado que la neurorradiología es un campo amplio que requiere conocimientos especializados y experiencia, integrar el ChatGPT en su práctica habitual puede potencialmente disminuir los errores diagnósticos y mejorar la precisión

Material y métodos

El objetivo del estudio era evaluar el rendimiento diagnóstico de ChatGPT en neurorradiología a partir de la historia clínica del paciente y los hallazgos de imagen para cada caso, haciendo un especial énfasis en las diferentes etiologías de las enfermedades.

Para ello se recopilaron 100 casos consecutivos extraídos del ‘’Caso de la semana’’ de la American Journal of Neuroradiology entre octubre de 2021 y septiembre de 2023. Cada caso se clasificó por localización anatómica (cerebro, columna vertebral y cabeza y cuello). A su vez, los casos cerebrales se dividieron en dos grupos: grupo de tumores del SNC y grupo de no tumores del SNC (causas metabólicas, infecciosas, inflamatorias, degenerativas, desmielinizantes…).  

Se extrajeron los diagnósticos diferenciales y finales generados por ChatGPT y se interpretaron las tasas de respuestas correctas. Se realizó un análisis estadístico para comparar las tasas de precisión entre las 3 localizaciones anatómicas y entre el grupo tumores del SNC y el grupo no tumores del SNC. 

Resultados y discusión

En el 100% de los casos ChatGPT generó diagnósticos diferenciales y un diagnóstico final, con una media de 3,8 diagnósticos diferenciales por caso.

La precisión diagnóstica final fue del 50% mientras que la precisión del diagnóstico diferencial fue del 63%. Atendiendo a la localización anatómica no se identificaron diferencias significativas entre las tasas de precisión (p=0.89), por lo que podría utilizarse independientemente de la localización de la patología.

En cambio, al comparar el grupo tumores del SNC con el grupo no tumores del SNC se observó que existían diferencias significativas, con una menor tasa de precisión tanto en el diagnóstico final como diferencial en el grupo de tumores del SNC. Una explicación de esta menor precisión puede ser la gran variedad de tipos histopatológicos y diferentes hallazgos de imagen. 

Atendiendo a las diferentes etiologías incluidas dentro del grupo no tumores del SNC las causas metabólicas (71%), cerebrovasculares (62%) y degenerativas (60%) demostraron tener una mayor precisión en el diagnóstico final que el resto de las etiologías. Estas tasas de precisión relativamente más altas pueden deberse a las palabras clave características de las historias clínicas y los hallazgos de imagen específicos de estas enfermedades. La tasa de precisión más baja se observó en el subgrupo de etiología inflamatoria (50%). 

Debido al importante desarrollo de la radiología, el volumen total de exámenes ha aumentado notablemente suponiendo una mayor carga de trabajo para los radiólogos y un potencial incremento de los errores diagnósticos. La utilización de ChatGPT como herramienta de apoyo al diagnóstico tiene el potencial de aumentar la eficacia general, reducir los errores diagnósticos y en última instancia mejorar los resultados de los pacientes

Valoración personal:

Es un artículo breve, fácil de leer, que aborda las potenciales utilidades del ChatGPT en el campo de la neurorradiología como herramienta diagnóstica y como sistema de apoyo en la toma de decisiones, teniendo en cuenta su rendimiento actual, sus puntos fuertes y sus limitaciones para una óptima utilización.

Se trata de un tema muy novedoso ya que los propios autores reconocen que no existen casi artículos previos sobre esta materia. Es por esto último que como principal limitación se encuentra no disponer de otros datos con los que comparar los resultados de este estudio. Otra limitación es que no se valora la capacidad de ChatGPT de extraer hallazgos de las imágenes médicas ya que se proporcionan las descripciones de las imágenes. 

Silvia Revuelta Gómez

Hospital Universitario Marqués de Valdecilla, R2

silviarevueltagomez@gmail.com 

@silviarevueltag

Tagged with: , , , ,
Publicado en European Society of Neuroradiology

Deja un comentario

Publicaciones del Club
Residentes SERAM
Autores