Artículo original: Bismeijer T, van der Velden BHM, Canisius S, Lips EH, Loo CE, Viergever MA, Wesseling J, Gilhuijs KGA, Wessels LFA. Radiogenomic Analysis of Breast Cancer by Linking MRI Phenotypes with Tumor Gene Expression. Radiology. 2020;296(2):277-87.
DOI: https://doi.org/10.1148/radiol.2020191453
Sociedad: Radiological Society of North America (@radiology_rsna)
Palabras clave: N/A.
Abreviaturas y acrónimos utilizados: RM (resonancia magnética), MARGINS (Multimodality Analysis and Radiologic Guidance in Breast-Conserving Therapy), ARN (ácido ribonucleico), ADN (ácido desoxirribonucleico), FOV (field of view), AF (análisis factorial), ACP/PCA (análisis de componentes principales o principal components analysis), NES (estadístico de enriquecimiento normalizado o normalized enrichment statistic), mTOR (diana de rapamicina en células de mamífero o mammalian target of rapamycin).
Línea editorial del número: En este número de la revista Radiology de la RSNA se incluyen un total de 59 entradas (entre editoriales, artículos, casos por imagen, artículos dedicados al COVID-19 tanto físicos como online y erratas) muy variados. Destacan la gran cantidad de artículos dedicados al SARS-CoV-2, donde se pueden encontrar artículos que tratan, de nuevo, la capacidad de los radiólogos para poder realizar el diagnóstico adecuado, la evolución de los pacientes que han padecido una neumonía por SARS-CoV-2, inteligencia artificial, etc.
Entre el resto me han llamado especialmente la atención algunos artículos como el que he revisado y otros que implican el uso de la RM, donde cada vez más se potencia e investiga la utilidad, correlación clínica y pronóstica de la misma sobre las distintas patologías, destacando uno sobre el corazón (Long-term Prognostic Value of Cardiac MRI Left Atrial Strain in ST-Segment Elevation Myocardial Infarction), y otro sobre la próstata (Prostate Microstructure in Prostate Cancer Using 3-T MRI with Diffusion-Relaxation Correlation Spectrum Imaging).
Motivo de selección: Es un tema relativamente novedoso, que aporta una nueva utilidad a la imagen radiológica y utiliza algunas herramientas estadísticas muy útiles, pero poco conocidas.
Resumen:
Para el estudio del cáncer de mama se utiliza muchas veces la resonancia magnética (RM) tras la administración de contraste, en la cual se investigan varias características (morfológicas, realce, textura,…) de las lesiones a estudio. Los hallazgos obtenidos son consecuencia de una serie de procesos biológicos que ocurren en el propio tumor y que se reflejan en las características radiológicas. Estos procesos biológicos tienen su origen en las alteraciones genéticas que se producen en los tumores, la llamada carcinogénesis, las cuales tienen valor diagnóstico y pronóstico.
En este artículo, se hipotetiza que la imagen obtenida mediante RM es una consecuencia de dichos procesos biológicos subyacentes y que se puede obtener una asociación entre la imagen y la biología molecular implicada en la generación del tumor.
Material y métodos
Las pacientes procedían del estudio MARGINS, un estudio realizado en Holanda entre los años 2000 y 2008. Dichas pacientes optaban a tratamiento conservador de cáncer de mama. El uso de quimioterapia neoadyuvante se consideró un criterio de exclusión al poder implicar alteraciones en la expresión genética nativa de los tumores. Sobre el total, se trabajó sobre una cohorte de pacientes que tenían tanto una RM preoperatoria como información sobre la expresión génica de los tumores (n = 295):
- Las imágenes se obtuvieron mediante la obtención de cinco secuencias pre y tras la administración de contraste en el plano coronal; de dichas secuencias se obtuvieron un total de 21 características o variables de las lesiones.
- La expresión génica se obtuvo mediante una secuenciación del RNA de los especímenes tumorales. Las muestras con escaso material tumoral o poca calidad del RNA obtenido no fueron consideradas como válidas.
Las correlaciones entre las características pueden ser reales o ser debidas a cuestiones técnicas. La situación más clara de este fenómeno estaba en el tamaño tumoral y el resto de variables. Por ejemplo, si existe una correlación entre el tamaño tumoral (imagen RM) y la proliferación tumoral (biología), debido a la relación entre el tamaño y el resto de las características por imagen obtenidas, inferiremos, de forma errónea, que la proliferación tumoral tiene que ver con todas las características obtenidas por imagen.
Para tratar de resolver este problema, se realizó un análisis factorial (AF), un tipo de análisis de componentes principales. Para entenderlo, de forma simplificada, consiste en una técnica que concentra el valor de las distintas variables a estudio, en este caso 21, mediante una función lineal, en un número de componentes que puede variar de 1 a 21, los cuales concentran, en sentido decreciente (el primer componente más que el segundo, el segundo más que el tercero, etc.) la información total de la matriz de datos con la que estamos trabajando. Podemos, por ejemplo, obtener con 3 componentes un 95% de la varianza incluida (y, por tanto, la información) en una matriz de datos con 50 variables.
Para poder realizar dicho AF se realizaron cuatro pasos:
- Primero una transformación de las variables a escalas comparables y normalización de las mismas.
- Segundo, la realización de un análisis de componentes principales (ACP o PCA).
- Tercero, elección de un determinado número de componentes/factores.
- Cuarto y por último, “rotación” (siendo funciones lineales, se pueden rotar sobre un plano) de dichos factores utilizando la rotación varimax.
Finalmente, se realizó el llamado pathway análisis para observar las asociaciones entre los factores (que implican las características por RM) y la expresión génica.
Dicho análisis empieza con una regresión entre el factor y los genes a estudio para ver la fuerza de la asociación, en caso de haberla, entre ellos. Las asociaciones se clasifican de más fuerte a más débil. Si todas o la mayoría de los genes que comprenden un set de genes (gene set) están muy asociadas a determinado factor, se habla entonces de genes enriched o enriquecidos, indicando la fuerte asociación entre dichos genes y el factor.
Aparte de comprobar dicha asociación y su significación estadística, se estudiaron tres scores para cada factor – set de genes: el normalized enrichment statistic (NES) que representaría el tamaño del efecto (effect size), el máximum enrichment statistic (MES), que indica la sensibilidad, y leading Edge, el cual nos muestra la especificidad.
Resultados
Hubo diferencias a la hora de calcular los factores (se eligieron un total de 7) utilizando la cohorte de pacientes completa (n = 598) en comparación con la cohorte reducida que incluía la expresión génica (n = 295) para el tamaño tumoral. También hubo diferencias en las características por RM entre ambas cohortes.
Cada uno de estos componentes o factores tiene unas cargas (loadings) de cada una de las variables y se pueden interpretar como características conjuntas, en este caso de los tumores de mama, que se reflejan en mayor o menor cuantía en los factores:
- Factor 1: tiene las cargas más elevadas en las variables relacionadas con el volumen tumoral, el volumen de realce. Se relaciona con el tamaño tumoral.
- Factor 2: tiene las cargas más elevadas en las variables de velocidad de captación y realce inicial. Se relaciona con el realce precoz de la lesión.
- Factor 3: tiene las cargas más elevadas en las variables relacionadas con los márgenes y la regularidad. Se relaciona con la ”suavidad” o regularidad de tumoral.
- Factor 4: se relaciona con el realce tardío.
- Factor 5: se relaciona con la variación de los márgenes sin/con el realce.
- Factor 6: se relaciona con la forma de la lesión.
- Factor 7: está relacionado con la variación media de la regularidad de márgenes.
Con los factores ya calculados se pudo realizar el pathway analysis, el cual mostró que el factor 1 (tamaño tumoral) se relaciona con varios sets de genes relacionados con el RB transcriptional corepressor 1, cáncer de mama basal-like, cáncer de mama luminal A, dos sets de genes relacionados con el ciclo celular y uno relacionado con los genes encargados de la reparación del ADN. En conjunto, todos estos sets de genes representaban la regulación del ciclo celular y la reparación del ADN. Dichos genes presentaban una asociación fuerte con el tamaño tumoral representado por el factor 1 (un NES alto), también una elevada sensibilidad (MES alto) y una alta especificidad (leading Edge alto). Esta asociación entre la proliferación y el tamaño tumoral también se visualiza a nivel histopatológico, puesto que se ha visto asociación entre el tamaño y el grado tumorales (estando este último asociado a proliferación).
El factor 2 (bajo realce precoz), el factor 3 (escasa irregularidad de los bordes tumorales) o el factor 7 (realce suave, lo cual quiere decir que el valor medio del realce se encuentra alejado del centro tumoral) mostraban relación con un set de genes del ribosoma y otro set de elongación de la cadena peptídica. Ambos indican una expresión elevada de proteínas en los ribosomas. Esta asociación muestra un alto NES, MES y leading Edge.
Por último, el factor 1 inverso (es decir, poco tamaño tumoral), el factor 5 (menos realce suave) y el factor 6 (borde más irregular y menos circular) mostraban una relación con dos sets de genes de colágeno y un set de genes de los proteoglicanos.
Discusión
El estudio mostró viabilidad en su hipótesis puesto que se consiguió relacionar una serie de características de los tumores definidas por RM con determinados patrones de expresión de genes. Estas asociaciones estaban entre los procesos biológicos (proliferación, síntesis proteica y matriz extracelular) con características de las lesiones por RM, en forma de factores (tamaño tumoral, márgenes, agudeza media y forma tumoral).
La asociación más fuerte se mostró entre el tamaño y la proliferación tumorales, hallazgo que refleja la asociación entre tumores con alta proliferación o con mayor tamaño con un mal pronóstico. Otra asociación se encontró entre la captación precoz, la homogeneidad de la captación y los bordes tumorales con la expresión de proteínas ribosómicas, las cuales están implicadas con la ribogénesis (regulada, en parte, por la vía mTOR, diana tumoral). Y, finalmente, la relación entre la homogeneidad de la captación y la forma tumoral con la expresión de genes relacionados con la matriz extracelular y la producción de colágeno.
El descubrimiento de este tipo de asociaciones es muy importante puesto que abre la puerta para, en un futuro, poder utilizar los hallazgos obtenidos por RM para poder dirigir la terapéutica del tumor (por ejemplo, poder relacionar algunos hallazgos con la vía mTOR).
Por tanto, se puede concluir que el estudio muestra la posibilidad de poder llevar a cabo el análisis de determinados tumores y sus vías tumorales mediante el uso de la imagen, en este caso la RM y poder establecer así, en un futuro, fenotipos de tumores mediante RM u otras modalidades de imagen, tanto en el cáncer de mama como en otros tipos de cánceres o lesiones.
Valoración personal:
Aspectos positivos: es un estudio que aporta mucha información sobre cómo relacionar los hallazgos por imagen con los procesos biológicos subyacentes. Utiliza una gran cantidad de herramientas estadísticas útiles y de importancia en el mundo radiológico, especialmente el análisis factorial/análisis de componentes principales, invitando a conocerlas y utilizarlas en estudios próximos cuando sean de utilidad. Es un estudio que ayuda a consolidar la utilidad de la imagen para valorar aspectos biológicos de los tumores. Además, los propios autores describen bastante bien las limitaciones que tiene el propio estudio en cuanto a poder extraer conclusiones y la certeza que se puede tener de las mismas.
Aspectos negativos: Aparte de las mencionadas por el propio estudio (elección de determinados genes para estudiar, uso de una sola muestra tumoral, etc.), destaca el hecho de que del total de pacientes solo se hayan podido incluir en el estudio la mitad, y el hecho de que hubiera diferencias entre las características por imagen de ambas cohortes (la que incluía a todas las pacientes y la que incluía solo a las pacientes con imagen y expresión génica), principalmente, por no poder haber extraído una muestra adecuada, implica una infrarrepresentación, principalmente, de los tumores de pequeño tamaño, pudiendo dar lugar a un sesgo en los hallazgos respecto a la población general. También sería interesante ver la aplicabilidad de estos procedimientos, es decir, hasta qué punto se puede reproducir un estudio como este en la práctica diaria (además, de nuevo, entraría aquí el posible sesgo por excluir a casi la mitad de las pacientes del estudio). Incluso, otra posible fuente de sesgo es la variabilidad poblacional de las expresiones génicas de los distintos cánceres y a su vez su “expresión por imagen”. El artículo en sí, puede hacerse algo pesado al incluir varias técnicas estadísticas complejas y poco conocidas e utilizadas en la práctica diaria.
Nader Salhab Ibáñez
Hospital Clínic Universitari de València, València, R2
Deja una respuesta