La búsqueda global no está activada.
Salta al contenido principal
Foro

Foro de debate módulo 2

¿Pueden influir en los resultados las técnicas de procesamiento y normalización del ARN-seq seleccionadas?/Can the RNA-seq processing and normalization techniques selected influence the results?

¿Pueden influir en los resultados las técnicas de procesamiento y normalización del ARN-seq seleccionadas?/Can the RNA-seq processing and normalization techniques selected influence the results?

de Coral del Val Muñoz - Número de respuestas: 3

En el campo de la genómica, la secuenciación del ARN (ARN-seq) se ha convertido en una herramienta fundamental para estudiar la expresión y regulación de los genes. Sin embargo, la complejidad de los datos de ARN-seq requiere un procesamiento y una normalización cuidadosos para garantizar una interpretación precisa. Existen diferentes métodos de procesamiento y normalización de ARN-seq para hacer frente a estos retos. Estos métodos van desde procedimientos básicos de control de calidad y alineación hasta técnicas de normalización más sofisticadas diseñadas para ajustar la variabilidad entre muestras y experimentos. Técnicas como Counts Per Million (CPM), Transcripts Per Million (TPM) y Reads Per Kilobase Million (RPKM) se utilizan habitualmente para normalizar los recuentos de lecturas brutas en función de la profundidad de secuenciación y la longitud del gen. Otros métodos más avanzados, como la media recortada de valores M (TMM) y la normalización cuantílica, pretenden corregir las diferencias de composición entre bibliotecas. ¿Pensais que la eleccion de uno u otro puede influenciar los resultados?
-----------------------------

In the field of genomics, RNA sequencing (RNA-seq) has become a fundamental tool for studying gene expression and regulation. However, the complexity of RNA-seq data requires careful processing and normalization to ensure accurate interpretation. Different RNA-seq processing and normalization methods are available to address these challenges. These methods range from basic quality control and alignment procedures to more sophisticated normalization techniques designed to adjust for variability between samples and experiments. Techniques such as Counts Per Million (CPM), Transcripts Per Million (TPM), and Reads Per Kilobase Million (RPKM) are commonly used to normalize raw read counts as a function of sequencing depth and gene length. Other more advanced methods, such as trimmed mean M-values (TMM) and quantile normalization, aim to correct for compositional differences between libraries. Do you think the choice of one or the other can influence the results?

En respuesta a Coral del Val Muñoz

Re: ¿Pueden influir en los resultados las técnicas de procesamiento y normalización del ARN-seq seleccionadas?/Can the RNA-seq processing and normalization techniques selected influence the results?

de Samuel Saldaña -
Todo manejo en Ciencia de los datos o Data Science y sucede igual con la bioinformática/quimioinformática, cumplir con una fase o etapa de alto rigor como es la Minería de los datos, el cual tiene un alto grado de incidencia en la calidad del modelo y por tanto en los resultados de los datos.

Al abordar grandes volúmenes de datos, es necesario emplear técnicas tanto de Machine Learning como de Deep Learning (una o varias técnicas de estas ramas), y proceder con los criterios elegidos a efectos de incidir en la calidad para luego aplicar una fase analítica de acuerdo al campo que corresponda (p. ej. expresión y regulación génica), afectando sin lugar a dudas, el objetivo y la calidad de los resultados.


All management in Data Science or Data Science, and the same happens with bioinformatics/chemoinformatics, must comply with a phase or stage of high rigor such as Data Mining, which has a high degree of impact on the quality of the model and therefore on the results of the data.

When dealing with large volumes of data, it is necessary to use both Machine Learning and Deep Learning techniques (one or several techniques from these branches), and to proceed with the chosen criteria in order to affect the quality and then apply an analytical phase according to the corresponding field (e.g. gene expression and regulation), undoubtedly affecting the objective and the quality of the results.
En respuesta a Coral del Val Muñoz

Re: ¿Pueden influir en los resultados las técnicas de procesamiento y normalización del ARN-seq seleccionadas?/Can the RNA-seq processing and normalization techniques selected influence the results?

de Josep Clotet Erra -
Por supuesto que pueden influir ya que cada estrategia de preprocesamiento genera listas distintas de datos.

He podido comprobar personalmente como una lista de datos crudos de RNAseq me ha dado tres listas diferentes de DEGs cuando he solicitado su análisis bioinformático a tres empresas de análisis de datos. Y cuando digo diferentes, quiero decir muy diferentes.

Para los bioquimicos es terrible observar que un mismo experimento te puede dar resultados distintos en función de que 'caja negra' de análisis bioinformático sometas tus datos. La explicación que dan son las diferentes estrategias de preprocesamiento (entre otros factores).
En respuesta a Coral del Val Muñoz

Re: ¿Pueden influir en los resultados las técnicas de procesamiento y normalización del ARN-seq seleccionadas?/Can the RNA-seq processing and normalization techniques selected influence the results?

de Francisco Javier Fraguas Lasheras -
Me parece muy interesante la pregunta que se ha planteado. Mi experiencia con RNA-seq es mínima, sin embargo recuerdo lo complejo que es trabajar con todos esos datos. Creo que esto se puede abordar de distintas formas:
¿Realmente debería existir algún método único (o X métodos según el experimento) para tratar datos de RNA-seq?
¿Hay alguna forma de garantizar que los resultados son correctos (o al menos lógicos)?

Recuerdo leer hace poco un review de datos de metagenoma, en la que indicaban que para un mismo set de datos, según se procesaran los resultados también eran muy distintos. ¿Podrá pasar esto en un futuro para RNA-seq?
En la bibliografía del tema hay un artículo de 2017 en modo review que nos da información sobre este proceso (no lo he leído aún).

Creo que vamos a tener que andar con mucho cuidado trabajando estos datos. Y creo que una visión multiómica nos puede proporcionar datos "seguros" para los estudios de RNA-seq. Pero no tengo datos sobre esto, sólo opiniones. Gracias por la contribución al resto de participantes y lectores.

_________________________________________________________________________________________________________________________________________________________

I find the question raised very interesting. My experience with RNA-seq is minimal, but I remember how complex it is to work with all that data. I think this can be approached in different ways:
Should there really be a single method (or X methods depending on the experiment) for handling RNA-seq data?
Is there any way to ensure that the results are correct (or at least logical)?

I recall reading a review of metagenomic data recently, in which they indicated that for the same dataset, the results could be very different depending on how they were processed. Could this happen in the future for RNA-seq?
There is an article from 2017 in the literature on this topic that provides information about this process (which I haven't read yet).

I think we will have to be very careful when working with this data. And I believe that a multiomic approach could provide "safe" data for RNA-seq studies. But I don't have data on this, just opinions. Thanks for contributing to the discussion for the benefit of other participants and readers.