La búsqueda global no está activada.
Salta al contenido principal
Foro

Foro de debate módulo 5

Hilo 1: La importancia del Deep Learning en Bioinformática / Thread 1: The importance of Deep Learning in Bioinformatics

Hilo 1: La importancia del Deep Learning en Bioinformática / Thread 1: The importance of Deep Learning in Bioinformatics

de Alberto Fernández Hilario - Número de respuestas: 5

¡Hola a todos!

Quiero invitarlos a participar en un apasionante debate sobre la importancia del "Deep Learning" en la clasificación de datos en el campo de la bioinformática. Este emocionante cruce entre la biología y la informática nos ofrece la oportunidad de explorar cómo las técnicas más avanzadas en inteligencia artificial pueden revolucionar nuestra comprensión de los procesos biológicos.

Como sabemos, la bioinformática se enfrenta a desafíos únicos debido a la complejidad de los datos biológicos, como las secuencias genéticas y los perfiles de expresión génica. Sin embargo, el "Deep Learning" ha emergido como una herramienta poderosa que puede aprovechar la gran cantidad de datos disponibles y extraer patrones ocultos de manera automatizada.

¿Por qué es tan importante esto? Bueno, imagine por un momento que tiene millones de secuencias genéticas y necesita identificar cuáles de ellas están asociadas con una enfermedad específica. Aquí es donde entra en juego el "Deep Learning". Estas técnicas pueden aprender de manera autónoma a reconocer patrones complejos en los datos, lo que les permite realizar predicciones precisas y rápidas.

Entonces, ¿cuál es su opinión sobre el papel del "Deep Learning" en la bioinformática? ¿Han experimentado su poder transformador en su trabajo o investigación? ¿Creen que estas técnicas son el futuro del análisis de datos biológicos?

¡Espero ansioso sus reflexiones y experiencias en este emocionante campo de estudio!

---

Hello everyone!

I want to invite you to participate in an exciting discussion about the importance of "Deep Learning" in data classification in the field of bioinformatics. This thrilling intersection between biology and computer science offers us the opportunity to explore how the most advanced techniques in artificial intelligence can revolutionize our understanding of biological processes.

As we know, bioinformatics faces unique challenges due to the complexity of biological data, such as genetic sequences and gene expression profiles. However, "Deep Learning" has emerged as a powerful tool that can harness the vast amount of available data and extract hidden patterns in an automated way.

Why is this so important? Well, imagine for a moment that you have millions of genetic sequences and need to identify which ones are associated with a specific disease. This is where "Deep Learning" comes into play. These techniques can autonomously learn to recognize complex patterns in the data, enabling them to make precise and rapid predictions.

So, what is your opinion on the role of "Deep Learning" in bioinformatics? Have you experienced its transformative power in your work or research? Do you believe that these techniques are the future of biological data analysis?

I look forward to hearing your reflections and experiences in this exciting field of study!


En respuesta a Alberto Fernández Hilario

Re: Hilo 1: La importancia del Deep Learning en Bioinformática / Thread 1: The importance of Deep Learning in Bioinformatics

de Jose M Peregrin Alvarez -
Buenas Alberto,

Me parece muy interesante este nuevo debate, ya que es un tema muy actual y con muchísimo potencial.

En mi caso, he trabajado en el desarrollo de una herramienta centrada en la predicción del índice de masa corporal (IMC) usando técnicas de clasificación. En la primera fase del proyecto utilizamos prácticamente todos los modelos y ensambladores de machine learning clásicos para entrenar a los models y elegir aquellos que proporcionaban los mejores resultados según los datos obtenidos de los pacientes/usuarios, clasificándolos posteriormente en las categorías del IMC (bajopeso, normal, sobrepeso u obesidad).

En ese punto, no estábamos aplicando técnicas de deep learning directamente, ya que los datos eran más bien tabulares (peso, altura, edad, género, étnia, etc.). Pero ahora estamos explorando el uso de imágenes del rostro y del cuerpo para validar la predicción, y aquí sí estamos empezando a integrar models de deep learning como las redes neuronales convolucionales (CNNs) para el procesamiento de imágenes. Sin duda, esto está siendo un salto muy interesante debido a su complejidad.

Lo que me parece clave es entender cuándo conviene usar deep learning y cuándo no. Si tienes un dataset pequeño o tabular, a veces un modelo simple es más robusto. Pero si trabajas con datos de alta dimensión como imágenes, secuencias o perfiles ómicos, el deep learning se vuelve casi imprescindible por su capacidad de capturar patrones complejos.

En resumen, creo que el deep learning es una herramienta transformadora en bioinformática, pero como todo, hay que aplicarlo con criterio.

Continuando con este debate, creo que sería interesante saber si alguien ha trabajado con modelos tipo LSTM (Long Short-Term Memory), un tipo especial de red neuronal recurrente (RNN)), para secuencias biológicas, o autoencoders para la reducción de la dimensionalidad. Una de las grandes ventajas del LSTM es que permite recordar información durante más tiempo, lo cual es útil cuando el orden y la dependencia entre elementos importa.

Algunos ejemplos de aplicationes potenciales en bioinformática o en ciencia de datos de la salud podrían ser:

1) En secuencias genéticas (DNA, RNA, proteínas), ya que cada base/aminoácido depende de los anteriores.
2) Para modelar expresión génica a lo largo del tiempo, por ejemplo, en estudios de desarrollo o respuesta a tratamientos.
3) O incluso analizar secuencias de eventos clínicos en registros de pacientes.

Mientras que una red neuronal clásica solo ve los datos como "una foto", un modelo LSTM los vería como secuencia de eventos, es decir como "una película", capturando la dinámica o el contexto en cada paso.

Saludos,
J

----
Hello,

I find this new debate very interesting, as it is a very current topic with much potential.

In my case, I have been working on developing a tool focused on predicting body mass index (BMI) using classification techniques. In the first phase of the project, we used practically all the classic machine learning models and assemblers to train the models and select those that provided the best results based on the data obtained from the patients/users, subsequently classifying them into BMI categories (underweight, normal, overweight, or obese).

At that point, we weren't applying deep learning techniques directly, as the data was more tabular (weight, height, age, gender, ethnicity, etc.). But now we are exploring using facial and body images to validate the prediction, and here we are beginning to integrate deep learning models such as convolutional neural networks (CNNs) for image processing. This is undoubtedly a very interesting leap forward due to its complexity.

What seems key to me is understanding when to use deep learning and when not to. If you have a small or tabular dataset, sometimes a simple model is more robust. But if you work with high-dimensional data such as images, sequences, or omics profiles, deep learning becomes almost indispensable due to its ability to capture complex patterns.

In short, I believe deep learning is a transformative tool in bioinformatics, but like everything else, it must be applied judiciously.

Continuing this debate, I think it would be interesting to know if anyone has worked with LSTM (Long Short-Term Memory) models, a special type of recurrent neural network (RNN), for biological sequences, or autoencoders for dimensionality reduction. One of the great advantages of LSTM is that it allows information to be retained for longer periods, which is useful when the order and dependencies between elements matter.

Some examples of potential applications in bioinformatics or health data science could be:

1) In genetic sequences (DNA, RNA, proteins), each base/amino acid depends on the previous ones.
2) To model gene expression over time, for example, in developmental studies or treatment response.
3) Or even to analyze sequences of clinical events in patient records.

While a classical neural network only sees data as "a snapshot," an LSTM model would view it as a sequence of events, that is, as "a movie," capturing the dynamics or context at each step.

Regards,
J
En respuesta a Jose M Peregrin Alvarez

Re: Hilo 1: La importancia del Deep Learning en Bioinformática / Thread 1: The importance of Deep Learning in Bioinformatics

de Alberto Fernández Hilario -
Buenos días José,

me parece que has sacado a colación un tema muy interesante. Recuerdo que en su momento revisé un artículo publicado en la revista "Information Fusion" titulado "Tabular data: Deep learning is not all you need" (https://www.sciencedirect.com/science/article/pii/S1566253521002360), que justamente criticaba el hecho que todos los usuarios de machine learning se habían volcado en utilizar Deep Learning y AutoML aún cuando el problema que tenían entre manos era abordable por un regresor logístico.

La ventaja de Deep Learning sobre otros paradigmas es básicamente el proceso automático de extracción de características que se lleva a cabo en las capas iniciales del modelo, especialmente en CNNs para imágenes y LSTMs para series temporales.

Creo que hay que tener los conceptos muy claros para conocer cuáles son las ventajas e inconvenientes de cada tipo de modelo a la hora de aplicarlo a nuestros datos.

Sí existen problemas denominados "multi-modales" en los que intervienen datos de diferentes fuentes / características, donde la integración de los mismos es una etapa clave ¿Os suena este paradigma de aprendizaje?

Saludos,

Alberto.

---

Good morning José,

It seems to me that you’ve raised a very interesting topic. I remember reviewing an article published in the journal Information Fusion titled “Tabular data: Deep learning is not all you need” (https://www.sciencedirect.com/science/article/pii/S1566253521002360), which specifically criticized the fact that all machine learning users had started relying on Deep Learning and AutoML, even though the problem they were facing could have been addressed using a logistic regressor.

The advantage of Deep Learning over other paradigms is basically the automatic feature extraction process carried out in the initial layers of the model, especially in CNNs for images and LSTMs for time series.

I believe it is essential to have a clear understanding of the concepts to know the advantages and disadvantages of each type of model when applying it to our data.

There are indeed problems known as “multi-modal” in which data from different sources/features are involved, and the integration of these is a key step. Does this learning paradigm sound familiar to you?

Best regards,
Alberto.
En respuesta a Alberto Fernández Hilario

Re: Hilo 1: La importancia del Deep Learning en Bioinformática / Thread 1: The importance of Deep Learning in Bioinformatics

de María Isabel Aranda Olmedo -
Hola a todos.

Mi opinión es que el "deep learning" nos abrirá los ojos al entendimiento de muchos procesos biológicos complejos, considerando asociaciones que, de otro modo, hubieran pasado desapercibidas. Me lo imagino, por ejemplo, dando una explicación precisa del motivo de la toxicidad o la inactividad de un medicamento para un determinado grupo poblacional o esclareciendo los motivos "ocultos" de la gradualidad de determinadas enfermedades o condiciones del ser humano.

Aunque no estemos más que despegando, el viaje ha empezado y ya se publican algunos resultados. Sirva como ejemplo el siguiente artículo (si bien, como ya habéis apuntado, en el futuro los análisis serán infinitamente más complejos):

Breast Cancer Case Identification Based on Deep Learning and Bioinformatics Analysis
https://www.frontiersin.org/journals/genetics/articles/10.3389/fgene.2021.628136/full

---------------------

Hello everyone.

My opinion is that deep learning will open our eyes to understanding many complex biological processes, considering associations that would otherwise have gone unnoticed. I imagine it, for example, providing a precise explanation for the reason for the toxicity or inactivity of a drug for a certain population group or clarifying the 'hidden' reasons for the gradual development of certain diseases or conditions in humans.

Although we are just taking off, the journey has begun, and some results are already being published. The following article serves as an example (although, as you have already pointed out, analyses will be infinitely more complex in the future):

Breast Cancer Case Identification Based on Deep Learning and Bioinformatics Analysis
https://www.frontiersin.org/journals/genetics/articles/10.3389/fgene.2021.628136/full
En respuesta a María Isabel Aranda Olmedo

Re: Hilo 1: La importancia del Deep Learning en Bioinformática / Thread 1: The importance of Deep Learning in Bioinformatics

de Alberto Fernández Hilario -
Hola María Isabel,

gracias por compartir esta información con todos nosotros, me parece muy interesante.

La cuestión es que la complejidad de este tipo de modelos hace relativamente difícil su configuración y uso de manera óptima por un usuario no experto en cuestiones técnicas de IA y ML. En otras palabras, tradicionalmente los usuarios en Bioinformática siempre han preferido soluciones más intuitivas como regresión logística o incluso SVMs o RandomForest, ya que eran capaces de controlar su funcionamiento a cada problema concreta. Dar el salto hacia sistemas de DL con arquitecturas cada vez más amplias y costosas, parece un poco vertiginoso,

De acuerdo a lo anterior, y desde mi humilde punto de vista, veo una doble problemática con respecto a utilizar modelos de Deep Learning para la extracción de conocimiento, tanto en el texto de BioCiencias como en cualquier otro:

1) La falta de transparencia para este tipo de soluciones, que impide validar correctamente su funcionamiento, o no aportan confianza al experto que lo está utilizando.
2) La falta de sostenibilidad en materia energética, debido al gran consumo que implica tanto su entrenamiento como igualmente su proceso de inferencia.

¿Qué opinión os merece a vosotros?

Saludos,

Alberto.
---

Hello María Isabel,

Thank you for sharing this information with all of us; I find it very interesting.

The issue is that the complexity of these models makes it relatively difficult for a non-expert user in AI and ML technical matters to configure and use them optimally. In other words, traditionally, users in Bioinformatics have always preferred more intuitive solutions like logistic regression or even SVMs or Random Forests, as they were able to control their operation for each specific problem. The leap to DL systems with increasingly large and costly architectures seems a bit daunting.

Given the above, and from my humble point of view, I see a dual problem with using Deep Learning models for knowledge extraction, both in the BioSciences text and in any other field:

1) The lack of transparency for these types of solutions, which makes it difficult to validate their operation or fails to provide the confidence the expert using them needs.
2) The lack of sustainability in terms of energy consumption, due to the high resources required for both training and inference processes.

What is your opinion on this?

Best regards,
Alberto.
En respuesta a Alberto Fernández Hilario

Re: Hilo 1: La importancia del Deep Learning en Bioinformática / Thread 1: The importance of Deep Learning in Bioinformatics

de Jose M Peregrin Alvarez -
Hola de nuevo!

Sobre los modelos multi-modales, definitivamente es un tema interesante. Se trata de integrar diferentes fuentes de datos (como imágenes, datos clínicos, genéticos, etc.) en un único modelo. En la bioinformática, esto es clave para obtener un análisis más completo y preciso, ya que cada tipo de dato puede aportar información única. Los modelos multi-modales están en auge y permiten combinar lo mejor de cada fuente para obtener predicciones más fiables.

Gracias Alberto y Maria Isabel por compartir estos artículos, creo que este foro abierto da mucho que explorar.

Saludos,
J

---
Hello again!

Regarding multimodal models, this is an interesting topic. It involves integrating different data sources (such as imaging, clinical, genetic data, etc.) into a single model. In bioinformatics, this is key to obtaining a more complete and accurate analysis, as each type of data can provide unique insights. Multimodal models are on the rise and allow combining the best of each source to obtain more reliable predictions.

Thank you, Alberto and María Isabel, for sharing these articles. I think this open forum offers much to explore.

Regards,
J