El proyecto “Malaria No More” https://www.malarianomore.org/ tiene como objetivo acabar con la malaria en una generación. Hasta 400.000 niños mueren anualmente debido a la malaria. Para evitarlo, en este proyecto se está utilizando Big Data.
Se usan los móviles para rastrear el movimiento de personas para poder predecir dónde es probable que ocurra un brote de malaria. Des esta forma se pueden tomar medidas preventivas. La malaria es causada por la picadura de los mosquitos pero éstos tienen un rango de movimiento limitado y son los humanos quienes la trasmiten a sitios más lejanos.
¿Conocéis algún proyecto de investigación en Bioinformática interesante que use Big Data?
----------------------------------------------------------------------
The ‘Malaria No More’ project https://www.malarianomore.org/ aims to end malaria in a generation. Up to 400,000 children die annually due to malaria. To prevent this, Big Data is being used in this project.
Cell phones are used to track the movement of people in order to predict where a malaria outbreak is likely to occur. Then preventive measures can be taken. Malaria is caused by mosquito bites, but mosquitoes have a limited range of movement. It is humans who transmit it to more distant locations.
Do you know any interesting Bioinformaticatics research project which uses Big Data?
Un proyecto interesante de Big Data / An interesting Big Data project
de Francisco Javier García Castellano - Número de respuestas: 4
En respuesta a Francisco Javier García Castellano
Re: Un proyecto interesante de Big Data / An interesting Big Data project
de Francisco Javier García Castellano -Otro proyecto que os puede parecer interesante es el proyecto Harmony y su continuación Harmony Plus (https://www.harmony-alliance.eu/), financiados por la Unión Europea. Dichos proyectos tienen como objetivo utilizar Big Data para producir información que ayude a mejorar la atención de los pacientes con tumores hematológicos (por ejemplo, Mieloma múltiple, leucemia mieloide aguda, leucemia linfoblástica aguda, leucemia linfocítica crónica, linfoma no Hodgkin, síndrome mielodisplásico y tumores hematológicos pediátricos ).
La idea es facilitar y mejorar la toma de decisiones tanto a nivel de políticas sanitarias como a nivel asistencial para ofrecer el tratamiento más adecuado a los pacientes mediante medicina personalizada .
----------------------------------------------------------------------
Another project that you might find interesting is the Harmony project and its continuation, Harmony Plus (https://www.harmony-alliance.eu/, funded by the European Union. These projects aim to use Big Data to produce information that helps improve the care of patients with hematological tumors (for example, multiple myeloma, acute myeloid leukemia, acute lymphoblastic leukemia, chronic lymphocytic leukemia, non-Hodgkin lymphoma, myelodysplastic syndrome, and pediatric hematological tumors).
The idea is to facilitate and enhance decision-making at both the health policy level and the care level to offer the most appropriate treatment to patients through personalized medicine.
La idea es facilitar y mejorar la toma de decisiones tanto a nivel de políticas sanitarias como a nivel asistencial para ofrecer el tratamiento más adecuado a los pacientes mediante medicina personalizada .
----------------------------------------------------------------------
Another project that you might find interesting is the Harmony project and its continuation, Harmony Plus (https://www.harmony-alliance.eu/, funded by the European Union. These projects aim to use Big Data to produce information that helps improve the care of patients with hematological tumors (for example, multiple myeloma, acute myeloid leukemia, acute lymphoblastic leukemia, chronic lymphocytic leukemia, non-Hodgkin lymphoma, myelodysplastic syndrome, and pediatric hematological tumors).
The idea is to facilitate and enhance decision-making at both the health policy level and the care level to offer the most appropriate treatment to patients through personalized medicine.
En respuesta a Francisco Javier García Castellano
Re: Un proyecto interesante de Big Data / An interesting Big Data project
de Francisco Javier García Castellano -Otro ejemplo son los proyectos de medicina personalizada, como el Proyecto IMPaCT (https://impact.isciii.es/) que tiene como misión fomentar y consolidar la medicina personalizada, usando para ello la información genómica y molecular de cada persona. La infraestructura de IMPaCT se basa en tres ejes principales: Cohorte, Datos y Genómica. Este proyecto va a permitir tratar a cada paciente de forma más eficaz y segura. Los objetivos del proyecto son:
* Cohorte IMPaCT: La realización de un estudio de cohorte con la participación de 200,000 personas durante 20 años, con el fin de explorar los determinantes de salud a través del análisis de datos sobre estilos de vida, entorno social y condiciones biológicas.
* Medicina Predictiva: Identificación de biomarcadores y factores de riesgo, así como la monitorización de la salud de la población para mejorar la comprensión de las enfermedades más prevalentes en España.
* Ciencia de Datos: Desarrollo de un entorno integrado para la gestión y análisis de datos clínicos, moleculares y de salud, permitiendo un enfoque innovador hacia la investigación médica.
* Medicina Genómica: Facilitar diagnósticos precisos y rápidos para enfermedades raras, además de promover la investigación de nuevas terapias basadas en la genética.
---------------------------------------------------------------------
Another example is personalized medicine projects, such as the IMPaCT Project (https://impact.isciii.es/en/), whose mission is to promote and consolidate personalized medicine by using each person’s genomic and molecular information. The IMPaCT infrastructure is based on three main pillars: Cohort, Data, and Genomics. This project aims to enable more effective and safer treatments for each patient. The project's objectives are:
* IMPaCT Cohort: Conducting a cohort study with the participation of 200,000 people over 20 years, in order to explore health determinants through the analysis of data on lifestyle, social environment, and biological conditions.
* Predictive Medicine: Identifying biomarkers and risk factors, as well as monitoring the health of the population to improve the understanding of the most prevalent diseases in Spain.
* Data Science: Developing an integrated environment for managing and analyzing clinical, molecular, and health data, enabling an innovative approach to medical research.
* Genomic Medicine: Facilitating accurate and rapid diagnoses for rare diseases, in addition to promoting the research of new therapies based on genetics.
* Cohorte IMPaCT: La realización de un estudio de cohorte con la participación de 200,000 personas durante 20 años, con el fin de explorar los determinantes de salud a través del análisis de datos sobre estilos de vida, entorno social y condiciones biológicas.
* Medicina Predictiva: Identificación de biomarcadores y factores de riesgo, así como la monitorización de la salud de la población para mejorar la comprensión de las enfermedades más prevalentes en España.
* Ciencia de Datos: Desarrollo de un entorno integrado para la gestión y análisis de datos clínicos, moleculares y de salud, permitiendo un enfoque innovador hacia la investigación médica.
* Medicina Genómica: Facilitar diagnósticos precisos y rápidos para enfermedades raras, además de promover la investigación de nuevas terapias basadas en la genética.
---------------------------------------------------------------------
Another example is personalized medicine projects, such as the IMPaCT Project (https://impact.isciii.es/en/), whose mission is to promote and consolidate personalized medicine by using each person’s genomic and molecular information. The IMPaCT infrastructure is based on three main pillars: Cohort, Data, and Genomics. This project aims to enable more effective and safer treatments for each patient. The project's objectives are:
* IMPaCT Cohort: Conducting a cohort study with the participation of 200,000 people over 20 years, in order to explore health determinants through the analysis of data on lifestyle, social environment, and biological conditions.
* Predictive Medicine: Identifying biomarkers and risk factors, as well as monitoring the health of the population to improve the understanding of the most prevalent diseases in Spain.
* Data Science: Developing an integrated environment for managing and analyzing clinical, molecular, and health data, enabling an innovative approach to medical research.
* Genomic Medicine: Facilitating accurate and rapid diagnoses for rare diseases, in addition to promoting the research of new therapies based on genetics.
En respuesta a Francisco Javier García Castellano
Re: Un proyecto interesante de Big Data / An interesting Big Data project
de María Isabel Aranda Olmedo -Hola a todos.
Gracias por tanta información interesante, Francisco Javier.
El repositorio de datos GPAP RD-Connect (https://platform.rd-connect.eu/#/) utiliza tecnologías de big data con un sistema de archivos Hadoop. Son recursos para la investigación clínica en enfermedades raras.
The RD-Connect Genome-Phenome Analysis Platform: Accelerating diagnosis, research, and gene discovery for rare diseases. 2022. https://doi.org/10.1002/humu.24353
Un saludo.
Isabel.
-----------------
Hello everyone.
Thanks for so much interesting information, Francisco Javier.
The GPAP RD-Connect data repository (https://platform.rd-connect.eu/#/) uses big data technologies with a Hadoop file system. These are resources for clinical research in rare diseases.
The RD-Connect Genome-Phenome Analysis Platform: Accelerating diagnosis, research, and gene discovery for rare diseases. 2022. https://doi.org/10.1002/humu.24353
Best regards,
Isabel.
Gracias por tanta información interesante, Francisco Javier.
El repositorio de datos GPAP RD-Connect (https://platform.rd-connect.eu/#/) utiliza tecnologías de big data con un sistema de archivos Hadoop. Son recursos para la investigación clínica en enfermedades raras.
The RD-Connect Genome-Phenome Analysis Platform: Accelerating diagnosis, research, and gene discovery for rare diseases. 2022. https://doi.org/10.1002/humu.24353
Un saludo.
Isabel.
-----------------
Hello everyone.
Thanks for so much interesting information, Francisco Javier.
The GPAP RD-Connect data repository (https://platform.rd-connect.eu/#/) uses big data technologies with a Hadoop file system. These are resources for clinical research in rare diseases.
The RD-Connect Genome-Phenome Analysis Platform: Accelerating diagnosis, research, and gene discovery for rare diseases. 2022. https://doi.org/10.1002/humu.24353
Best regards,
Isabel.
En respuesta a María Isabel Aranda Olmedo
Re: Un proyecto interesante de Big Data / An interesting Big Data project
de Francisco Javier García Castellano -¡Muchas gracias Isabel por tu aportación!
Como en el ejemplo que pones, lo habitual en entornos tradicionales de Big Data es usar Hadoop (con HDFS para el almacenamiento y YARN para la gestión del clúster) junto con Apache Spark para el procesamiento y análisis de datos. De hecho, cuando descargas Apache Spark, puedes elegir una versión precompilada compatible con Hadoop, lo que permite que Spark interactúe fácilmente con HDFS o se ejecute sobre YARN. Sin embargo, Spark no incluye Hadoop como tal en el paquete de descarga; simplemente está preparado para funcionar con él si así se configura.
-------------------------
Thank you very much Isabel for your contribution!
As in the example you give, in traditional Big Data environments, it's common to use Hadoop (with HDFS for storage and YARN for cluster management) alongside Apache Spark for data processing and analysis. In fact, when downloading Apache Spark, you can choose a precompiled version that's compatible with Hadoop, which makes it easy for Spark to interact with HDFS or run on YARN. However, Spark does not include Hadoop itself in the download package; it’s simply configured to work with it if needed.
Como en el ejemplo que pones, lo habitual en entornos tradicionales de Big Data es usar Hadoop (con HDFS para el almacenamiento y YARN para la gestión del clúster) junto con Apache Spark para el procesamiento y análisis de datos. De hecho, cuando descargas Apache Spark, puedes elegir una versión precompilada compatible con Hadoop, lo que permite que Spark interactúe fácilmente con HDFS o se ejecute sobre YARN. Sin embargo, Spark no incluye Hadoop como tal en el paquete de descarga; simplemente está preparado para funcionar con él si así se configura.
-------------------------
Thank you very much Isabel for your contribution!
As in the example you give, in traditional Big Data environments, it's common to use Hadoop (with HDFS for storage and YARN for cluster management) alongside Apache Spark for data processing and analysis. In fact, when downloading Apache Spark, you can choose a precompiled version that's compatible with Hadoop, which makes it easy for Spark to interact with HDFS or run on YARN. However, Spark does not include Hadoop itself in the download package; it’s simply configured to work with it if needed.