Muchas gracias por tu comentario, porque señala un problema central de la medicina de precisión actual: una herramienta bioinformática puede ser técnicamente muy avanzada y, aun así, producir resultados clínicamente problemáticos si se apoya en referencias genómicas poco representativas. En un hospital, esto puede traducirse en sesgos diagnósticos, menor fiabilidad predictiva y dificultades de interpretación, especialmente cuando los pacientes proceden de poblaciones insuficientemente representadas en los datos de entrenamiento. La falta de diversidad en los datos no es solo un límite técnico, sino también un problema de equidad clínica.
Aquí aparece una paradoja importante. Aunque las poblaciones africanas contienen la mayor diversidad genética humana, y son fundamentales para comprender nuestra historia evolutiva, siguen estando infrarrepresentadas en la investigación genómica. Algo parecido ocurre en América Latina: análisis recientes recuerdan que las personas latinoamericanas representan solo alrededor del 0,38% de los participantes en estudios GWAS. Esto no solo limita la portabilidad de los hallazgos, sino que también frena la investigación traslacional y puede ampliar desigualdades en salud en contextos donde la medicina de precisión debería justamente reducirlas.
En este contexto, el pangenoma humano representa un avance especialmente relevante. Proporciona una representación de la diversidad genética humana que no era posible con un único genoma de referencia. Mientras que la referencia clásica era lineal y única, el pangenoma integra simultáneamente múltiples versiones del genoma humano, ofreciendo una base mucho más amplia para analizar otras secuencias. El borrador del pangenoma humano añadió aproximadamente 119 millones de pares de bases de secuencia eucromática polimórfica y reveló nuevas variantes en regiones estructuralmente complejas, mostrando con claridad cuánto se perdía al depender de una única referencia.
Dicho de una forma sencilla: si el genoma de referencia clásico era como un único mapa de carreteras de Europa aplicado al mundo entero, el pangenoma es más bien un atlas con mapas específicos para cada región del planeta. Y eso importa mucho, porque para diagnosticar enfermedades raras en una población de los Andes, del Sahel o del sudeste asiático, necesitas el mapa correcto. Por eso, el reto no es solo diseñar algoritmos más potentes, sino desarrollar herramientas bioinformáticas más representativas, más transparentes y globalmente aplicables. La representación genómica no es únicamente una cuestión académica: es una condición necesaria para una medicina de precisión verdaderamente justa.
Thank you very much for your comment, because it highlights a central problem in current precision medicine: a bioinformatics tool may be technically very advanced and still produce clinically problematic results if it relies on poorly representative genomic references. In a hospital setting, this can translate into diagnostic bias, lower predictive reliability, and difficulties in interpretation, especially when patients come from populations that are underrepresented in the training data. Lack of diversity in the data is not only a technical limitation, but also a matter of clinical equity.
Here a major paradox appears. Although African populations contain the greatest human genetic diversity, and are essential for understanding our evolutionary history, they remain underrepresented in genomic research. A similar situation occurs in Latin America: recent analyses remind us that Latin American individuals account for only about 0.38% of participants in GWAS studies. This not only limits the portability of findings, but also slows translational research and may widen health inequalities in settings where precision medicine should, in principle, help reduce them.
In this context, the human pangenome represents a particularly important advance. It provides a representation of human genetic diversity that was not possible with a single reference genome. Whereas the classical reference genome was linear and unique, the pangenome simultaneously incorporates multiple versions of the human genome, offering a much broader basis for analysing other human sequences.
Put simply: if the traditional reference genome was like using a single road map of Europe for everything, the pangenome is more like an atlas with specific maps for each region of the planet. And that matters greatly, because if you want to diagnose rare diseases in a population from the Andes, the Sahel, or Southeast Asia, you need the right map.
For that reason, the challenge is not only to design more powerful algorithms, but also to develop bioinformatics tools that are more representative, more transparent, and more globally applicable. Genomic representation is not merely an academic issue; it is a necessary condition for a truly fair form of precision medicine.