Gracias María José. Para tomar una decisión informada es vital no limitarse a una sola métrica, sino analizar varias de forma conjunta. En bioinformática, es especialmente importante entender la relación entre métricas relativas como el R2 y métricas de error absoluto, ya que podríamos encontrarnos con la situación aparentemente contradictoria de tener un R2 muy alto junto a un error inaceptablemente elevado. Este fenómeno puede ocurrir por diversas razones técnicas que debemos vigilar. Por ejemplo, en escenarios con datos de gran escala o alta varianza, el modelo puede seguir perfectamente la tendencia general (logrando un R2 excelente) pero fallar por márgenes de miles de unidades en sus predicciones individuales. También puede deberse a la presencia de valores atípicos (outliers) que disparan el error cuadrático medio mientras el resto de los datos mantienen un ajuste visualmente bueno, o incluso a un sobreajuste (overfitting) donde el modelo memoriza el ruido del entrenamiento logrando un ajuste teórico casi perfecto que se desploma al enfrentarse a la realidad de nuevos pacientes. Y en cuanto a intepretar el error... que es un error aceptable? bueno, al final, dependerá de si su precisión absoluta se mantiene dentro de los márgenes de seguridad que nuestra aplicación biológica requiere.
=================
Thank you, María José. To make an informed decision, it is vital not to rely on a single metric, but to analyse several of them together. In bioinformatics, it is particularly important to understand the relationship between relative metrics such as R2 and absolute error metrics, as we might encounter the seemingly contradictory situation of having a very high R2 alongside an unacceptably high error. This phenomenon can occur for various technical reasons that we must watch out for. For example, in scenarios with large-scale or highly variable data, the model may perfectly follow the general trend (achieving an excellent R$) but fail by margins of thousands of units in its individual predictions. It may also be due to the presence of outliers that cause the mean squared error to skyrocket whilst the rest of the data maintains a visually good fit, or even to overfitting, where the model memorises the noise from the training data, achieving a theoretically almost perfect fit that collapses when faced with the reality of new patients. And as for interpreting the error... what constitutes an acceptable error? Well, ultimately, it will depend on whether its absolute accuracy remains within the safety margins required by our biological application.