Glosarios | AbiertaUGR

Imprimir

sábado, 18 de mayo de 2024, 17:33

Sitio: AbiertaUGR

Curso: MOOC Machine Learning y Big Data para la Bioinformática. 4ª Edición (ml_bioinformatica_4ed)

Glosario: Glosario

Accuracy o porcentaje de acierto

Promedio de aciertos total obtenido por el modelo de clasificación, representado en tanto por ciento

Alta dimensionalidad

Existe un alto número de variables de entrada en el problema de aprendizaje

Análisis por grupos

Enfoque utilizado para analizar las RAs obtenidas. Consiste en analizar las reglas agrupándolas en función de los ítems que contienen. Podemos analizarlas creando grupos de reglas que tengan algún elemento común en el antecedente o en el consecuente. También se pueden crear los grupos seleccionando las reglas que tengan en el consecuente y en el antecedente el mismo itemset, permitiendo estudiar reglas distintas pero con asociaciones relacionadas.

Antecedente de la RA

En una regla A → C, A es el antecedente de la regla, es decir, aquello que debe aparecer en la instancia para que con una alta probabilidad también aparezca C.

Aprendizaje Supervisado

En aprendizaje automático y minería de datos, el aprendizaje supervisado es una técnica para deducir una función a partir de datos de entrenamiento. Los datos de entrenamiento consisten de pares de objetos: una componente del par son los datos de entrada y el otro, los resultados deseados

Apriori

Es el primer algoritmo que se propuso en la literatura para obtener RAs a partir de un conjunto de datos. Este algoritmo hace uso de un proceso de generación en anchura para extraer todos los itemsets frecuentes y después genera las RAs a partir de ellos. Hace uso de la propiedad de anti-monotonía de la medida de soporte para mejorar la eficiencia al generar los itemsets frecuentes.

Árbol de decisión

Tipo de modelo de aprendizaje supervisado basado en una serie de condiciones aplicadas de manera jerárquica, representado en forma de árbol, con decisiones dicotómicas en cada nodo, y donde cada decisión o salida se obtiene recorriendo el camino de la raíz a las hojas.

Árbol de regresión

Es un árbol de decisión en cuyas hojas hay una constante

AUC o Área bajo la curva ROC

Métrica de calidad basada en las probabilidades de salida del clasificador, y el balance que se alcanza entre verdaderos y falsos positivos para cada valor de umbral de probabilidad.

Bagging o Bootstrap Aggregating

Tipo de Ensemble que utiliza un subconjunto diferente de los datos de entrenamiento. En este caso, se entrena un número M de estimadores de manera independiente