Accuracy o porcentaje de aciertoPromedio de aciertos total obtenido por el modelo de clasificación, representado en tanto por ciento |
Alta dimensionalidadExiste un alto número de variables de entrada en el problema de aprendizaje |
Análisis por gruposEnfoque utilizado para analizar las RAs obtenidas. Consiste en analizar las reglas agrupándolas en función de los ítems que contienen. Podemos analizarlas creando grupos de reglas que tengan algún elemento común en el antecedente o en el consecuente. También se pueden crear los grupos seleccionando las reglas que tengan en el consecuente y en el antecedente el mismo itemset, permitiendo estudiar reglas distintas pero con asociaciones relacionadas. |
Antecedente de la RAEn una regla A → C, A es el antecedente de la regla, es decir, aquello que debe aparecer en la instancia para que con una alta probabilidad también aparezca C. |
Aprendizaje SupervisadoEn aprendizaje automático y minería de datos, el aprendizaje supervisado es una técnica para deducir una función a partir de datos de entrenamiento. Los datos de entrenamiento consisten de pares de objetos: una componente del par son los datos de entrada y el otro, los resultados deseados |
AprioriEs el primer algoritmo que se
propuso en la literatura para obtener RAs a partir de un conjunto de datos.
Este algoritmo hace uso de un proceso de generación en anchura para extraer
todos los itemsets frecuentes y después genera las RAs a partir de ellos. Hace
uso de la propiedad de anti-monotonía de la medida de soporte para mejorar la
eficiencia al generar los itemsets frecuentes. |
Árbol de decisiónTipo de modelo de aprendizaje supervisado basado en una serie de condiciones
aplicadas de manera jerárquica, representado en forma de árbol, con decisiones
dicotómicas en cada nodo, y donde cada decisión o salida se obtiene recorriendo el
camino de la raíz a las hojas. |
Árbol de regresiónEs un árbol de decisión en cuyas hojas hay una constante |
AUC o Área bajo la curva ROCMétrica de calidad basada en las probabilidades de salida
del clasificador, y el balance que se alcanza entre verdaderos y falsos positivos para cada
valor de umbral de probabilidad. |
Bagging o Bootstrap AggregatingTipo de Ensemble que utiliza un subconjunto diferente
de los datos de entrenamiento. En este caso, se entrena un número M de estimadores
de manera independiente |