C |
---|
Confounding o variable espuriaAtributos de entrada que presentan una correlación
con la variable de salida, pero que no deben representar realmente información de
utilidad para la predicción | |
Conjunto de entrenamientoUn subconjunto del total de los datos que se utiliza para
realizar el aprendizaje del modelo | |
Conjunto de testUn subconjunto del total de los datos, independiente del conjunto de
entrenamiento, que se utiliza para validar el aprendizaje del modelo. | |
Consecuente de la RAEn una regla A → C, C es el consecuente de la regla, es decir, aquello que aparece en la instancia con una alta probabilidad cuando aparece A en dicha instancia. | |
ConvictionEsta medida mide el error
esperado de la regla, es decir, con qué frecuencia aparece el antecedente de la
regla en una transacción en la que el consecuente no aparece. Su dominio es [0,∞],
donde los valores inferiores a 1 representan dependencia negativa, 1 representa
independencia y los valores superiores a 1 representan dependencia positiva. | |
Coste (parámetro SVM)Indica cómo de permisivo es el entrenamiento de
acuerdo a muestras de entrenamiento que caigan incorrectamente al lado
contrario del plano de separación de su clase. Tiene una relación directa con
el sobreaprendizaje de la SVM | |
CSVUn archivo CSV (del inglés Comma-Separated Values) es un fichero que tiene una tabla de datos en formato de texto separado por comas u otro delimitador. Cada fila de la tabla de datos se corresponde con una línea del fichero, y cada uno de los valores de los campos en esa fila está separado de los demás por comas. | |
D |
---|
Datos no estructuradosGeneralmente son datos binarios que no tienen estructura identificable. Los datos estructurados, normalmente tienen forma de tabla. | |
DendrogramaJerarquía de clusters. Representación de cómo las instancias se relacionan entre sí dando lugar a agrupamientos de distinto tamaño. | |