Glosario

Navegue por el glosario usando este índice.

Especial | A | B | C | D | E | F | G | H | I | J | K | L | M | N | Ñ | O | P | Q | R | S | T | U | V | W | X | Y | Z | TODAS

Página: (Anterior) 1 2 3 4 5 6 7 8 9 10 ... 14 (Siguiente)
TODAS

C

Confounding o variable espuria

Atributos de entrada que presentan una correlación con la variable de salida, pero que no deben representar realmente información de utilidad para la predicción

Conjunto de entrenamiento

Un subconjunto del total de los datos que se utiliza para realizar el aprendizaje del modelo

Conjunto de test

Un subconjunto del total de los datos, independiente del conjunto de entrenamiento, que se utiliza para validar el aprendizaje del modelo.

Consecuente de la RA

En una regla A → C, C es el consecuente de la regla, es decir, aquello que aparece en la instancia con una alta probabilidad cuando aparece A en dicha instancia.

Control de Calidad

Etapa del análisis computacional en la que se identifican patrones anormales que indiquen sesgos experimentales no corregidos por los métodos de normalización. Para esta etapa es habitual emplear representaciones gráficas.

Conviction

Esta medida mide el error esperado de la regla, es decir, con qué frecuencia aparece el antecedente de la regla en una transacción en la que el consecuente no aparece. Su dominio es [0,∞], donde los valores inferiores a 1 representan dependencia negativa, 1 representa independencia y los valores superiores a 1 representan dependencia positiva.

Coste (parámetro SVM)

Indica cómo de permisivo es el entrenamiento de acuerdo a muestras de entrenamiento que caigan incorrectamente al lado contrario del plano de separación de su clase. Tiene una relación directa con el sobreaprendizaje de la SVM

CSV

Un archivo CSV (del inglés Comma-Separated Values) es un fichero que tiene una tabla de datos en formato de texto separado por comas u otro delimitador. Cada fila de la tabla de datos se corresponde con una línea del fichero, y cada uno de los valores de los campos en esa fila está separado de los demás por comas.

D

Datos no estructurados

Generalmente son datos binarios que no tienen estructura identificable. Los datos estructurados, normalmente tienen forma de tabla.

Dendrograma

Jerarquía de clusters. Representación de cómo las instancias se relacionan entre sí dando lugar a agrupamientos de distinto tamaño.