A grandes rasgos, el proceso de DM puede dividirse en 6 pasos:
    1. Selección del conjunto de datos: aquí se decide cuáles van a ser las variables
    objetivos (aquellas que se quieren predecir o inferir), las variables independientes y la selección de registros (datos) a utilizar.
    2. Análisis de las propiedades de los datos: mediante, por ejemplo, histogramas y/o diagramas de dispersión. Búsqueda de valores atípicos (outliers) y ausencia de datos.

    3. Transformación o preprocesamiento del conjunto de datos de entrada: en éste paso, se normalizan los datos a una misma escala. También se decide cómo se van a tratar datos faltantes, atípicos o dudosos. Una posibilidad es tratarlos como un tipo de dato especial o bien se decide descartarlos.

    4. Selección y aplicación de técnicas de minería de datos: se construye un

    modelo, el cual será utilizado sobre los datos para predecir las clases mediante clasificación o para descubrir grupos similares mediante segmentación.

    5. Extracción de conocimiento: una vez aplicado el paso anterior, se buscan patrones de comportamiento en los valores de las variables del problema o relaciones de asociación entre dichas variables.

    6. Interpretación y evaluación de datos: el modelo debe ser validado comprobando que las conclusiones arrojadas son válidas y satisfactorias. Si el modelo final no supera ésta evaluación, el proceso puede repetirse desde el principio o a partir de cualquiera de los pasos anteriores.


Tema: Inteligencia Artificial

'Proceso de Data Mining' aparece también en las siguientes entradas:


¿Mejoramos la definición?
Puntos: 0( 0 votos)



Publicado el 8/07/2018.