El proceso KDD
El proceso KDD es interactivo e iterativo, involucrando numerosos pasos con muchas decisiones tomadas por el usuario. Brachman y Anand (1996) dan una visión práctica del proceso KDD , enfatizando la naturaleza interactiva del proceso. Aquí, describimos ampliamente algunos de sus pasos básicos: Primero, desarrollar una comprensión del dominio de la aplicación y el conocimiento previo relevante, e la identificar la meta del proceso KDD desde el punto de vista del cliente. Segundo, crear un conjunto de datos objetivo: seleccionar el conjunto de datos, o centrarse en un subconjunto de variables o muestras de datos, en el que se ejecutará el descubrimiento. Tercero es la limpieza y preprocesamiento de datos. Las operaciones básicas incluyen eliminar el ruido si es apropiado, recopilar la información necesaria para modelar o contabilizar el ruido, determinar las estrategias para manejar los campos de datos faltantes y contabilizar información de secuencia temporal y cambios