Entradas

Mostrando las entradas etiquetadas como mineria de datos

Minería de Datos o Data Mining como parte del proceso KDD

Imagen
El componente de minería de datos del proceso KDD a menudo implica la aplicación iterativa repetida de métodos particulares de minería de datos. Esta sección presenta una visión general de los objetivos principales de la minería de datos, una descripción de los métodos utilizados para abordar estos objetivos y una breve descripción de los algoritmos de minería de datos que incorporan estos métodos. Los objetivos de descubrimiento de conocimiento se definen por el uso previsto del sistema. Podemos distinguir dos tipos de metas: (1) verificación y (2) descubrimiento. Con la verificación , el sistema se limita a verificar la hipótesis del usuario. Con el descubrimiento , el sistema encuentra de forma autónoma nuevos patrones. Además, subdividimos el objetivo de descubrimiento en predicción , donde el sistema encuentra patrones para predecir el comportamiento futuro de algunas entidades, y descripción , donde el sistema encuentra patrones para presentarlos a un usuario en una forma com

Minería de datos y KDD

Imagen
Históricamente, a la noción de encontrar patrones útiles en datos se le ha dado distintos nombres, incluyendo minería de datos , extracción de conocimiento, descubrimiento de información, recolección de información, arqueología de datos y procesamiento de patrones de datos. El término minería de datos ha sido utilizado principalmente por las comunidades de estadísticos, analistas de datos y sistemas de información de gestión (MIS). También ha ganado popularidad en el campo de base de datos. La frase descubrimiento de conocimiento en bases de datos fue acuñada en el primer taller de KDD en 1989 (Piatetsky-Shapiro 1991) para enfatizar que el conocimiento es el producto final de un descubrimiento basado en datos. Se ha popularizado en la IA y en los campos de aprendizaje automático o machine learning. En nuestra opinión, el KDD se refiere al proceso general de descubrir conocimientos útiles a partir de datos, y la minería de datos se refiere a un paso particular en este proceso. La

La minería de datos y el descubrimento del conocimiento en la vida real

Un elevado grado del actual interés por el KDD es el resultado del interés mediático que rodea a las aplicaciones exitosas de KDD, por ejemplo, el foco de los artículos de Business Week, Newsweek, Byte, PC Week y otros periódicos de gran circulación en los últimos dos años. Desafortunadamente, no siempre es fácil separar el hecho de la adulación mediática. No obstante, varios ejemplos bien documentados de sistemas exitosos pueden ser correctamente referidos como aplicaciones KDD y haber estado desplegados en uso operativo de problemas reales de gran escala en ciencia y en los negocios. En ciencias, una de las principales áreas de aplicación es la astronomía. Aquí, SKICAT , logró un notable éxito, siendo un sistema utilizado por los astrónomos para realizar análisis de imágenes, clasificación y catalogación de objetos celestes a partir del reconocimiento de imágenes celestiales (Fayyad, Djorgovski y Weir 1996). En su primera aplicación, el sistema se utilizó para procesar los 3 ter