Entradas

Mostrando las entradas etiquetadas como descubrimiento conocimiento bases de datos

Minería de datos y KDD

Imagen
Históricamente, a la noción de encontrar patrones útiles en datos se le ha dado distintos nombres, incluyendo minería de datos , extracción de conocimiento, descubrimiento de información, recolección de información, arqueología de datos y procesamiento de patrones de datos. El término minería de datos ha sido utilizado principalmente por las comunidades de estadísticos, analistas de datos y sistemas de información de gestión (MIS). También ha ganado popularidad en el campo de base de datos. La frase descubrimiento de conocimiento en bases de datos fue acuñada en el primer taller de KDD en 1989 (Piatetsky-Shapiro 1991) para enfatizar que el conocimiento es el producto final de un descubrimiento basado en datos. Se ha popularizado en la IA y en los campos de aprendizaje automático o machine learning. En nuestra opinión, el KDD se refiere al proceso general de descubrir conocimientos útiles a partir de datos, y la minería de datos se refiere a un paso particular en este proceso. La

De la minería de datos al descubrimiento de conocimiento en bases de datos KDD

La minería de datos y el descubrimiento de conocimiento en bases de datos  (KDD por sus cifras en inglés knowledge discovery in databases) han estado atrayendo últimamente una significativa atención de las investigaciones, la industria y los medios de comunicación. ¿Por qué toda esta atención? Este artículo ofrece una visión general de este campo emergente, aclarando cómo la minería de datos y el descubrimiento de conocimiento en bases de datos están relacionados el uno al otro y a campos afines, como el aprendizaje automático, las estadísticas y las bases de datos. El artículo menciona aplicaciones particulares en la vida real, técnicas específicas de minería de datos, desafíos involucrados en las aplicaciones de descubrimiento de conocimiento en la vida real y, actuales y futuros rumbos de investigaciones en el campo. A través de una amplia variedad de campos, los datos se han estado recolectando y acumulando a un ritmo dramático. Existe una necesidad imperiosa de una nueva gen