“Herramienta software para implementar minería de datos:clusterización utilizando lógica difusa”

“Herramienta software para implementar minería de datos:clusterización utilizando lógica difusa”

Contenido principal del artículo

J. SANABRIA GARZÓN

Resumen

RESUMEN: La minería de datos se ha convertido en un área de investigación y desarrollo, desde la cual se proponen técnicas que apuntan a encontrar el conocimiento oculto en grandes colecciones de datos.  Estos datos contienen información valiosa, que puede ser usada para  mejorar la competitividad de las instituciones dueñas de la información. La información por descubrir puede tener muchas formas, entre ellas reglas asociativas o grupos de conjuntos denominados (Cluster), si a esto se le suma la capacidad que tiene la lógica difusa de romper con el principio del tercero excluido y permitir la pertenencia  de un elemento a varios Cluster, se tiene una metodología útil a la hora de clasificar en grupos el contenido de las bases de datos. En el presente artículo se presenta la implementación del algoritmo denominado C-Means para la agrupación de datos en conjuntos difusos, como técnica de minería de datos, esta técnica se implementó en el programa SM2D 1.2 Beta (Software  Minería  Datos Difusa), y se presenta como ejemplo el analisis del rendimiento académico de la asignatura  fisiología vegetal. Palabras Claves: Bases de Datos (BD), Conjuntos Difusos, Cluster,   C-Means, Minería de Datos

ABSTRACT: The data  mining has become an investigation and development area, in which are intending technicals that point to find the hidden information in a huge data. These data contain valuable information that can be used to improve the  competitiveness  of institutions owners of these data.

The information  to discover can have many forms,  among  them associative  rules or groups of denominated  sets (Cluster), if to this we add the capacity that  has the Fuzzy Logic of breaking up with the third  excluded principle and to allow the relevancy from an element to several Cluster, we have a quite useful methodology when classifying in sets the content of the database.

associative  rules or groups of denominated sets (Cluster), if to this we add the capacity that  has the Fuzzy Logic of breaking up with the third  excluded principle and to allow the relevancy from an element to several Cluster, we have a quite useful methodology when classifying in sets the content of the databases.

In this paper is shown the implementation  of an  algorithm denominated C -Means for the grouping of data in fuzzy sets, this it has been implemented with the development of a  denominated program  (Software  Mining Data Fuzzy) SM2D 1.21.0  Beta.

Key words: Data Bases (BD), Fuzzy Sets, Cluster, C-Means, Data Mining.

Descargas

Los datos de descargas todavía no están disponibles.

Detalles del artículo

Biografía del autor/a (VER)

J. SANABRIA GARZÓN

Ingeniería de Sistemas