Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10609/97627
Título : Fuzzy C-means and clustering algorithms: a comparative study
Autoría: García Domingo, Victor
Tutor: Nuñez Do Rio, Joan Manuel
Otros: Ventura, Carles  
Resumen : El clustering es una técnica que agrupa las observaciones de un conjunto de datos en función de la distancia al centro de los clústeres. Uno de los primeros algoritmos de agrupamiento fue el K-Means (KM), que es especialmente preciso para reconocer clústeres bien separados. Posteriormente, el Fuzzy C-Means (FCM) se formuló para mejorar la precisión del KM con conjuntos de datos que contienen grupos superpuestos. Desde entonces, se han desarrollado otros derivados del FCM para mejorarlo: Gustafson Kessel Fuzzy C-Means (GKFCM), para grupos no esféricos, Fuzzy C-Means ++ (FCM ++) y Suppressed-Fuzzy C-Means (S-FCM) para mejorar la eficiencia del FCM y Possibilistic C-Means (PCM), más preciso para conjuntos de datos con ruido y valores atípicos. En este proyecto, he comparado KM, FCM, GKFCM, FCM ++, S-FCM y PCM con el objetivo de comprobar de qué manera cada uno de ellos ha mejorado a su predecesor. Esta comparación está centralizada en FCM. He validado parámetros como la eficiencia computacional, el rendimiento y la precisión. He descubierto que, de entre todos los algoritmos, FCM tiene el mejor rendimiento para conjuntos de datos con grupos superpuestos, aunque S-FCM mejora su eficiencia computacional. Además, KM es el algoritmo más eficiente de todos en términos absolutos, y GKFCM se desempeña bien con clústeres no esféricos, aunque es menos preciso. Finalmente, PCM no ha mostrado ninguna ventaja sobre FCM. Este proyecto es un punto de partida para futuras investigaciones acerca de las condiciones en las que cada algoritmo funciona mejor. La mayoría de los conjuntos de datos utilizados aquí son conjuntos de datos sintéticos con características casi ideales. Sin embargo, se espera que los conjuntos de datos reales tengan estructuras más complejas para las que la elección del mejor algoritmo a utilizar requiere una investigación más exhaustiva.
Palabras clave : clustering
Fuzzy C-Means
algoritmos
Tipo de documento: info:eu-repo/semantics/bachelorThesis
Fecha de publicación : jun-2019
Licencia de publicación: http://creativecommons.org/licenses/by-nc-nd/3.0/es/  
Aparece en las colecciones: Bachelor thesis, research projects, etc.

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  

vgarciadomiTFG0619video.mp4

Video of TFG49,64 MBMP4Visualizar/Abrir
vgarciadomiTFG0619memory.pdfMemory of TFG1,56 MBAdobe PDFVista previa
Visualizar/Abrir
vgarciadomiTFG0619presentation.pdfPresentation of TFG713,65 kBAdobe PDFVista previa
Visualizar/Abrir