Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10609/77147
Título : Semi-automatic generation of a corpus of Wikipedia articles on science and technology
Autoría: Minguillón, Julià  
Lerga, Maura  
Aibar, Eduard  
Llados-Masllorens, Josep  
Meseguer-Artola, Antoni  
Otros: Universitat Oberta de Catalunya (UOC)
Citación : Minguillón, J., Lerga Felip, M., Aibar, E., Lladós-Masllorens, J. & Meseguer-Artola, A. (2017). Semi-automatic generation of a corpus of Wikipedia articles on science and technology. El Profesional de la Información, 26(5), 995-1005. doi: 10.3145/epi.2017.sep.20
Resumen : A pesar de la gran cantidad de contenido científico y tecnológico disponible en la World Wide Web, su mayoría se encuentra encerrado tras sistemas de pago, como las revistas académicas, o es casi invisible, como los repositorios institucionales. Wikipedia puede actuar como un agente de transferencia, proporcionando una estructura organizada y accesible conteniendo tanto contenidos como enlaces a las fuentes originales. En Wikipedia las categorías se han cread colaborativamente y por lo tanto son más una folksonomía que una verdadera taxonomía. Consecuentemente, las categorías no son una herramienta válida para identificar la organización de los contenidos. En este artículo se describe un método semi-automático, basado en paseos aleatorios, para determinar un subconjunto de páginas con contenido científico y tecnológico de la Wikipedia española. Usando la taxonomía Unesco, se determina la estructura subyacente del grafo del corpus y se detectan grupos de páginas fuertemente enlazadas, estableciendo las relaciones entre las áreas de conocimiento. Finalmente, se presenta la distribución de artículos de Wikipedia de acuerdo con la taxonomía Unesco y el mapa resultante de contenido científico y tecnológico.
Palabras clave : corpus
ciencia y tecnología
detección de comunidades
taxonomía Unesco
Infomap
Wikipedia
DOI: 10.3145/epi.2017.sep.20
Tipo de documento: info:eu-repo/semantics/article
Versión del documento: info:eu-repo/semantics/publishedVersion
Fecha de publicación : sep-2017
Aparece en las colecciones: Articles
Articles cientÍfics

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
minguillon_semi_automatic.pdf2,62 MBAdobe PDFVista previa
Visualizar/Abrir