Por favor, use este identificador para citar o enlazar este ítem:
http://hdl.handle.net/10609/77147
Registro completo de metadatos
Campo DC | Valor | Lengua/Idioma |
---|---|---|
dc.contributor.author | Minguillón, Julià | - |
dc.contributor.author | Lerga, Maura | - |
dc.contributor.author | Aibar, Eduard | - |
dc.contributor.author | Llados-Masllorens, Josep | - |
dc.contributor.author | Meseguer-Artola, Antoni | - |
dc.contributor.other | Universitat Oberta de Catalunya (UOC) | - |
dc.date.accessioned | 2018-05-02T10:23:02Z | - |
dc.date.available | 2018-05-02T10:23:02Z | - |
dc.date.issued | 2017-09 | - |
dc.identifier.citation | Minguillón, J., Lerga Felip, M., Aibar, E., Lladós-Masllorens, J. & Meseguer-Artola, A. (2017). Semi-automatic generation of a corpus of Wikipedia articles on science and technology. El Profesional de la Información, 26(5), 995-1005. doi: 10.3145/epi.2017.sep.20 | - |
dc.identifier.issn | 1699-2407MIAR | - |
dc.identifier.uri | http://hdl.handle.net/10609/77147 | - |
dc.description.abstract | Despite the huge amount of scientific and technological content available on the World Wide Web, most of it is closed behind paywalls, as with academic journals, or almost invisible, as with institutional repositories. Wikipedia can act as a chain-transfer agent, providing people with an accessible, organized structure containing both understandable content and links to original sources. In Wikipedia, categories are collaboratively created and thus become a folksonomy rather than a true taxonomy. Consequently, categories are not a reliable tool to identify topics¿ organization. In this paper we describe a semi-automatic method, based on random walks, for determining a subset of pages containing scientific and technological content in the Spanish Wikipedia. Using the Unesco taxonomy, we determined the underlying graph structure of our corpus and detected clusters of pages strongly linked, establishing relationships between knowledge domains. Finally, we present the distribution of Wikipedia articles according to the Unesco taxonomy and the resulting map of scientific and technological content. | en |
dc.description.abstract | A pesar de la gran cantidad de contenido científico y tecnológico disponible en la World Wide Web, su mayoría se encuentra encerrado tras sistemas de pago, como las revistas académicas, o es casi invisible, como los repositorios institucionales. Wikipedia puede actuar como un agente de transferencia, proporcionando una estructura organizada y accesible conteniendo tanto contenidos como enlaces a las fuentes originales. En Wikipedia las categorías se han cread colaborativamente y por lo tanto son más una folksonomía que una verdadera taxonomía. Consecuentemente, las categorías no son una herramienta válida para identificar la organización de los contenidos. En este artículo se describe un método semi-automático, basado en paseos aleatorios, para determinar un subconjunto de páginas con contenido científico y tecnológico de la Wikipedia española. Usando la taxonomía Unesco, se determina la estructura subyacente del grafo del corpus y se detectan grupos de páginas fuertemente enlazadas, estableciendo las relaciones entre las áreas de conocimiento. Finalmente, se presenta la distribución de artículos de Wikipedia de acuerdo con la taxonomía Unesco y el mapa resultante de contenido científico y tecnológico. | es |
dc.format.mimetype | application/pdf | - |
dc.language.iso | eng | - |
dc.publisher | El Profesional de la Información | - |
dc.relation.ispartof | El Profesional de la Información, 2017, 26(5) | - |
dc.relation.uri | http://www.elprofesionaldelainformacion.com/contenidos/2017/sep/20.html | - |
dc.rights | (c) Author/s & (c) Journal | - |
dc.subject | Wikipedia | en |
dc.subject | science and technology | en |
dc.subject | corpus | es |
dc.subject | Infomap | en |
dc.subject | community detection | en |
dc.subject | Unesco taxonomy | en |
dc.subject | ciencia y tecnología | es |
dc.subject | detección de comunidades | es |
dc.subject | taxonomía Unesco | es |
dc.subject | Infomap | es |
dc.subject | Wikipedia | ca |
dc.subject | Infomap | ca |
dc.subject | ciència i tecnologia | ca |
dc.subject | corpus | ca |
dc.subject | corpus | en |
dc.subject | detecció de comunitats | ca |
dc.subject | taxonomia Unesco | ca |
dc.subject | Wikipedia | es |
dc.subject.lcsh | Science news | en |
dc.title | Semi-automatic generation of a corpus of Wikipedia articles on science and technology | - |
dc.type | info:eu-repo/semantics/article | - |
dc.audience.mediator | Theme areas::Information and Knowledge Society::Information and Knowledge Society | en |
dc.subject.lemac | Divulgació científica | ca |
dc.subject.lcshes | Divulgación científica | es |
dc.rights.accessRights | info:eu-repo/semantics/openAccess | - |
dc.identifier.doi | 10.3145/epi.2017.sep.20 | - |
dc.gir.id | AR/0000005703 | - |
dc.type.version | info:eu-repo/semantics/publishedVersion | - |
Aparece en las colecciones: | Articles Articles cientÍfics |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
minguillon_semi_automatic.pdf | 2,62 MB | Adobe PDF | Visualizar/Abrir |
Comparte:
Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons