Deep learning for image captioning: an encoder-decoder architecture with soft attention

Gómez Martínez, Mario

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10609/100446

Registro completo de metadatos

Campo DC	Valor	Lengua/Idioma
dc.contributor.author	Gómez Martínez, Mario	-
dc.date.accessioned	2019-09-06T13:01:02Z	-
dc.date.available	2019-09-06T13:01:02Z	-
dc.date.issued	2019-06-28	-
dc.identifier.uri	http://hdl.handle.net/10609/100446	-
dc.description.abstract	El subtitulado automático de imágenes, la tarea de producir automáticamente una descripción en lenguaje natural para una imagen, tiene el potencial de ayudar a las personas con discapacidades visuales a explicar las imágenes mediante sistemas de conversión de texto a voz. Sin embargo, el subtitulado preciso de imágenes es una tarea desafiante que requiere integrar y avanzar en la intersección de los campos de procesamiento de lenguaje natural y visión por computador. Este trabajo pretende desarrollar un modelo basado en redes neuronales y aprendizaje profundo para la generación automática de descripciones de imágenes.	es
dc.description.abstract	Automatic image captioning, the task of automatically producing a natural-language description for an image, has the potential to assist those with visual impairments by explaining images using text-to-speech systems. However, accurate image captioning is a challenging task that requires integrating and pushing further the latest improvements at the intersection of computer vision and natural language processing fields This work aims at building an advanced model based on neural networks and deep learning for the automated generation of image captions.	en
dc.description.abstract	El subtitulat automàtic d'imatges, la tasca de produir automàticament una descripció en llenguatge natural per a una imatge, té el potencial d'ajudar a les persones amb discapacitats visuals a explicar les imatges, mitjançant sistemes de conversió de text a veu. No obstant això, el subtitulat precís és un desafiament important que requereix integrar i avançar en la intersecció dels camps de processament de llenguatge natural i visió per computador. Aquest treball pretén desenvolupar un model basat en xarxes neuronals i aprenentatge profund per a la generació automàtica de descripcions d'imatges.	ca
dc.format.mimetype	application/pdf	-
dc.language.iso	eng	-
dc.publisher	Universitat Oberta de Catalunya (UOC)	-
dc.rights	CC BY-NC-SA	-
dc.rights.uri	http://creativecommons.org/licenses/by-nc-sa/3.0/es/	-
dc.subject	subtitulado de imágenes	es
dc.subject	image captioning	en
dc.subject	aprendizaje profundo	es
dc.subject	deep learning	en
dc.subject	aprenentatge profund	ca
dc.subject	redes neuronales artificiales	es
dc.subject	artificial neural networks	en
dc.subject	xarxes neuronals artificials	ca
dc.subject	subtitulat d'imatges	ca
dc.subject.lcsh	Machine learning -- TFM	en
dc.title	Deep learning for image captioning: an encoder-decoder architecture with soft attention	-
dc.type	info:eu-repo/semantics/masterThesis	-
dc.audience.educationlevel	Estudis de Màster	ca
dc.audience.educationlevel	Estudios de Máster	es
dc.audience.educationlevel	Master's degrees	en
dc.subject.lemac	Aprenentatge automàtic -- TFM	ca
dc.subject.lcshes	Aprendizaje automático -- TFM	es
dc.contributor.director	Casas-Roma, Jordi	-
dc.contributor.tutor	Bosch Rue, Anna	-
dc.rights.accessRights	info:eu-repo/semantics/openAccess	-
Aparece en las colecciones:	Bachelor thesis, research projects, etc.