Deep learning for image captioning: an encoder-decoder architecture with soft attention

Empreu aquest identificador per citar o enllaçar aquest ítem: http://hdl.handle.net/10609/100446

Títol:	Deep learning for image captioning: an encoder-decoder architecture with soft attention
Autoria:	Gómez Martínez, Mario
Director:	Casas-Roma, Jordi
Tutor:	Bosch Rue, Anna
Resum:	El subtitulat automàtic d'imatges, la tasca de produir automàticament una descripció en llenguatge natural per a una imatge, té el potencial d'ajudar a les persones amb discapacitats visuals a explicar les imatges, mitjançant sistemes de conversió de text a veu. No obstant això, el subtitulat precís és un desafiament important que requereix integrar i avançar en la intersecció dels camps de processament de llenguatge natural i visió per computador. Aquest treball pretén desenvolupar un model basat en xarxes neuronals i aprenentatge profund per a la generació automàtica de descripcions d'imatges.
Paraules clau:	aprenentatge profund xarxes neuronals artificials subtitulat d'imatges
Tipus de document:	info:eu-repo/semantics/masterThesis
Data de publicació:	28-jun-2019
Llicència de publicació:	http://creativecommons.org/licenses/by-nc-sa/3.0/es/
Apareix a les col·leccions:	Bachelor thesis, research projects, etc.