Empreu aquest identificador per citar o enllaçar aquest ítem:
http://hdl.handle.net/10609/100446
Títol: | Deep learning for image captioning: an encoder-decoder architecture with soft attention |
Autoria: | Gómez Martínez, Mario |
Director: | Casas-Roma, Jordi |
Tutor: | Bosch Rue, Anna |
Resum: | El subtitulat automàtic d'imatges, la tasca de produir automàticament una descripció en llenguatge natural per a una imatge, té el potencial d'ajudar a les persones amb discapacitats visuals a explicar les imatges, mitjançant sistemes de conversió de text a veu. No obstant això, el subtitulat precís és un desafiament important que requereix integrar i avançar en la intersecció dels camps de processament de llenguatge natural i visió per computador. Aquest treball pretén desenvolupar un model basat en xarxes neuronals i aprenentatge profund per a la generació automàtica de descripcions d'imatges. |
Paraules clau: | aprenentatge profund xarxes neuronals artificials subtitulat d'imatges |
Tipus de document: | info:eu-repo/semantics/masterThesis |
Data de publicació: | 28-jun-2019 |
Llicència de publicació: | http://creativecommons.org/licenses/by-nc-sa/3.0/es/ |
Apareix a les col·leccions: | Bachelor thesis, research projects, etc. |
Arxius per aquest ítem:
Arxiu | Descripció | Mida | Format | |
---|---|---|---|---|
magomarTFM0619memory.pdf | Memory of TFM | 7,85 MB | Adobe PDF | Veure/Obrir |
Comparteix:
Aquest ítem està subjecte a una llicència de Creative Commons Llicència Creative Commons