Empreu aquest identificador per citar o enllaçar aquest ítem: http://hdl.handle.net/10609/100446
Títol: Deep learning for image captioning: an encoder-decoder architecture with soft attention
Autoria: Gómez Martínez, Mario
Director: Casas-Roma, Jordi  
Tutor: Bosch Rue, Anna
Resum: El subtitulat automàtic d'imatges, la tasca de produir automàticament una descripció en llenguatge natural per a una imatge, té el potencial d'ajudar a les persones amb discapacitats visuals a explicar les imatges, mitjançant sistemes de conversió de text a veu. No obstant això, el subtitulat precís és un desafiament important que requereix integrar i avançar en la intersecció dels camps de processament de llenguatge natural i visió per computador. Aquest treball pretén desenvolupar un model basat en xarxes neuronals i aprenentatge profund per a la generació automàtica de descripcions d'imatges.
Paraules clau: aprenentatge profund
xarxes neuronals artificials
subtitulat d'imatges
Tipus de document: info:eu-repo/semantics/masterThesis
Data de publicació: 28-jun-2019
Llicència de publicació: http://creativecommons.org/licenses/by-nc-sa/3.0/es/  
Apareix a les col·leccions:Bachelor thesis, research projects, etc.

Arxius per aquest ítem:
Arxiu Descripció MidaFormat 
magomarTFM0619memory.pdfMemory of TFM7,85 MBAdobe PDFThumbnail
Veure/Obrir
Comparteix:
Exporta:
Consulta les estadístiques

Aquest ítem està subjecte a una llicència de Creative Commons Llicència Creative Commons Creative Commons