Por favor, use este identificador para citar o enlazar este ítem:
http://hdl.handle.net/10609/100446
Registro completo de metadatos
Campo DC | Valor | Lengua/Idioma |
---|---|---|
dc.contributor.author | Gómez Martínez, Mario | - |
dc.date.accessioned | 2019-09-06T13:01:02Z | - |
dc.date.available | 2019-09-06T13:01:02Z | - |
dc.date.issued | 2019-06-28 | - |
dc.identifier.uri | http://hdl.handle.net/10609/100446 | - |
dc.description.abstract | El subtitulado automático de imágenes, la tarea de producir automáticamente una descripción en lenguaje natural para una imagen, tiene el potencial de ayudar a las personas con discapacidades visuales a explicar las imágenes mediante sistemas de conversión de texto a voz. Sin embargo, el subtitulado preciso de imágenes es una tarea desafiante que requiere integrar y avanzar en la intersección de los campos de procesamiento de lenguaje natural y visión por computador. Este trabajo pretende desarrollar un modelo basado en redes neuronales y aprendizaje profundo para la generación automática de descripciones de imágenes. | es |
dc.description.abstract | Automatic image captioning, the task of automatically producing a natural-language description for an image, has the potential to assist those with visual impairments by explaining images using text-to-speech systems. However, accurate image captioning is a challenging task that requires integrating and pushing further the latest improvements at the intersection of computer vision and natural language processing fields This work aims at building an advanced model based on neural networks and deep learning for the automated generation of image captions. | en |
dc.description.abstract | El subtitulat automàtic d'imatges, la tasca de produir automàticament una descripció en llenguatge natural per a una imatge, té el potencial d'ajudar a les persones amb discapacitats visuals a explicar les imatges, mitjançant sistemes de conversió de text a veu. No obstant això, el subtitulat precís és un desafiament important que requereix integrar i avançar en la intersecció dels camps de processament de llenguatge natural i visió per computador. Aquest treball pretén desenvolupar un model basat en xarxes neuronals i aprenentatge profund per a la generació automàtica de descripcions d'imatges. | ca |
dc.format.mimetype | application/pdf | - |
dc.language.iso | eng | - |
dc.publisher | Universitat Oberta de Catalunya (UOC) | - |
dc.rights | CC BY-NC-SA | - |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-sa/3.0/es/ | - |
dc.subject | subtitulado de imágenes | es |
dc.subject | image captioning | en |
dc.subject | aprendizaje profundo | es |
dc.subject | deep learning | en |
dc.subject | aprenentatge profund | ca |
dc.subject | redes neuronales artificiales | es |
dc.subject | artificial neural networks | en |
dc.subject | xarxes neuronals artificials | ca |
dc.subject | subtitulat d'imatges | ca |
dc.subject.lcsh | Machine learning -- TFM | en |
dc.title | Deep learning for image captioning: an encoder-decoder architecture with soft attention | - |
dc.type | info:eu-repo/semantics/masterThesis | - |
dc.audience.educationlevel | Estudis de Màster | ca |
dc.audience.educationlevel | Estudios de Máster | es |
dc.audience.educationlevel | Master's degrees | en |
dc.subject.lemac | Aprenentatge automàtic -- TFM | ca |
dc.subject.lcshes | Aprendizaje automático -- TFM | es |
dc.contributor.director | Casas-Roma, Jordi | - |
dc.contributor.tutor | Bosch Rue, Anna | - |
dc.rights.accessRights | info:eu-repo/semantics/openAccess | - |
Aparece en las colecciones: | Bachelor thesis, research projects, etc. |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
magomarTFM0619memory.pdf | Memory of TFM | 7,85 MB | Adobe PDF | Visualizar/Abrir |
Comparte:
Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons