Deep learning for image captioning: an encoder-decoder architecture with soft attention

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10609/100446

Título :	Deep learning for image captioning: an encoder-decoder architecture with soft attention
Autoría:	Gómez Martínez, Mario
Director:	Casas-Roma, Jordi
Tutor:	Bosch Rue, Anna
Resumen :	El subtitulado automático de imágenes, la tarea de producir automáticamente una descripción en lenguaje natural para una imagen, tiene el potencial de ayudar a las personas con discapacidades visuales a explicar las imágenes mediante sistemas de conversión de texto a voz. Sin embargo, el subtitulado preciso de imágenes es una tarea desafiante que requiere integrar y avanzar en la intersección de los campos de procesamiento de lenguaje natural y visión por computador. Este trabajo pretende desarrollar un modelo basado en redes neuronales y aprendizaje profundo para la generación automática de descripciones de imágenes.
Palabras clave :	subtitulado de imágenes aprendizaje profundo redes neuronales artificiales
Tipo de documento:	info:eu-repo/semantics/masterThesis
Fecha de publicación :	28-jun-2019
Licencia de publicación:	http://creativecommons.org/licenses/by-nc-sa/3.0/es/
Aparece en las colecciones:	Bachelor thesis, research projects, etc.