Por favor, use este identificador para citar o enlazar este ítem:
http://hdl.handle.net/10609/81437
Título : | Implementation of a spoken language system |
Autoría: | Perez Guijarro, Jessica |
Tutor: | Isern, David |
Otros: | Universitat Oberta de Catalunya Ventura, Carles |
Resumen : | Este proyecto consiste en la implementación de un sistema de lenguaje que forma parte de los sistemas de diálogo como Siri. El sistema está constituido por dos bloques independientes: Automatic Speech Recognition, encargado de identificar aquello que está verbalizando el usuario y transformalo a texto, y el Spoken Language System, encargado de dotar comprensión al texto, identificando las partes significativas de dicho texto. Cada uno de los componentes se ha entrenado con técnicas y datasets distintos ya que, no comparten un objetivo común. En concreto, para el desarrollo del módulo ASR se ha trabajado con un subset previamente seleccionado del dataset VoxForge English, cuyos datos han sido entrenados mediante Hidden Markov Models. Por otro lado, para el desarrollo del módulo SLU se ha trabajado con Redes Neuronales Recurrentes y un variante del dataset ATIS previamente entrenado con el método Word Embedding. Pese a que la precisión obtenida en los cada uno de los es más que aceptable, el funcionamiento de la integración de ambos resulta inestable. |
Palabras clave : | redes neuronales recurrentes reconocimiento automático del habla |
Tipo de documento: | info:eu-repo/semantics/bachelorThesis |
Fecha de publicación : | 5-jun-2018 |
Licencia de publicación: | http://creativecommons.org/licenses/by-nc-nd/3.0/es/ |
Aparece en las colecciones: | Bachelor thesis, research projects, etc. |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
TFG Presentacio¿n.mov | 576,73 MB | Video Quicktime | Visualizar/Abrir | |
jperezguijaTFG0618memoria.pdf | Memòria del TFG | 913,56 kB | Adobe PDF | Visualizar/Abrir |
jperezguijaTFG0618presentación.pdf | Presentación del TFG | 462,72 kB | Adobe PDF | Visualizar/Abrir |
Comparte:
Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons