Reducción de ruido en señales de audio basada en una red neuronal convolucional

López Mora, Adrián

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10609/97227

Registro completo de metadatos

Campo DC	Valor	Lengua/Idioma
dc.contributor.author	López Mora, Adrián	-
dc.contributor.other	García-Solórzano, David	-
dc.date.accessioned	2019-07-01T17:43:13Z	-
dc.date.available	2019-07-01T17:43:13Z	-
dc.date.issued	2019-06	-
dc.identifier.uri	http://hdl.handle.net/10609/97227	-
dc.description.abstract	En este TFG se implementa un sistema de reducción de ruido en señales de habla basado en una Red Neuronal Convolucional (CNN). Un módulo de transformación de características extrae la magnitud y la fase de la señal de audio a partir del cálculo de la STFT. La CNN mapea la magnitud del espectro de la señal de entrada con ruido a una magnitud de espectro con ruido reducido. Un módulo de reconstrucción de la señal reconstruye la señal de audio con ruido reducido a partir del cálculo inverso de la STFT. Se utiliza como base de datos para el entrenamiento y test de la CNN el corpus catalán de Mozilla Common Voice. Para obtener la señal con ruido se añade AWGN con SNR = 0 dB a las señales de audio limpias. Todo el sistema se implementa sobre MATLAB. Para la medida de la eficacia del sistema se utilizan las métricas PESQ y STOI. Las pruebas sobre el sistema muestran resultados positivos para relaciones SNR iguales a las utilizadas durante el entrenamiento, pero el aumento de la distorsión para relaciones SNR mayores disminuye la inteligibilidad general.	es
dc.description.abstract	En aquest TFG s'implementa un sistema de reducció de soroll en senyals de parla basat en una Xarxa Neuronal Convolucional (CNN). Un mòdul de transformació de característiques extrau la magnitud i la fase del senyal d'àudio a partir del càlcul de la STFT. La CNN mapeja la magnitud de l'espectre del senyal d'entrada amb soroll a una magnitud d'espectre amb soroll reduït. Un mòdul de reconstrucció del senyal reconstrueix el senyal d'àudio amb soroll reduït a partir del càlcul invers de la STFT. S'utilitza com a base de dades per a l'entrenament i test de la CNN el corpus català de Mozilla Common Voice. Per obtenir el senyal amb soroll s'afegeix AWGN amb SNR = 0 dB als senyals d'àudio nets. Tot el sistema s'implementa sobre MATLAB. Per a la mesura de l'eficàcia del sistema s'utilitzen les mètriques PESQ i STOI. Les proves sobre el sistema mostren resultats positius per a relacions SNR iguals a les utilitzades durant l'entrenament, però l'augment de la distorsió per a relacions SNR majors disminueix la intel·ligibilitat general.	ca
dc.description.abstract	This project describes a speech enhancement system implementation based on a Convolutional Neural Network (CNN). A feature transform module computes the STFT and extracts spectral phase and magnitude from the speech signal. The CNN maps the spectrum magnitude of an input noisy speech signal to an output enhanced spectrum. A reconstruction module computes inverse STFT to recover the speech enhanced audio signal. Mozilla Common Voice database, in its Catalan corpus version, is used to perform training and testing. Noisy audio samples are obtained adding AWGN with 0 dB SNR to clean speech signals. PESQ and STOI objective metrics are used to measure system performance. System evaluation shows positive results when using SNR levels as in training, while overall intelligibility deteriorates when using higher SNR levels due to phase distortion.	en
dc.format.mimetype	application/pdf	-
dc.language.iso	spa	-
dc.publisher	Universitat Oberta de Catalunya (UOC)	-
dc.rights	CC BY-NC-ND	-
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/3.0/es/	-
dc.subject	reducción de ruido	es
dc.subject	reducció de soroll	ca
dc.subject	speech enhancement	en
dc.subject	audio	ca
dc.subject	audio	es
dc.subject	audio	en
dc.subject	CNN	ca
dc.subject	CNN	es
dc.subject	CNN	en
dc.subject.lcsh	Signal processing -- TFG	en
dc.title	Reducción de ruido en señales de audio basada en una red neuronal convolucional	-
dc.type	info:eu-repo/semantics/bachelorThesis	-
dc.audience.educationlevel	Estudis de Grau	ca
dc.audience.educationlevel	Estudios de Grado	es
dc.audience.educationlevel	University degrees	en
dc.subject.lemac	Tractament del senyal -- TFG	ca
dc.subject.lcshes	Tratamiento de la señal -- TFG	es
dc.contributor.tutor	Meler Corretjé, Lourdes	-
dc.rights.accessRights	info:eu-repo/semantics/openAccess	-
Aparece en las colecciones:	Bachelor thesis, research projects, etc.

Ficheros en este ítem:

Fichero	Descripción	Tamaño	Formato
alopezmoraPresentaciónTFG0619.mp4	Presentación del TFG	26,12 MB	MP4	Visualizar/Abrir
alopezmoraCódigoTFG0619.zip	Código implementado	268,23 kB	ZIP	Visualizar/Abrir
alopezmoraTFG0619memoria.pdf		1,35 MB	Adobe PDF	Visualizar/Abrir