Empreu aquest identificador per citar o enllaçar aquest ítem: http://hdl.handle.net/10609/150950
Títol: Tècniques de Deep Learning per reconeixement i classificació d'àudio
Autoria: Garriga Muñoz, Jordi
Director: Moyà Alcover, Gabriel
Tutor: Sanchez Castaño, Friman
Resum: El món de la Intel·ligència Artificial cada cop avança més ràpid i cada dia veiem novetats en tots els seus vessants, especialment en el processament i generació d’imatges i vídeo. Les actuals tècniques de deep learning com les Convolutional Neural Networks o els models transformers han permès grans avenços mai pensats abans. En aquest treball es pretén introduir el lector en l’ús d’aquestes tècniques adaptades al processament del so i audio. Per fer-ho, s’ha triat un camp concret com és el del reconeixement i classificació de sons. El treball consta de dues parts: d’una banda, s’introdueixen els conceptes teòrics bàsics sobre aquesta disciplina; característiques del so i mètodes de conversió analògica-digital, processament, i tractament posterior. També s’expliquen les solucions disponibles actualment al mercat i els diferents estudis i recerca que diversos investigadors duen a terme en aquest camp. De l’altra, es vol mostrar un cas pràctic concret de l’ús del deep learning per la classificació de so. Mitjançant la creació d’un model convenientment entrenat a partir d’un dataset amb gran quantitat de referències sonores, aquest ha de ser capaç d’identificar i classificar amb el major nivell de precisió possible fragments sonors del mateix tipus. Per fer-ho, s’utilitzarà una combinació de vàries tècniques, englobades dins d’un concepte teòric conegut com CLAP (Contrastive Language Audio Procesing), que fa servir CNNs per processar els fragments sonors del conjunt d’entrenament juntament amb etiquetes de text que descriuen el so que conté el fragment.
Paraules clau: deep learning
classificació d'àudio
CNN
Tipus de document: info:eu-repo/semantics/bachelorThesis
Data de publicació: 28-jun-2024
Llicència de publicació: http://creativecommons.org/licenses/by-nc-nd/3.0/es/  
Apareix a les col·leccions:Bachelor thesis, research projects, etc.

Arxius per aquest ítem:
Arxiu Descripció MidaFormat 
jgarrigamoonTFG0624.pdfMemòria en PDF del treball2,17 MBAdobe PDFThumbnail
Veure/Obrir

TFG_Presentació_JordiGarriga.mp4

Vídeo de la presentació del treball541,67 MBMP4Veure/Obrir
Comparteix:
Exporta:
Consulta les estadístiques

Els ítems del Repositori es troben protegits per copyright, amb tots els drets reservats, sempre i quan no s’indiqui el contrari.