Empreu aquest identificador per citar o enllaçar aquest ítem:
http://hdl.handle.net/10609/149808
Títol: | VClipper: Exploiting CLIP Zero-shot capabilities for moment retrieval in video recordings |
Autoria: | Caravaca Muller, Oriol |
Tutor: | Benito Altamirano, Ismael |
Resum: | Aquesta investigació explora la integració de CLIP, un model preentrenat, en l'anàlisi de contingut de vídeo. En un paisatge inundat de dades multimèdia, identificar moments específics dels vídeos és un repte persistent. Aprofitant les capacitats de cerca semàntica i visual de CLIP, aquest estudi intenta perfeccionar els mètodes de recuperació de contingut. Subratllant l'eficiència i l'aplicabilitat, fent aquest procés més precís i pràctic. En aquesta investigació també s’ha revisat l’estat de l’art i s’ha produit un anàlisis empíric sobre els efectes del postprocessament sobre els vectors de semblança obtinguts a partir dels codificadors de CLIP. Finalment s’han desenvolupat dos mètodes diferents dirigits a tasques de recuperació de moments en dades audiovisuals, obtenint un model que és capaç de superar els treballs anteriors en Zero-shot moment revival, arribant a 57,3 a R@1 IoU=0,5 i 51,6 a mAP@0,5. |
Paraules clau: | video analysis moment retrieval CLIP |
Tipus de document: | info:eu-repo/semantics/masterThesis |
Data de publicació: | 9-gen-2024 |
Llicència de publicació: | http://creativecommons.org/licenses/by-nc-nd/3.0/es/ |
Apareix a les col·leccions: | Bachelor thesis, research projects, etc. |
Arxius per aquest ítem:
Arxiu | Descripció | Mida | Format | |
---|---|---|---|---|
ocaravacamTFM0123memorioa.pdf | Report of FMDP | 2,19 MB | Adobe PDF | Veure/Obrir |
Comparteix:
Aquest ítem està subjecte a una llicència de Creative CommonsLlicència Creative Commons