Empreu aquest identificador per citar o enllaçar aquest ítem:
http://hdl.handle.net/10609/145367
Títol: | A lightweight CRNN for end-to-end scene text recognition |
Autoria: | Alaña Olivares, Bittor |
Tutor: | Sanromà Lucia, Manuel Rossinyol Sanabra, Marçal |
Resum: | El reconeixement de text en escena (STR) és una tasca d'enormes proporcions en el camp de la visió per ordinador, en la qual, partint d'una imatge presa en qualsevol context al carrer o "en la naturalesa", cal detectar qualsevol instància de text i reconèixer els seus caràcters. L'adveniment de les xarxes neuronals convolucionals ha permès un progrés impressionant en aquest camp, però molts dels algorismes de RTS continuen sent molt pesats i costosos des del punt de vista computacional. En aquest projecte hem desenvolupat algorismes lleugers per a detectar text en la naturalesa i reconèixer-ho després. Partint d'un coneixement molt bàsic de TensorFlow, primer hem estudiat implementacions ben establertes, i després hem construït i entrenat un algorisme de detecció des de zero primer; i una xarxa de detecció i reconeixement d'extrem a extrem després. L'algorisme de detecció ha aconseguit resultats notables sent més de tres vegades més ràpid que altres algorismes de l'estat de l'art i mantenint el cost de computació i els requisits molt més baixos. |
Paraules clau: | reconeixement òptic de caràcters xarxes neuronals convolucionals visió per ordinador |
Tipus de document: | info:eu-repo/semantics/masterThesis |
Data de publicació: | 12-jun-2022 |
Llicència de publicació: | http://creativecommons.org/licenses/by-nc-nd/3.0/es/ |
Apareix a les col·leccions: | Bachelor thesis, research projects, etc. |
Arxius per aquest ítem:
Arxiu | Descripció | Mida | Format | |
---|---|---|---|---|
balanaFMDP0622report.pdf | Memory of TFM | 11,8 MB | Adobe PDF | Veure/Obrir |
Comparteix:
Aquest ítem està subjecte a una llicència de Creative Commons Llicència Creative Commons