Por favor, use este identificador para citar o enlazar este ítem:
http://hdl.handle.net/10609/145367
Registro completo de metadatos
Campo DC | Valor | Lengua/Idioma |
---|---|---|
dc.contributor.author | Alaña Olivares, Bittor | - |
dc.coverage.spatial | Bilbao, ESP | - |
dc.date.accessioned | 2022-06-20T17:59:18Z | - |
dc.date.available | 2022-06-20T17:59:18Z | - |
dc.date.issued | 2022-06-12 | - |
dc.identifier.uri | http://hdl.handle.net/10609/145367 | - |
dc.description.abstract | Scene Text Recognition (STR) is a daunting task in computer vision, where starting from an image taken in any context out in the street or 'in the wild', any instances of text must be detected and its characters recognised. The advent of Convolutional Neural Networks has allowed impressive progress in this field, but many of the STR algorithms remain very heavy and computationally expensive. In this project we have developed lightweight algorithms to detect text in the wild, and to then recognise it. Starting from a very basic knowledge of TensorFlow, we have first studied well established implementations, and then built and trained a detection algorithm from scratch first; and an end-to-end detection and recognition network later. The detection algorithm has achieved remarkable results while being over three times faster than other state-of-the-art algorithms and keeping computation cost and requirements much lower. | en |
dc.description.abstract | El reconocimiento de texto en escena (STR) es una tarea de enormes proporciones en el campo de la visión por ordenador, en la que, partiendo de una imagen tomada en cualquier contexto en la calle o "en la naturaleza", hay que detectar cualquier instancia de texto y reconocer sus caracteres. El advenimiento de las redes neuronales convolucionales ha permitido un progreso impresionante en este campo, pero muchos de los algoritmos de RTS siguen siendo muy pesados y costosos desde el punto de vista computacional. En este proyecto hemos desarrollado algoritmos ligeros para detectar texto en la naturaleza y reconocerlo después. Partiendo de un conocimiento muy básico de TensorFlow, primero hemos estudiado implementaciones bien establecidas, y luego hemos construido y entrenado un algoritmo de detección desde cero primero; y una red de detección y reconocimiento de extremo a extremo después. El algoritmo de detección ha conseguido resultados notables siendo más de tres veces más rápido que otros algoritmos del estado del arte y manteniendo el coste de computación y los requisitos mucho más bajos. | es |
dc.description.abstract | El reconeixement de text en escena (STR) és una tasca d'enormes proporcions en el camp de la visió per ordinador, en la qual, partint d'una imatge presa en qualsevol context al carrer o "en la naturalesa", cal detectar qualsevol instància de text i reconèixer els seus caràcters. L'adveniment de les xarxes neuronals convolucionals ha permès un progrés impressionant en aquest camp, però molts dels algorismes de RTS continuen sent molt pesats i costosos des del punt de vista computacional. En aquest projecte hem desenvolupat algorismes lleugers per a detectar text en la naturalesa i reconèixer-ho després. Partint d'un coneixement molt bàsic de TensorFlow, primer hem estudiat implementacions ben establertes, i després hem construït i entrenat un algorisme de detecció des de zero primer; i una xarxa de detecció i reconeixement d'extrem a extrem després. L'algorisme de detecció ha aconseguit resultats notables sent més de tres vegades més ràpid que altres algorismes de l'estat de l'art i mantenint el cost de computació i els requisits molt més baixos. | ca |
dc.format.mimetype | application/pdf | - |
dc.language.iso | eng | - |
dc.publisher | Universitat Oberta de Catalunya (UOC) | - |
dc.rights | CC BY-NC-ND | - |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/es/ | - |
dc.subject | optical character recognition | en |
dc.subject | convolutional neural networks | en |
dc.subject | computer vision | en |
dc.subject | reconocimiento óptico de caracteres | es |
dc.subject | redes neuronales convolucionales | es |
dc.subject | visión por ordenador | es |
dc.subject | reconeixement òptic de caràcters | ca |
dc.subject | xarxes neuronals convolucionals | ca |
dc.subject | visió per ordinador | ca |
dc.subject.lcsh | Optical character recognition -- TFM | en |
dc.title | A lightweight CRNN for end-to-end scene text recognition | - |
dc.type | info:eu-repo/semantics/masterThesis | - |
dc.audience.educationlevel | Estudis de Màster | ca |
dc.audience.educationlevel | Estudios de Máster | es |
dc.audience.educationlevel | Master's degrees | en |
dc.subject.lemac | Reconeixement òptic de caràcters -- TFM | ca |
dc.subject.lcshes | Reconocimiento óptico de caracteres -- TFM | es |
dc.contributor.tutor | Sanromà Lucia, Manuel | - |
dc.contributor.tutor | Rossinyol Sanabra, Marçal | - |
dc.rights.accessRights | info:eu-repo/semantics/openAccess | - |
Aparece en las colecciones: | Bachelor thesis, research projects, etc. |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
balanaFMDP0622report.pdf | Memory of TFM | 11,8 MB | Adobe PDF | Visualizar/Abrir |
Comparte:
Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons