Por favor, use este identificador para citar o enlazar este ítem:
http://hdl.handle.net/10609/88605
Registro completo de metadatos
Campo DC | Valor | Lengua/Idioma |
---|---|---|
dc.contributor.author | Rodríguez Olmos, Miguel Andrés | - |
dc.date.accessioned | 2019-01-23T17:18:44Z | - |
dc.date.available | 2019-01-23T17:18:44Z | - |
dc.date.issued | 2019-01 | - |
dc.identifier.uri | http://hdl.handle.net/10609/88605 | - |
dc.description.abstract | We employ methods from deep learning for image recognition. We use a dataset with +70k images and 73 classes in order to compare the performance of several well known deep network architectures. The approaches used include the full training of these networks and also the techniques of transfer learning and fine tuning with the weights pretrained on the ImageNet set. We show the superiority of the latter approach in our dataset. We also experiment with a reorganization of the labels in our dataset by grouping several classes shown by the confusion matrix to be indistinguishable for the models. In this case we obtain a classification accuracy score higher than 50%. | en |
dc.description.abstract | Utilizamos métodos de aprendizaje profundo en el contexto de reconocimiento de imágenes. Utilizamos un conjunto de más de 70 mil imágenes y 73 clases diferentes para comparar el rendimiento de diferentes arquitecturas comúnmente empleadas. Los enfoques utilizados en este trabajo incluyen en un entrenamiento completo de estas redes y también estrategias de transferencia del aprendizaje y calibración de modelos con redes pre entrenadas en el conjunto ImageNet. Mostramos la superioridad de este último enfoque en nuestro conjunto de imágenes. También experimentamos con una reorganización de las categorías de nuestro conjunto, fusionando aquellas categorías que la matriz de confusión muestra que son más comúnmente confundidas por nuestros modelos. En este caso obtenemos una precisión superior al 50%. | es |
dc.description.abstract | Utilitzem mètodes d'aprenentatge profund en el context de reconeixement d'imatges. Utilitzem un conjunt de més de 70 mil imatges i 73 classes diferents per a comparar el rendiment de diferents arquitectures. Els enfocaments utilitzats en aquest treball inclouen un entrenament complet d'aquestes xarxes i també d'estratègies de transferència de l'aprenentatge i calibratge de models amb xarxes pre entrenades en el conjunt ImageNet. Vam mostrar la superioritat d'aquest últim enfocament en el nostre conjunt d'imatges. També experimentem amb una reorganització de les categories del nostre conjunt, fusionant aquelles categories que la matriu de confusió mostra que són més confoses pels nostres models. En aquest cas obtenim una precisió superior al 50%. | ca |
dc.format.mimetype | application/pdf | - |
dc.language.iso | eng | - |
dc.publisher | Universitat Oberta de Catalunya (UOC) | - |
dc.rights | CC BY-NC-ND | - |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/es/ | - |
dc.subject | computer vision | en |
dc.subject | procesamiento de imágenes | es |
dc.subject | processament d'imatges | ca |
dc.subject | aprenentatge profund | ca |
dc.subject | aprendizaje profundo | es |
dc.subject | deep learning | en |
dc.subject | visió artificial | ca |
dc.subject | visión artificial | es |
dc.subject | image processing | en |
dc.subject.lcsh | Machine learning -- TFM | en |
dc.title | Object recognition in images. A deep learning approach | - |
dc.type | info:eu-repo/semantics/masterThesis | - |
dc.audience.educationlevel | Estudios de Máster | es |
dc.audience.educationlevel | Master's degrees | en |
dc.audience.educationlevel | Estudis de Màster | ca |
dc.subject.lemac | Aprenentatge automàtic -- TFM | ca |
dc.subject.lcshes | Aprendizaje automático -- TFM | es |
dc.contributor.tutor | Bosch Rue, Anna | - |
dc.rights.accessRights | info:eu-repo/semantics/openAccess | - |
Aparece en las colecciones: | Bachelor thesis, research projects, etc. |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
miguelyogurTFM0119memory.pdf | Memory of TFM | 6,69 MB | Adobe PDF | Visualizar/Abrir |
Comparte:
Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons