Empreu aquest identificador per citar o enllaçar aquest ítem: http://hdl.handle.net/10609/151212
Títol: Engineering data-sharing practices for a fair and trustworthy AI
Autoria: Giner Miguelez, Joan  
Director: Cabot, Jordi  
Gómez Llana, Abel
Resum: Les aplicacions d'intel·ligència artificial (IA) poden mostrar biaixos discriminatius cap a sectors socials específics. Per exemple, s'ha detectat que algunes fallen més en diagnosticar dones que homes als hospitals. Part d'aquests biaixos provenen de les dades usades per entrenar aquestes, i recentment, la comunitat de recerca està proposant guies per identificar quins aspectes d'aquestes dades que poden comprometre aquestes aplicacions. Malauradament, aquestes guies manquen d'estructura consistent, dificultant la seva computació i la creació de tècniques d'enginyeria sobre aquestes. Aquesta tesi proposa un llenguatge específic de domini (DSL) per documentar conjunts de dades per IA. El llenguatge ha servit de base per l'extensió d'IA responsable de \emph{Croissant}, un estàndard de dades adoptat pels principals buscadors com \emph{Google Dataset Search}. A més a més, aquesta tesi estudia l'ús de grans models de llenguatge (LLM) en la creació automàtica de documentació, i l'estat de les dades científiques en relació amb aquestes guies.
Paraules clau: compartició de dades
aprenentatge automàtic
IA confiable
equitat a la IA
documentació de dades
Tipus de document: info:eu-repo/semantics/doctoralThesis
Data de publicació: 15-jul-2024
Llicència de publicació: http://creativecommons.org/licenses/by-nc-nd/3.0/es/  
Apareix a les col·leccions:Tesis doctorals

Arxius per aquest ítem:
Arxiu Descripció MidaFormat 
Thesis_manuscript_acks.pdfGiner-Miguelez_dissertation12,09 MBAdobe PDFThumbnail
Veure/Obrir
Comparteix:
Exporta:
Consulta les estadístiques

Aquest ítem està subjecte a una llicència de Creative CommonsLlicència Creative Commons Creative Commons