Engineering data-sharing practices for a fair and trustworthy AI

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10609/151212

Título :	Engineering data-sharing practices for a fair and trustworthy AI
Autoría:	Giner Miguelez, Joan
Director:	Cabot, Jordi Gómez Llana, Abel
Resumen :	Las aplicaciones de inteligencia artificial (IA), pueden mostrar sesgos discriminatorios hacia sectores sociales específicos. Por ejemplo, se ha detectado que algunas fallan más en diagnosticar mujeres que hombres en hospitales. Parte de estos sesgos proviene de los datos que entrenan estas y la comunidad está proponiendo guías para identificar qué aspectos de estos pueden comprometer estas aplicaciones. Sin embargo, estas guías carecen de estructura consistente, lo que dificulta su computación y la creación de técnicas de ingeniería sobre ellas. Esta tesis presenta un lenguaje específico de dominio para documentar datos para IA. El lenguaje ha servido de base para la extensión de IA responsable de \emph{Croissant}, un estándar de datos adoptado por los principales buscadores como \emph{Google Dataset Search}. Además, esta tesis estudia el uso de grandes modelos de lenguaje (LLM), en la creación automática de documentación, así como el estado de los datos científicos en relación con estas guías.
Palabras clave :	compartición de datos IA confiable equidad en la IA documentación de datos
Tipo de documento:	info:eu-repo/semantics/doctoralThesis
Fecha de publicación :	15-jul-2024
Licencia de publicación:	http://creativecommons.org/licenses/by-nc-nd/3.0/es/
Aparece en las colecciones:	Tesis doctorals