Please use this identifier to cite or link to this item:
http://hdl.handle.net/10609/146347
Full metadata record
DC Field | Value | Language |
---|---|---|
dc.contributor.author | Jolis Orriols, Núria | - |
dc.contributor.other | Ventura, Carles | - |
dc.coverage.spatial | Barcelona, ESP | - |
dc.date.accessioned | 2022-07-08T06:28:10Z | - |
dc.date.available | 2022-07-08T06:28:10Z | - |
dc.date.issued | 2022-06 | - |
dc.identifier.uri | http://hdl.handle.net/10609/146347 | - |
dc.description.abstract | Machine learning is an emerging area that creates computer systems that by using algorithms and statistical models are capable of learning from existing data and making inferences to new data. The development of machine learning models has been a tool for working with large databases such as electronic health records to improve healthcare quality, efficiency, clinical research and capture billing data. The main objective of this TFM has been to infer on patients¿ survival prediction using an electronic health record and through the implementation of three machine learning classification algorithms. To do this, a basic protocol for beginners in machine learning has been developed which consists of six steps: (1) an exploratory analysis of the data with univariate and bivariate statistical analysis, (2) cleaning and curing of the data so that it can be analyzed, (3) multivariate analysis to know the relationship of predictive variables and their interaction with the response variable, (4) application of 3 of the most common machine learning classification models, (5) validation using k-fold cross-validation technique, (6) finally an evaluation and comparison of the generated models by means of some parameters such as balanced accuracy and AUC. | en |
dc.description.abstract | El aprendizaje automático es un área emergente que crea sistemas informáticos que, mediante el uso de algoritmos y modelos estadísticos, son capaces de aprender de los datos existentes y hacer inferencias a los nuevos datos. El desarrollo de modelos de aprendizaje automático ha sido una herramienta para trabajar con grandes bases de datos, como las historias clínicas electrónicas, para mejorar la calidad de la atención sanitaria, la eficiencia, la investigación clínica y la captura de datos de facturación. El objetivo principal de este TFM ha sido inferir sobre la predicción de la supervivencia de los pacientes utilizando una historia clínica electrónica y mediante la implementación de tres algoritmos de clasificación de aprendizaje automático. Para ello, se ha desarrollado un protocolo básico para principiantes en machine learning que consta de seis pasos (1) un análisis exploratorio de los datos con análisis estadístico univariante y bivariante, (2) limpieza y curación de los datos para poder analizarlos, (3) análisis multivariante para conocer la relación de las variables predictivas y su interacción con la variable respuesta, (4) aplicación de 3 de los modelos de clasificación de aprendizaje automático más comunes, (5) validación mediante la técnica de k-fold cross-validation, (6) finalmente una evaluación y comparación de los modelos generados mediante algunos parámetros como la precisión equilibrada y el AUC. | es |
dc.description.abstract | L'aprenentatge automàtic és una àrea emergent que crea sistemes informàtics que, mitjançant l'ús d'algorismes i models estadístics, són capaços d'aprendre de les dades existents i fer inferències a les noves dades. El desenvolupament de models d'aprenentatge automàtic ha estat una eina per a treballar amb grans bases de dades, com les històries clíniques electròniques, per a millorar la qualitat de l'atenció sanitària, l'eficiència, la recerca clínica i la captura de dades de facturació. L'objectiu principal d'aquest TFM ha estat inferir sobre la predicció de la supervivència dels pacients utilitzant una història clínica electrònica i mitjançant la implementació de tres algorismes de classificació d'aprenentatge automàtic. Per a això, s'ha desenvolupat un protocol bàsic per a principiants en machine learning que consta de sis passos (1) una anàlisi exploratòria de les dades amb anàlisi estadística univariant i bivariante, (2) neteja i curació de les dades per a poder analitzar-los, (3) anàlisis multivariant per a conèixer la relació de les variables predictives i la seva interacció amb la variable resposta, (4) aplicació de 3 dels models de classificació d'aprenentatge automàtic més comuns, (5) validació mitjançant la tècnica de k-fold cross-validation, (6) finalment una avaluació i comparació dels models generats mitjançant alguns paràmetres com la precisió equilibrada i el AUC. | ca |
dc.format.mimetype | application/pdf | - |
dc.language.iso | eng | - |
dc.publisher | Universitat Oberta de Catalunya (UOC) | - |
dc.rights | CC BY-NC-ND | - |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/es/ | - |
dc.subject | aprenentatge automàtic | ca |
dc.subject | insuficiència cardíaca | ca |
dc.subject | models predictius | ca |
dc.subject | aprendizaje automático | es |
dc.subject | insuficiencia cardíaca | es |
dc.subject | modelos predictivos | es |
dc.subject | machine learning | en |
dc.subject | heart failure | en |
dc.subject | predictive models | en |
dc.subject.lcsh | Machine learning -- TFM | en |
dc.title | Comparison of machine learning algorithms in prediction of patients' survival using a health record database | - |
dc.type | info:eu-repo/semantics/masterThesis | - |
dc.audience.educationlevel | Estudis de Màster | ca |
dc.audience.educationlevel | Estudios de Máster | es |
dc.audience.educationlevel | Master's degrees | en |
dc.subject.lemac | Aprenentatge automàtic -- TFM | ca |
dc.subject.lcshes | Aprendizaje automático -- TFM | es |
dc.contributor.tutor | Perez-Alvarez, Nuria | - |
dc.rights.accessRights | info:eu-repo/semantics/openAccess | - |
Appears in Collections: | Trabajos finales de carrera, trabajos de investigación, etc. |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
njolisFMDP0622report.pdf | Report of TFM | 1,7 MB | Adobe PDF | View/Open |
Share:
This item is licensed under a Creative Commons License