Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10609/82085
Registro completo de metadatos
Campo DC Valor Lengua/Idioma
dc.contributor.authorMármol Sánchez, Emilio-
dc.contributor.otherUniversitat Oberta de Catalunya-
dc.contributor.otherMorán Moreno, Jose Antonio-
dc.date.accessioned2018-07-02T12:14:13Z-
dc.date.available2018-07-02T12:14:13Z-
dc.date.issued2018-06-
dc.identifier.urihttp://hdl.handle.net/10609/82085-
dc.description.abstractLa predicción computacional de microRNAs (miRNAs) supone un campo de investigación activo en la actualidad, sobre todo en especies no modelo cuyas anotaciones son aún limitadas y poco fiables. Mediante la utilización de una aproximación basada en algoritmos de Machine Learning como el Support Vector Machine (SVM) y Random Forest (RF), y haciendo uso de la comparación por homología en la anotación de miRNAs en humano, hemos desarrollado un proceso para la identificación y anotación de nuevos candidatos a estructuras pre-miRNA en el genoma porcino. Partiendo de la generación de un set de datos positivos y negativos, filtrados según tamaño y conformación estructural, se definieron diversos atributos estructurales para cada secuencia, con el objetivo de entrenar un modelo SVM de Machine Learning. Un conjunto de secuencias candidatas obtenidas mediante comparación por homología, fueron clasificadas como candidatos pre-miRNAs por el modelo SVM entrenado previamente, y posteriormente filtradas mediante un análisis de fiabilidad de posición genómica (Neighbouring Score). Mediante este proceso fuimos capaces de identificar un total de 26 nuevas secuencias pre-miRNA candidatas en el genoma porcino. De entre ellas destacó el miRNA ssc-miR-483, homólogo del miRNA homónimo en humano hsa-miR-483, alojado en el intrón 2 del gen IGF2, cuya función estaría ligada a la regulación de la proliferación celular y la diferenciación de adipocitos, influyendo en la capacidad de integración y depósito de lípidos en respuesta a variaciones en la ingesta de alimentos. Estos resultados podrían ampliar el conocimiento sobre la regulación del metabolismo energético y lipídico en la especie porcina.es
dc.description.abstractComputational discovery of microRNAs (miRNAs) poses a big research challenge nowadays, especially considering non-model species that lack accurate and reliable miRNA annotation. Through the application of a Machine Learning approach by using algorithms like Support Vector Machine (SVM) and Random Forest (RF) and making use of a homology-based comparison with miRNA annotation un humans, we developed a pipeline for identifying and annotating new pre-miRNA candidates in the porcine genome. We generated a set of positive and negative data, filtered considering size and structural folding, and then calculated a series of structural features for each considered sequence that where subsequently used for training a Machine Learning-based SVM classifier. We extracted a set of candidate sequences in the porcine genome that showed to be homologous from human miRNA annotation and classified them by using the previously trained SVM model. These candidate pre-miRNAs sequences were then filtered according to a neighbouring feasibility analysis. Our approach allowed us to identify 26 putative non-annotated pre miRNA sequences in the porcine genome. Among them, we highlighted the putative candidate ssc-miR-483, homologous of human hsa-miR-483 and located at intron 2 of IGF2 gene. This miRNA has been associated to the regulation of cellular proliferation and adipocyte differentiation, modulating lipid integration and storage in response to food intake. These results could enhance our understanding of energy and lipid metabolism regulation in the porcine species.en
dc.description.abstractLa predicció computacional de microRNAs (miRNAs) suposa un camp de recerca actiu en l'actualitat, sobretot en espècies no model les anotacions de les quals són encara limitades i poc fiables. Mitjançant la utilització d'una aproximació basada en algorismes de Machine Learning com el Support Vector Machine (SVM) i Random Forest (RF), i fent ús de la comparació per homologia en l'anotació de miRNAs en humà, hem desenvolupat un procés per a la identificació i anotació de nous candidats a estructures pre-miRNA en el genoma porcí. Partint de la generació d'un set de dades positives i negatius, filtrats segons grandària i conformació estructural, es van definir diversos atributs estructurals per a cada seqüència, amb l'objectiu d'entrenar un model SVM de Machine Learning. Un conjunt de seqüències candidates obtingudes mitjançant comparació per homologia, van ser classificades com a candidats pre-miRNAs pel model SVM entrenat prèviament, i posteriorment filtrades mitjançant una anàlisi de fiabilitat de posició genòmica (Neighbouring Score). Mitjançant aquest procés vam ser capaços d'identificar un total de 26 noves seqüències pre-miRNA candidates en el genoma porcí. D'entre elles va destacar el miRNA ssc-miR-483, homòleg del miRNA homònim en humà hsa-miR-483, allotjat en el intrón 2 del gen IGF2, la funció del qual estaria lligada a la regulació de la proliferació cel·lular i la diferenciació d'adipòcits, influint en la capacitat d'integració i dipòsit de lípids en resposta a variacions en la ingesta d'aliments. Aquests resultats podrien ampliar el coneixement sobre la regulació del metabolisme energètic i lipídic en l'espècie porcina.ca
dc.language.isospa-
dc.publisherUniversitat Oberta de Catalunya-
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/es/-
dc.subjectmachine learningen
dc.subjectmicroRNAen
dc.subjectsupport vector machineen
dc.subjectmicroRNAes
dc.subjectmicroRNAca
dc.subjectaprendizaje automáticoes
dc.subjectaprenentatge automàticca
dc.subjectmáquinas de vectores de soportees
dc.subjectmàquines de vectors de suportca
dc.subject.lcshBioinformatics -- TFMen
dc.titleAnotación de nuevos microRNAs en el genoma porcino mediante una aproximación basada en Machine Learning-
dc.typeinfo:eu-repo/semantics/masterThesis-
dc.audience.educationlevelEstudis de Màsterca
dc.audience.educationlevelEstudios de Másteres
dc.audience.educationlevelPostgraduate degreesen
dc.subject.lemacBioinformàtica -- TFMca
dc.subject.lcshesBioinformática -- TFMes
dc.contributor.tutorPla Planas, Albert-
Aparece en las colecciones: Trabajos finales de carrera, trabajos de investigación, etc.