Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10609/146167
Registro completo de metadatos
Campo DC Valor Lengua/Idioma
dc.contributor.authorSerra, Maria Mercedes-
dc.contributor.otherVentura, Carles-
dc.coverage.spatialAvignon-
dc.date.accessioned2022-07-03T11:36:04Z-
dc.date.available2022-07-03T11:36:04Z-
dc.date.issued2022-06-
dc.identifier.urihttp://hdl.handle.net/10609/146167-
dc.description.abstractThe lung is the most common site for cancer and has the highest worldwide cancer-related mortality. Routine study of patients with lung cancer usually includes at least one computed tomography (CT) study previous to the histopathological diagnosis. In the last decade the development of tools that help extract quantitative measures from medical imaging, known as radiomic characteristics, have become increasingly relevant in this domain, including mathematically extracted measures of volume, shape, texture analysis, etc. Radiomics can quantify tumor phenotypic characteristics non-invasively and could potentially contribute with objective elements to support these patients' diagnosis, management and prognosis in routine clinical practice. Methodology. LUNG1 dataset frommUniversity of Maastricht and publicly available in The Cancer Imaging Archive was obtained. Radiomic feature extraction was performed with pyRadiomics package v3.0.1 using CT scans from 422 non-small cell lung cancer (NSCLC) patients, including manual segmentations of the gross tumor volume. A single data frame was constructed including clinical data, radiomic features output, CT manufacturer and study date acquisition information. Exploratory data analysis, curation, feature selection, modeling and visualization was performed using R Software. Model based clustering was performed using VarselLCM library both with and without wrapper feature selection. Results. During exploratory data analysis lack of independence was found between histology and age and overall stage, and between survival curves and scanner manufacturer model. Features related to the manufacturer model were excluded from further analysis. Additional feature filtering was performed using the MRMR algorithm. When performing clustering analysis both models, with and without variable selection, showed significant association between partitions generated and survival curves, significance of this association was greater for the model with wrapper variable selection which selected only radiomic variables. original\_shape\_VoxelVolume feature showed the highest discriminative power for both models along with log.sigma.5.0.mm.3D\_glzm\_LargeAreaLowGrayLevelEmphasis and wavelet\_LHL\_glzm\_LargeAreaHighGrayLevelEmphasis. Clusters with significant lower median survival were also related to higher Clinical T stages, greater mean values of original\_shape\_VoxelVolume, log.sigma.5.0.mm.3D\_glzm\_LargeAreaLowGrayLevelEmphasis and wavelet\_LHL\_glzm\_LargeAreaHighGrayLevelEmphasis and lower mean wavelet.HHl\_glcm\_ClusterProminence. A weaker relationship was found between histology and selected clusters. Conclusions. Potential sources of bias given by relationship between different variables of interest and technical sources should be taken into account when analyzing this data set. Aside from original\_shape\_VoxelVolume feature, texture features applied to images with LoG and wavelet filters where found most significantly associated with different clinical characteristics in the present analysis.en
dc.description.abstractEl pulmón es la localización más frecuente del cáncer y presenta la mayor mortalidad mundial relacionada con el mismo. El estudio rutinario de los pacientes con cáncer de pulmón suele incluir al menos un estudio de tomografía computarizada (TC) previo al diagnóstico histopatológico. En la última década, el desarrollo de herramientas que ayudan a extraer medidas cuantitativas de las imágenes médicas, conocidas como características radiómicas, ha cobrado cada vez más relevancia en este ámbito, incluyendo medidas extraídas matemáticamente de volumen, forma, análisis de textura, etc. La radiómica puede cuantificar las características fenotípicas de los tumores de forma no invasiva y podría aportar elementos objetivos para apoyar el diagnóstico, el manejo y el pronóstico de estos pacientes en la práctica clínica habitual. Metodología. Se obtuvo el conjunto de datos LUNG1 de la Universidad de Maastricht, disponible públicamente en The Cancer Imaging Archive. La extracción de características radiómicas se llevó a cabo con el paquete pyRadiomics v3.0.1 utilizando escáneres de TC de 422 pacientes con cáncer de pulmón de células no pequeñas (CPCNP), incluyendo segmentaciones manuales del volumen tumoral bruto. Se construyó un único marco de datos que incluía datos clínicos, resultados de características radiómicas, información sobre el fabricante de la TC y la fecha de adquisición del estudio. El análisis exploratorio de los datos, la curación, la selección de características, el modelado y la visualización se realizaron utilizando el software R. La agrupación basada en el modelo se realizó utilizando la biblioteca VarselLCM con y sin selección de características de envoltura. Resultados. Durante el análisis exploratorio de datos se encontró falta de independencia entre la histología y la edad y el estadio general, y entre las curvas de supervivencia y el modelo del fabricante del escáner. Las características relacionadas con el modelo del fabricante se excluyeron del análisis posterior. Se realizó un filtrado adicional de características mediante el algoritmo MRMR. Al realizar el análisis de agrupación, ambos modelos, con y sin selección de variables, mostraron una asociación significativa entre las particiones generadas y las curvas de supervivencia; la importancia de esta asociación fue mayor para el modelo con selección de variables de envoltura, que sólo seleccionó variables radiómicas. La característica original_shape_VoxelVolume mostró el mayor poder de discriminación para ambos modelos, junto con log.sigma.5 .0.mm.3D_glzm_LargeAreaLowGrayLevelEmphasis y wavelet_LHL_glzm_LargeAreaHighGrayLevelEmphasis. Los conglomerados con una mediana de supervivencia significativamente más baja también estaban relacionados con estadios T clínicos más altos, valores medios mayores de original_shape_VoxelVolume, log.sigma.5.0.mm.3D_glzm\_LargeAreaLowGrayLevelEmphasis y wavelet_LHL_glzm_LargeAreaHighGrayLevelEmphasis y una media más baja de wavelet.HHl_glcm\_ClusterProminence. Se encontró una relación más débil entre la histología y los clusters seleccionados. Conclusiones. Al analizar este conjunto de datos deben tenerse en cuenta las posibles fuentes de sesgo dadas por la relación entre las distintas variables de interés y las fuentes técnicas. Aparte de la característica original de Forma_VoxelVolumen, las características de textura aplicadas a las imágenes con filtros LoG y wavelet fueron las que se asociaron más significativamente con las diferentes características clínicas en el presente análisis.es
dc.description.abstractEl pulmó és la localització més freqüent del càncer i presenta la major mortalitat mundial relacionada amb aquest. L'estudi rutinari dels pacients amb càncer de pulmó sol incloure almenys un estudi de tomografia computada (TC) previ al diagnòstic histopatológico. En l'última dècada, el desenvolupament d'eines que ajuden a extreure mesures quantitatives de les imatges mèdiques, conegudes com a característiques radiómicas, ha cobrat cada vegada més rellevància en aquest àmbit, incloent-hi mesures extretes matemàticament de volum, forma, anàlisi de textura, etc. La radiómica pot quantificar les característiques fenotípiques dels tumors de forma no invasiva i podria aportar elements objectius per a donar suport al diagnòstic, el maneig i el pronòstic d'aquests pacients en la pràctica clínica habitual. Metodologia. Es va obtenir el conjunt de dades LUNG1 de la Universitat de Maastricht, disponible públicament en The Cancer Imaging Arxivi. L'extracció de característiques radiómicas es va dur a terme amb el paquet pyRadiomics v3.0.1 utilitzant escàners de TC de 422 pacients amb càncer de pulmó de cèl·lules no petites (CPCNP), incloent-hi segmentacions manuals del volum tumoral brut. Es va construir un únic marc de dades que incloïa dades clíniques, resultats de característiques radiómicas, informació sobre el fabricant de la TC i la data d'adquisició de l'estudi. L'anàlisi exploratòria de les dades, la curació, la selecció de característiques, el modelatge i la visualització es van realitzar utilitzant el programari R. L'agrupació basada en el model es va realitzar utilitzant la biblioteca VarselLCM amb i sense selecció de característiques d'embolcall. Resultats. Durant l'anàlisi exploratòria de dades es va trobar falta d'independència entre la histologia i l'edat i l'estadi general, i entre les corbes de supervivència i el model del fabricant de l'escàner. Les característiques relacionades amb el model del fabricant es van excloure de l'anàlisi posterior. Es va realitzar un filtrat addicional de característiques mitjançant l'algorisme MRMR. En realitzar l'anàlisi d'agrupació, tots dos models, amb i sense selecció de variables, van mostrar una associació significativa entre les particions generades i les corbes de supervivència; la importància d'aquesta associació va ser major per al model amb selecció de variables d'embolcall, que només va seleccionar variables radiómicas. La característica original_shape_*VoxelVolume va mostrar el major poder de discriminació per a tots dos models, juntament amb log.sigma.5 .0.mm.3D_glzm_*LargeAreaLowGrayLevelEmphasis i wavelet_*LHL_*glzm_*LargeAreaHighGrayLevelEmphasis. Els conglomerats amb una mitjana de supervivència significativament més baixa també estaven relacionats amb estadis T clínics més alts, valors mitjans majors d'original_shape_*VoxelVolume, log.sigma.5.0.mm.3D_glzm\_*LargeAreaLowGrayLevelEmphasis i wavelet_*LHL_*glzm_*LargeAreaHighGrayLevelEmphasis i una mitjana més baixa de wavelet.HHl_*glcm\_*ClusterProminence. Es va trobar una relació més feble entre la histologia i els clústers seleccionats. Conclusions. En analitzar aquest conjunt de dades han de tenir-se en compte les possibles fonts de biaix donades per la relació entre les diferents variables d'interès i les fonts tècniques. A part de la característica original de Forma_VoxelVolumen, les característiques de textura aplicades a les imatges amb filtres LoG i wavelet van ser les que es van associar més significativament amb les diferents característiques clíniques en la present anàlisi.ca
dc.format.mimetypeapplication/pdf-
dc.language.isoeng-
dc.publisherUniversitat Oberta de Catalunya (UOC)-
dc.rightsCC BY-NC-ND-
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/es/-
dc.subjectdata visualizationen
dc.subjectradiómicaes
dc.subjectradiòmicaca
dc.subjectradiomicsen
dc.subjectclusteringes
dc.subjectclusteringca
dc.subjectclusteringen
dc.subjectvisualización de datoses
dc.subjectvisualització de dadesca
dc.subject.lcshBioinformatics -- TFMen
dc.titleAnalysis and Application of clustering and visualization methods of computed tomography radiomic features to contribute to the characterization of patients with non-metastatic Non-small-cell lung cancer-
dc.typeinfo:eu-repo/semantics/masterThesis-
dc.audience.educationlevelEstudis de Màsterca
dc.audience.educationlevelEstudios de Másteres
dc.audience.educationlevelMaster's degreesen
dc.subject.lemacBioinformàtica -- TFMca
dc.subject.lcshesBioinformática -- TFMes
dc.contributor.tutorFernández Martínez, Daniel-
dc.rights.accessRightsinfo:eu-repo/semantics/openAccess-
Aparece en las colecciones: Trabajos finales de carrera, trabajos de investigación, etc.

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
mserra4TFM0622report.pdfReport of FMDP28,9 MBAdobe PDFVista previa
Visualizar/Abrir