P. Contró Rodríguez, A. Calviño Martínez, S. Pineda Sanjuan, C. Ordaz Solera

Los datos ómicos de alta dimensionalidad han transformado la capacidad para caracterizar fenotipos complejos y desarrollar modelos predictivos en biomedicina de precisión.Sin embargo, su aplicación clínica está frecuentemente limitada por la disponibilidad de muestras: la ratio entre el número de variables y el tamaño muestral es extremadamente
desfavorable, situación conocida en la literatura como el problema HDLSS, que compromete la estabilidad y capacidad predictiva de los modelos de aprendizaje estadístico.

En este trabajo se evalúa sistemáticamente el impacto de distintas estrategias de preprocesamiento sobre el rendimiento predictivo y la estabilidad de modelos interpretables aplicados a datos ómicos de alta dimensionalidad. Se comparan filtering methods — tanto univariantes como multivariantes—combinadas con técnicas de data augmentation, bajo distintos escenarios de tamaño muestral, aplicados a datos reales clínicos de oncología y trasplantes.

Keywords: HDLSS, ómicas, Machine learning interpretable, data augmentation, filtering methods

Scheduled

GT TABiDa I
September 2, 2026  11:20 AM
Aula 24


Other papers in the same session

Joint Optimization of Interpretability, Fairness, and Robustness in Twin SVMs

S. Benítez Peña, S. Novo Díaz, J. García González Redondo

High-dimensional penalized regression in python: the asgl library

A. Mendez-Civieta, M. C. Aguilera-Morillo, R. E. Lillo


Cookie policy

We use cookies in order to be able to identify and authenticate you on the website. They are necessary for the correct functioning of it, and therefore they can not be disabled. If you continue browsing the website, you are agreeing with their acceptance, as well as our Privacy Policy.

Additionally, we use Google Analytics in order to analyze the website traffic. They also use cookies and you can accept or refuse them with the buttons below.

You can read more details about our Cookie Policy and our Privacy Policy.