R. Alberich Martí, N. A. Cruz Gutierrez, R. Fernández Peralta, I. García Mosquera, A. Mir Torres, F. Rosselló Llompart

La selección de variables en datos composicionales plantea desafíos, especialmente en clasificación multiclase y en presencia de covariables. Proponemos una metodología para identificar taxones separables basada en modelos penalizados sobre cocientes logarítmicos y en el área bajo la curva ROC multiclase. El procedimiento combina filtrado de componentes raros, imputación de ceros y transformación log-ratio con modelos de regresión multinomial por pares ajustados por covariables. La propuesta se evalúa con datos sintéticos, controlando distintos niveles de cambio en la abundancia, y se compara con otros métodos, entre ellos MUVR2, que incorpora bosques aleatorios, mínimos cuadrados parciales y regresión penalizada elastic net. Además, se ilustra en datos de cribado de cáncer colorrectal. Los resultados muestran un método competitivo, interpretable y escalable para la selección de variables en datos composicionales.

Palabras clave: clasificación multiclase, taxones separables, ajuste por covariables

Programado

Clasificación y Reconocimiento de Patrones
2 de septiembre de 2026  11:20
Aula 22


Otros trabajos en la misma sesión


Política de cookies

Usamos cookies solamente para poder idenfiticarte y autenticarte dentro del sitio web. Son necesarias para el correcto funcionamiento del mismo y por tanto no pueden ser desactivadas. Si continúas navegando estás dando tu consentimiento para su aceptación, así como la de nuestra Política de Privacidad.

Adicionalmente, utilizamos Google Analytics para analizar el tráfico del sitio web. Ellos almacenan cookies también, y puedes aceptarlas o rechazarlas en los botones de más abajo.

Aquí puedes ver más detalles de nuestra Política de Cookies y nuestra Política de Privacidad.