R. Alberich Martí, N. A. Cruz Gutierrez, R. Fernández Peralta, I. García Mosquera, A. Mir Torres, F. Rosselló Llompart

La selección de variables en datos composicionales plantea desafíos, especialmente en clasificación multiclase y en presencia de covariables. Proponemos una metodología para identificar taxones separables basada en modelos penalizados sobre cocientes logarítmicos y en el área bajo la curva ROC multiclase. El procedimiento combina filtrado de componentes raros, imputación de ceros y transformación log-ratio con modelos de regresión multinomial por pares ajustados por covariables. La propuesta se evalúa con datos sintéticos, controlando distintos niveles de cambio en la abundancia, y se compara con otros métodos, entre ellos MUVR2, que incorpora bosques aleatorios, mínimos cuadrados parciales y regresión penalizada elastic net. Además, se ilustra en datos de cribado de cáncer colorrectal. Los resultados muestran un método competitivo, interpretable y escalable para la selección de variables en datos composicionales.

Keywords: clasificación multiclase, taxones separables, ajuste por covariables

Scheduled

Classification and Pattern Recognition
September 2, 2026  11:20 AM
Aula 22


Other papers in the same session


Cookie policy

We use cookies in order to be able to identify and authenticate you on the website. They are necessary for the correct functioning of it, and therefore they can not be disabled. If you continue browsing the website, you are agreeing with their acceptance, as well as our Privacy Policy.

Additionally, we use Google Analytics in order to analyze the website traffic. They also use cookies and you can accept or refuse them with the buttons below.

You can read more details about our Cookie Policy and our Privacy Policy.