J. I. Segovia Martín, S. Mazuelas Franco

La clasificación supervisada tradicional asume que los datos de entrenamiento y testeo vienen de la misma distribución. Sin embargo, los escenarios prácticos suelen verse afectados por cambios en las distribuciones. Los métodos clásicos de reponderación son sensibles a la aparición de pesos extremos y no aprovechan adecuadamente la información complementaria disponible en escenarios con múltiples fuentes de datos. Este trabajo introduce un marco unificado de doble ponderación que emplea funciones de peso tanto para las muestras de entrenamiento como de test. En el caso de múltiples fuentes, los métodos presentados asignan pesos dependientes de la fuente, obtenidos de forma conjunta utilizando información de todas las fuentes. Además, en este trabajo se presenta cómo el uso de información complementaria procedente de diferentes fuentes permite aumentar el tamaño efectivo de la muestra. Los resultados empíricos demuestran la eficacia de este enfoque frente a los métodos convencionales.

Keywords: Clasificación supervisada, Desplazamiento de la distribución (distribution shift), Desplazamiento de covariables (covariate shift), Doble ponderación, Multi-fuente

Scheduled

Prediction and Classification
September 3, 2026  9:00 AM
Aula 24


Other papers in the same session


Cookie policy

We use cookies in order to be able to identify and authenticate you on the website. They are necessary for the correct functioning of it, and therefore they can not be disabled. If you continue browsing the website, you are agreeing with their acceptance, as well as our Privacy Policy.

Additionally, we use Google Analytics in order to analyze the website traffic. They also use cookies and you can accept or refuse them with the buttons below.

You can read more details about our Cookie Policy and our Privacy Policy.