J. C. González González, J. L. Roda García, I. Sánchez Berriel, E. Peso Adán, S. Sosa Díaz, R. Martín Rigor

Este trabajo presenta el desarrollo y validación de un sistema de codificación automática para el Código Nacional de Ocupaciones (CNO), desarrollado por la Cátedra Cajasiete de Big Data, Open Data y Blockchain de la Universidad de La Laguna para el Instituto Canario de Estadística. El objetivo es automatizar la codificación de respuestas abiertas en encuestas mediante técnicas avanzadas de machine learning y LLM.
Se evalúan y comparan diversas estrategias: desde modelos base como FastText y Random Forest con TF-IDF, hasta enfoques híbridos con embeddings de LLM y técnicas de fine-tuning eficiente de modelos de clasificación y similitud semántica. La investigación destaca la importancia de integrar metadatos (estudios, situación laboral) para capturar matices semánticos que otros métodos ignoran. Los resultados muestran una mejora significativa, permitiendo automatizar de forma segura el 86% del volumen de clasificación con un margen de error del 10%, estableciendo una solución robusta.

Palabras clave: Codificación automática, Clasificación Nacional de Ocupaciones (CNO), Inteligencia Artificial Generativa (LLM), Estadística Pública, Fine-tuning eficiente (PEFT)

Programado

SI Aprendizaje Automático e Inteligencia Artificial en la estadística pública
4 de septiembre de 2026  09:00
Aula 21


Otros trabajos en la misma sesión


Política de cookies

Usamos cookies solamente para poder idenfiticarte y autenticarte dentro del sitio web. Son necesarias para el correcto funcionamiento del mismo y por tanto no pueden ser desactivadas. Si continúas navegando estás dando tu consentimiento para su aceptación, así como la de nuestra Política de Privacidad.

Adicionalmente, utilizamos Google Analytics para analizar el tráfico del sitio web. Ellos almacenan cookies también, y puedes aceptarlas o rechazarlas en los botones de más abajo.

Aquí puedes ver más detalles de nuestra Política de Cookies y nuestra Política de Privacidad.