F. Hermo García, Á. Gómez García, C. Dafonte Vázquez

El objetivo de esta línea de investigación es el desarrollo de sistemas automatizados que permitan recoger información en webs públicas, relativa a diferentes variables. Para automatizar el proceso, la técnica de web scraping se vuelve fundamental por permitir la detección y extracción parametrizada de elementos web.
En este trabajo se exponen los modelos (scrapers) implementados y se realiza un estudio de resultados comparados con los de un análisis manual, ambos obtenidos sobre un conjunto reducido. Con este estudio, se presentan los resultados alcanzados para las diferentes variables y las tasas de éxito del sistema automático comparadas con el análisis manual. Con estos resultados, podemos tener claras las necesidades de los usuarios y cuáles son las innovaciones TIC que suelen ser más utilizadas por las empresas. Finalmente, sobre el desarrollo de estas herramientas, hemos podido conocer las dificultades de las técnicas automatizadas para la obtención de resultados.

Palabras clave: Sistema automático de recolección de información pública, innovaciones TIC, web scraping, Ingeniería de datos

Programado

SI: Propuestas desde la ciencia y la ingeniería de datos para problemas específicos en Estadística Pública
4 de septiembre de 2026  15:30
Aula 21


Otros trabajos en la misma sesión

Ajuste Estacional ante Rupturas Estructurales en Estadística Pública

C. Amoroso, S. J. Koopman, C. García-Martos, G. Aneiros, J. A. Vilar Fernández, M. Francisco-Fernández, M. Oviedo

Estimación de matrices de reasignación del gasto turístico mediante información de pernoctas y pagos con tarjeta

D. Frade-Amil, M. Oviedo de la Fuente, S. Naya, J. Tarrío-Saavedra, L. Carpente, M. Francisco-Fernández

Autoencoders para la imputación de datos en series espacio-temporales: una aplicación a la predicción del Índice de Cifra de Negocios en la Industria

A. Juncal, O. Fontenla Romero, B. Guijarro Berdiñas, E. Hernández Pereira, B. Acereda Serrano, S. Barragán Andres, E. Rosa Perez, J. M. Martin Moral

Application of deep learning techniques to automatic classification: CNAE as a case study

R. Santos Ríos, A. Pérez Bote, J. Paz Ruza, J. Vilares Ferro


Política de cookies

Usamos cookies solamente para poder idenfiticarte y autenticarte dentro del sitio web. Son necesarias para el correcto funcionamiento del mismo y por tanto no pueden ser desactivadas. Si continúas navegando estás dando tu consentimiento para su aceptación, así como la de nuestra Política de Privacidad.

Adicionalmente, utilizamos Google Analytics para analizar el tráfico del sitio web. Ellos almacenan cookies también, y puedes aceptarlas o rechazarlas en los botones de más abajo.

Aquí puedes ver más detalles de nuestra Política de Cookies y nuestra Política de Privacidad.