Sistema automatizado de recolección de información web para análisis de innovaciones TIC en empresas: análisis de resultados
F. Hermo García, Á. Gómez García, C. Dafonte Vázquez
El objetivo de esta línea de investigación es el desarrollo de sistemas automatizados que permitan recoger información en webs públicas, relativa a diferentes variables. Para automatizar el proceso, la técnica de web scraping se vuelve fundamental por permitir la detección y extracción parametrizada de elementos web.
En este trabajo se exponen los modelos (scrapers) implementados y se realiza un estudio de resultados comparados con los de un análisis manual, ambos obtenidos sobre un conjunto reducido. Con este estudio, se presentan los resultados alcanzados para las diferentes variables y las tasas de éxito del sistema automático comparadas con el análisis manual. Con estos resultados, podemos tener claras las necesidades de los usuarios y cuáles son las innovaciones TIC que suelen ser más utilizadas por las empresas. Finalmente, sobre el desarrollo de estas herramientas, hemos podido conocer las dificultades de las técnicas automatizadas para la obtención de resultados.
Keywords: Sistema automático de recolección de información pública, innovaciones TIC, web scraping, Ingeniería de datos
Scheduled
SI: Propuestas desde la ciencia y la ingeniería de datos para problemas específicos en Estadística Pública
September 4, 2026 3:30 PM
Aula 21
Other papers in the same session
C. Amoroso, S. J. Koopman, C. García-Martos, G. Aneiros, J. A. Vilar Fernández, M. Francisco-Fernández, M. Oviedo
D. Frade-Amil, M. Oviedo de la Fuente, S. Naya, J. Tarrío-Saavedra, L. Carpente, M. Francisco-Fernández
A. Juncal, O. Fontenla Romero, B. Guijarro Berdiñas, E. Hernández Pereira, B. Acereda Serrano, S. Barragán Andres, E. Rosa Perez, J. M. Martin Moral
R. Santos Ríos, A. Pérez Bote, J. Paz Ruza, J. Vilares Ferro