datos de investigación

#datasets en universidades españolas: avance de resultados 2024

Conjunto de datos de investigación: icono.

A finales del año 2023 publicaba con Ana Alice Baptista (Universidade do Minho), Rosana López Carreño (Universidad de Murcia) y Ángel María Delgado Vázquez (Universidad Pablo de Olavide) el artículo ‘Implementación de los repositorios de datos de investigación en las universidades públicas españolas: estado de la cuestión‘ en la revista Scire de la Universidad de Zaragoza analizando varios aspectos de los datasets en las universidades españolas.

En el artículo, con datos del año 2022, aventurábamos un incremento del número de datasets (conjuntos de datos de investigación) depositados en los repositorios institucionales de las universidades públicas españolas. Este impulso venía propiciado por la apuesta por la Ciencia Abierta reflejada en el lanzamiento de la Estrategia Nacional de Ciencia Abierta en junio de 2023 y se confirmó con el cambio en el paradigma de evaluación de los sexenios de investigación de 2024 por parte de ANECA donde estos conjuntos de datos pasaron a ser considerados méritos evaluables.

Hace más o menos un año actualizábamos los resultados obtenidos en el primero de los estudios y presentábamos la nota ‘Aumentan los datasets de investigación publicados por las universidades públicas‘ en este mismo blog. En el mismo se verificaba nuestra hipótesis porque en el año 2023 se depositaron más del doble de datasets que en el año anterior, como se puede ver en la imagen,

datasets en universidades públicas españolas a finales de 2023

Ya estamos en el año 2025 y hemos comenzado a actualizar los datos del estudio de hace dos años, vamos a computar el total de datasets publicado y, tal como hicimos entonces, los clasificaremos por rama de investigación, plataforma software empleada para el repositorio y el porcentaje que corresponde a los consorcios autonómicos (que siguen «a la cabeza», por cierto). Esto aún tardará un poco (esperemos que no mucho), pero de momento y a modo de de aperitivo de Año Nuevo, ya tenemos la gráfica de total de conjuntos de datos depositados actualizada (a falta del dato exacto de la Universidad del País Vasco cuyo repositorio parece estar ahora en modo de mantenimiento).

datasets depositados en las universidades públicas españolas a fecha 1 de enero de 2025

Como podemos ver, continua el aumento del número de datasets depositados aunque a un ritmo algo menor (400 por 523 del año anteiror). Tal como comentábamos en el post del año pasado, estos valores deberían complementarse con el número de datasets depositados en Zenodo, el repositorio del i+d de la Unión Europea, para verificar si el aumento también se está produciendo en el mismo (pensamos que sí). En los dos consorcios autonómicos (Cataluña y Madrid) se han depositado 981 datasets, más del doble que en el resto de las universidades españolas (en la serie histórica estos dos consorcios totalizan 2830 de 4470 datasets depositados, la desigualdad es menor). Esto confirma que el apoyo que prestan a la comunicación de la ciencia desarrollada en su entorno territorial es algo que deberían seguir otras universidades, especialmente en aquellas autonomías donde existan varios centros (Andalucía o Comunidad Valencia por ejemplo). Sigue llamando la atención que la Universidad Complutense de Madrid no participe en su consorcio regioal y el escaso nçumero de datasets sportados, teniendo en cuenta el tamaño e importancia de esta universidad (aunque han cambiado la plataforma y ahora usan Dspace, eso es positivo). .

En cuanto tengamos actualizado el informe, lo depositaremos en el repositorio DIGITUM e informaremos del mismo en otro post.

Feliz Año 2025
#CienciaAbiertaYa!!

Aumentan los datasets de investigación publicados por las universidades públicas

Recientemente apareció en la revista Scire el artículo «Implementación de los repositorios de datos de investigación en las universidades públicas españolas: estado de la cuestión» que escribimos en febrero de 2023 Ana Alice Baptista, Rosana Lopez y Ángel M. Delgado-Vázquez. En este trabajo revisamos el total de conjuntos de datos (‘datasets’) de investigación publicados en los repositorios de las universidades públicas españolas hasta 2022. Ha pasado casi un año, estamos a mitad de enero de 2024, buen momento para actualizar los resultados obtenidos y certificar tendencias.

Durante el pasado año se publicaron 961 datasets en los repositorios de las universidades públicas españolas. Los datos, a excepción de la Universidade da Coruña y la Universidad de Las Palmas de Gran Canaria que remiten a su comunidad investigadora al repositorio comunitario ZENODO, los extraemos de los sitios web de cada universidad. También se han actualizado datos de alguna universidad de la que no pudimos extraer información hace un año y hemos levantado «el veto» que aplicábamos a una por usar software propietario en lugar de software libre para gestionar el repositorio. También se han actualizado los datos de los años anteriores porque, en algunos casos, se han detectado errores en los subtotales o pequeñas diferencias (como si se hubiera dado de baja algún ‘dataset’, algo que no debería de ocurrir habitualmente).

total de datasets de investigaciones publicados en los repositorios de las universidades españolas actualizado a 2023

Los resultados son buenos, está claro que que se van notando los resultados del trabajo de REBIUN de y las directrices de la división de #CienciaAbierta de Fundación Española para la Ciencia y la Tecnología, FECYT en el aumento de la presencia de los conjuntos de datos de investigación en estos repositorios. Las bibliotecas universitarias públicas apoyan claramente el movimiento hacia la #CienciaAbierta: en un año en el que se han publicado más ‘datasets’ que el total de la suma de los dos inmediatamente anteriores, que ya marcaban máximos en la serie.

Casi el 75% de los nuevos ‘datasets’ han sido publicados por los consorcios autonómicos. Ese apoyo de la administración regional es muy adecuado y beneficioso y deberían tomar nota todas aquellas comunidades que tienen varias universidades públicas en sus territorios (Andalucía, Aragón, Valencia, etc.). Esta desproporción aún no se nota tanto en el total de ‘datasets’ publicados: 1693 por los consorcios frente a 1126 por las universidades que trabajan de forma indvidual.

Para tener una idea más global del nivel de publicación de #datasets de datos de investigación por parte de las universidades públicas españolas, habría que ampliar estos datos con el total de conjuntos publicados en Zenodo. En unos días tendremos más datos.