jueves, 8 de octubre de 2009

Estrategia general de gestión de la información científica

Ayer 7 de octubre, a iniciativa del blog La Aldea irreductible se desarrolló una jornada de protesta contra los recortes en las inversiones en I+D que se plantean para el próximo año en los Presupuestos Generales del Estado, bajo el lema de la ciencia española no necesita tijera.


Por todos es sabido la relación directa que existe entre el desarrollo científico y el desarrollo de una sociedad, por lo que cualquier recorte en la primera cuando menos va a suponer un freno en la segunda.

Pero no solo no es conveniente reducir la financiación científica sino que es recomendable incrementar las inversiones en infraestructuras que faciliten su desarrollo, y uno de los ámbitos que es francamente mejorable es el de la gestión de la información científica.

Los científicos necesitan una gran cantidad de datos procedentes de una amplia variedad de fuentes que deberían estar fácilmente accesibles. Sin embargo los científicos europeos se deben enfrentar al hándicap de que muchos de estos datos están almacenados en repositorios locales aislados o incluso en ordenadores personales, lo que obstaculiza su acceso a otros científicos e instituciones de investigación. Y hay que tener en cuenta que estos datos sólo tienen valor si se usan y se ponen en circulación, por lo que se hace necesarias infraestructuras que posibiliten el almacenamiento y recuperación de los datos científicos de las diversas disciplinas.

Así lo pone de manifiesto el libro blanco “Estrategia para una infraestructura de datos europea” publicado el pasado 2 de octubre por la Asociación por los datos avanzados en Europa (PARADE), en el que se reconoce la necesidad que tiene la comunidad científica europea de una estrategia general de gestión de la información coherente para no quedar retrasada con respecto al resto del mundo.

En la actualidad existen aproximadamente entre 150 y 200 infraestructuras científicas de diversos tamaños en Europa, pero tienen restricciones geográficas o están limitados a disciplinas concretas. En su lugar el libro blanco propone el establecimiento de una infraestructura de datos físicos sostenible e integrada a escala paneuropea que administraría las mejores prácticas y ofrecería herramientas comunes en beneficio de distintas comunidades de usuarios.

Pero para que los datos científicos sean compartidos y reutilizados además de unas infraestructuras adecuadas habrá que resolver otra serie de cuestiones como la protección en caso de apropiaciones indebidas, el reconocimiento de los creadores de los datos a la hora de ser citado o la posibilidad de que otros hagan papers a costa del esfuerzo de los primeros, por lo que como muy bien señala Daniel Torres-Salinas en “Compartir datos (data sharing) en ciencia: el contexto de una oportunidad” es preciso un cambio cultural y unas reglas de juego bien establecidas.

Además, siguiendo los argumentos de Daniel Torres-Salinas, será necesario resolver una serie de cuestiones técnicas, pues nos tenemos que enfrentar a información compleja con especificidades propias de cada especialidad, a veces sujeta a leyes de protección de datos, con formatos múltiples que requerirían pautas de normalización y presentación para su depósito, que necesitarían de sistemas de recuperación complejos y amigables y que necesitarían de una conservación de los datos a largo plazo. A todo esto habría que sumar unas normas éticas y un contexto legal para proteger a los depositantes.

No hay comentarios: