• ¿Qué son?
  • H2020
  • Plan de Gestión de Datos
  • Cómo citar
  • Dónde publicar
  • Ayuda

Los datos de investigación son aquellos materiales generados o recolectados durante el transcurso de la realización de una investigación. Un informe financiado por el Higher Education Funding Council for England (HEFCE 2008) establece que “Los datos de investigación son la base de la evidencia sobre la que los investigadores académicos construyen su trabajo”.

Los datos de la investigación son hechos, observaciones o experiencias en que se basa el argumento, la teoría o la prueba. Los datos pueden ser numéricos, descriptivos o visuales. Los datos pueden ser en estado bruto o analizado, pueden ser experimentales u observacionales. Los datos incluyen: cuadernos de laboratorio, cuadernos de campo, datos de investigación primaria (incluidos los datos en papel o en soporte informático), cuestionarios, cintas de audio, videos, desarrollo de modelos, fotografías, películas, y las comprobaciones y las respuestas de la prueba. Las colecciones datos para la investigación pueden incluir diapositivas; diseños y muestras. En la información sobre la procedencia de los datos también se podría incluir: el cómo, cuándo, dónde se recogió y con qué (por ejemplo, instrumentos). El código de software utilizado para generar, comentar o analizar los datos también pueden ser considerados datos. Esta definición de datos de investigación proviene de la Universidad de Melbourne y está recogida en el documento de la FECYT (2012).

La gestión de los datos de manera eficaz a través de su ciclo de vida es muy importante para el éxito del proyecto de investigación. Una gestión de datos adecuada proporciona un mayor impacto de la investigación optimizando la visibilidad de los datos producidos, mejor accesibilidad a los datos, asegurando la calidad e integridad de los mismos durante su ciclo de vida, más transparencia para la validación de los resultados de la investigación reflejados en las publicaciones, la reutilización de los datos sin necesidad de reproducir la investigación y el retorno de la inversión pública cumpliendo con los requerimientos de los organismos financiadores de la investigación

La Comisión Europea elaboró unas Directrices sobre la Gestión de los Datos en Horizonte 2020 para que solicitantes y beneficiarios de proyectos puedan consultar sus responsabilidades con respecto al intercambio, calidad y seguridad de los datos de investigación.
 
El artículo 29.3 del Model Grant Agreements – H2020 establece las obligaciones de los participantes en lo que respecta a la gestión de datos y a su integración en el proceso de investigación.

Un Plan de Gestión de Datos - PGD (Data Management Plan – DMP) es un documento formal que debe presentarse al inicio de la investigación, en el cuál se esboza la gestión que se aplicará durante el ciclo de vida de los datos, desde su creación hasta la finalización del proyecto de investigación.

El PGD describe  qué datos se van a recoger o generar, qué metodología y normas se van a emplear, cómo se van a compartir y/o poner en abierto, y cómo se van a conservar y preservar. A partir de enero de 2017 los proyectos de H2020 deberán presentar un PGD.

Herramientas para elaborar un Plan de Gestión de datos

DMP ONLINE está desarrollado por el Digital Curation Center sirve como plantilla para elaborar el Plan de Gestión de Datos siguiendo el esquema de la Comisión Europea. Muy recomendable su Check List for a Data Management Plan

PGDonline es una herramienta web en línea, desarrollada por el DCC (Digital Curation     Centre, UK) y adaptada por el Consorcio Madroño y sus universidades miembro. Le proporciona una plantilla (también traducida al castellano por el Consorcio Madroño) adaptada a los requerimientos de las directrices Horizonte 2020. 

El Pla de Gestió de Dades de Recerca Es una herramienta en línea, desarrollada por el Consorcio de Servicios de las Universidades Catalanas, basada en el modelo creado por el DCC (Digital Curation Centre, UK). Incluye ejemplos reales en el cuestionario  para ayudar en la elaboración del Plan de Gestión de Datos

 

 

Es importante citar correctamente los datos de investigación para que puedan ser reutilizados en nuevas investigaciones, en actividades académicas y para otros fines de la sociedad en general. Se pueden utilizar diferentes formatos para citar los conjuntos de datos. Cada disciplina suele utilizar un estilo de cita determinado.
DataCite recomienda el siguiente formato:

Creator (PublicationYear). Title. [Dataset]. Version. Publisher. Identifier (DOI)

DOI Citation Formatter es un servicio ofrecido por DataCite que construye automáticamente las citas conforme al estilo que seleccionemos.

Las características específicas de un determinado repositorio nos obliga a generar los datos según sus requisitos: estándares de metadatos, tamaño de los ficheros, derechos de autor, preservación, coste, etc.

Para publicar se recomienda seleccionar en primer lugar un repositiro temático, si no lo hay, el repositorio institucional  de su universidad y por último utilizar Zenodo (repositorio propuesto por la Comisión Europea) u otro repositorio de datos multidisciplinares.

En el directorio re3data se pueden consultar los repositorios de datos existentes a nivel mundial.

  Repositorio multidisciplinar creado por OpenAIRE y el CERN, con el apoyo de la Comisión Europea.
Repositorio multidisciplinar alojadoen el Institute for Quantitative Social Science (IQSS) de la Universidad de Harvard.
Proyecto apoyado por Digital Science–Macmillan Publishers Co. Lo destacable de este repositorio son los tipos de licencias que utiliza: publica todo bajo la licencia CC-BY, pero distribuye los datasets con la CC0. Es un  repositorio multidisciplinar.
Proyecto colaborativo con DSpace que comenzó en el área de salud pero vinculado con el mundo de las bibliotecas, sociedades científicas y editores.
Repositorio multidisciplinar desarrollado por Elsevier.

Los detalles sobre repositorios de investigación pueden consultarse en la tabla comparativa.

 

Licencias

Existen varios tipos de licencias, se recomienda a los autores asignar una licencia de uso a los datos.

La Open Knowledge International recomienda el uso de licencias de dominio público como:

Creative Commons Zero (CC0 1.0): implica una liberación de los derechos de propiedad intelectual al ofrecer los datos en dominio público. Se permite su utilización sin ningún tipo de restricción. Bajo esta licencia los datos se pueden copiar, modificar, distribuir y hacer públicos, incluso para fines comerciales, sin solicitar autorización.

Open Data Commons, Public Domain Dedication and Licence (PDDL): es semejante a CC0 pero está dedicada específicamente para las bases de datos y su contenido (datos), en su conjunto o individualmente. Implica el dominio público para datos / bases de datos. Permite compartir, copiar, distribuir y utilizar la base de datos y/o los datos, sin ningún tipo de restricción; crear a partir de los mismos, y cambiarlos o transformarlos.

Por motivos de confidencialidad o de tratamiento especial de los datos, el autor puede utilizar licencias más restictivas para limitar su uso.

Para más ayuda pueden dirigirse a:

  • Unidad de Investigación y Transferencia Tecnológica:
  • CRAI Biblioteca. Repositorio Digital*:

*Se podrán publicar los datos primarios de las publicaciones depositadas en el repositorio de investigación, siempre que el tamaño y formato del archivo lo permitan.