Dados Científicos e CKAN – Software de Gestão de Dados Abertos

Projetos Open Access da Universidade do Minho 2013-02-19

A crescente disponibilização em acesso aberto da publicação científica fez emergir a necessidade do acesso aos dados científicos que deram origem à publicação. Não só como uma forma de comprovar o estudo inicial mas como partilha de informação para outros estudos derivados dos mesmos dados.

O conceito de disponibilização gratuita dos dados vai ao encontro da filosofia do acesso aberto em geral: “Open data is data that can be freely used, reused and redistributed by anyone – subject only, at most, to the requirement to attribute and sharealike.” por OpenDefinition.org

Existem diversos tipos de dados que são registados, quer a nível de projetos de investigação em instituições quer para entidades governamentais. A título de exemplo podemos indicar dados científicos, estatísticos, financeiros, meteorológicos, etc. No contexto da publicação científica interessará analisar os dados científicos em particular.

Um número crescente de políticas de financiadores de investigação científica tem vindo a contemplar o depósito e acesso aberto aos dados científicos. Por exemplo, no próximo programa quadro de investigação da EU, o Horizonte 2020 está previsto um projeto-piloto de acesso aberto aos dados científicos produzidos pelos projetos financiados.

Para dar resposta à crescente necessidade de depósito, acesso e reutilização dos dados científicos, a Open Knowledge Foundation desenvolveu o CKAN (http://ckan.org), uma plataforma open-source para gestão de dados científicos, disponibilizando ferramentas para publicação, partilha, recuperação e uso dos dados. Inicialmente desenvolvida para o projeto http://Datahub.io, é agora usada por várias iniciativas no mundo como o portal de dados governamentais do Reino Unido http://data.gov.uk, o portal europeu de dados públicos http://publicdata.eu ou a iniciativa nacional Dados.gov (http://www.dados.gov.pt).

As principais funcionalidades deste sistema são:

- Publicação e Pesquisa – Permite a publicação através da importação ou submissão online, pesquisa livre ou por palavras-chave e consulta do histórico dos dados.

- Armazenamento e gestão dos dados – Guarda os dados e respetivos metadados e permite a sua visualização através de tabelas, gráficos ou mapas. Permite-lhe também obter estatísticas sobre a utilização dos dados além de permitir a pesquisa espacial num mapa por exemplo.

- Interoperabilidade – Permite criar redes de repositórios de dados federados e integrar o sistema com gestores de conteúdos (CMS) e criar uma comunidade de utilizadores em redor dos dados.

- Extensível e personalizável – Além de ser disponibilizado no modelo de desenvolvimento open-source, existem diversas extensões que podem ser integradas com base nas necessidades de cada contexto.

Esta aplicação, e considerando a sua arquitetura e funcionalidades apresentadas, poderá ser um promotor da gestão consertada dos dados científicos pelas instituições e aumentar o número de datasets disponíveis em acesso aberto.