IRUS-UK – Estatísticas de Uso de Repositórios Institucionais

Projetos Open Access da Universidade do Minho 2013-04-22

Após a participação num webinar sobre este serviço, venho partilhar alguma informação relevante sobre o projeto e outras iniciativas na temática das estatísticas de uso.

O projeto IRUS-UK tem como âmbito disponibilizar as estatísticas de utilização dos repositórios do Reino Unido de acordo com um standard (COUNTER) para que todos tenham a mesma forma de medir, comparar dados que tiveram tratamento igual. 

Do ponto de vista estratégico, o projeto pretende coletar os dados estatísticos, processá-los de acordo com as recomendações da norma COUNTER, devolver essa informação tratada aos utilizadores do repositório, disponibilizar ao JISC (entre outros) um panorama sobre a utilização dos repositórios no Reino Unido e finalmente intermediar o processo com agências financiadoras como o Research Council ou o projeto OpenAIRE.

O projeto tem já vários repositórios integrados (para já DSpace e Eprints) e existem duas formas de enviarem a informação para um ponto central de gestão dos dados:

1 – Através de um código Tracker (tipo o google Analytics) que envia diretamente do servidor local (repositório) para o servidor central onde os dados serão agregados, tratados e apresentados.

2 – Utilizar o protocolo OAI-PMH para enviar os dados para o servidor central.

Devido à quantidade de dados gerados, optaram por usar o primeiro método pois através de OAI-PMH e considerando o crescimento do número de repositórios esse processo pode demorar muito tempo e sobrecarregar os sistemas.

O processamento dos dados no sistema central agrega os eventos recebidos e compila-os em downloads por dia. Organiza-os de acordo com as regras COUNTER e remove os robots e duplos cliques. Num segundo momento, os dados agregados são comparados com os que já existem no sistema central e são adicionados os valores diários, permitindo saber a evolução de downloads de um registo ao longo do tempo.

Existe ainda um terceiro momento no tratamento de dados que consiste em usar o identificador do registo (handle, DOI, ou outro) e através do protocolo OAI-PMH recuperar os metadados associados a esse registo. Desta forma ao identificador inicial ficam associados os restantes metadados, permitindo identificar o autor, título, tipo de documento, etc…

Após o processamento dos dados, toda a informação é apresentada num portal que permite visualizar vários tipos de relatórios com granularidade diária e mensal. Possui exportação em CSV/Excel e no próprio interface do Portal. Além disso, disponibiliza a informação no formato SUSHI com granularidade mensal.

A incorporação das estatísticas nos repositórios está ainda em desenvolvimento, mas será efetuada através de uma API (Web Service).

Este projeto IRUS-UK baseia-se nos resultados do projeto PIRUS2 que serviu de base ao desenvolvimento do serviço SCEUR do projeto RCAAP.

Este serviço baseia-se nas mesmas recomendações que o projeto PIRUS2 e utiliza o protocolo OAI-PMH para agregar os repositórios portugueses. O conceito do Portal agregador foi um pouco diferente no Projeto RCAAP pois foi usado o conceito de estatísticas à medida. Sendo assim o SCEUR é uma ferramenta que permite criar gráficos com base nos dados agregados. Uma diferença significativa entre o IRUS-UK e o SCEUR é que neste último existem mais opções de estatísticas além dos downloads, permitindo aceder às consultas da página de metadados, depósitos, publicações e número de registos.

Outro aspeto interessante no SCEUR é a possibilidade de subscrever por email o resultado de um gráfico. Por exemplo, se fizer um gráfico que mostre os downloads do último mês, pode subscrever esse gráfico todos os meses, recebendo assim automaticamente por correio eletrónico os downloads do último mês.

A temática das estatísticas de uso no contexto dos repositórios institucionais é importantíssima na medida em que permite disponibilizar indicadores da utilização dos recursos disponibilizados em acesso aberto. Além disso, possibilita um conjunto de novos serviços orientados para os diversos públicos (autores, gestores de repositórios, instituição, órgãos financiadores, observatórios nacionais, etc…).

Deve-se contudo olhar para as estatísticas de uso como um dos indicadores do repositório e no futuro conjugá-las com outras como as métricas alternativas. Além disso, assim que forem implementados em larga escala os índices de autoridade relativos ao autor poderemos ter uma visão mais concreta sobre o impacto e visibilidade de um determinado autor por exemplo.

Usando a expressão de Peter Drucker “Não se pode gerir aquilo que não se pode medir”, temos agora a possibilidade de gerir melhor os repositórios!