Por Thiago Ávila*
Dando continuidade à nossa série de artigos sobre Dados (abertos) conectados, vamos detalhar neste artigo um importante trabalho desenvolvido pelo Government Linked Data Working Group (Grupo de Trabalho para os Dados Conectados Governamentais) [1], “Melhores Práticas para Publicação de Dados Conectados” (Best Practices for Publishing Linked Data) [2].
Este trabalho foi elaborado para
compilar as práticas mais relevantes para a publicação e utilização de dados de
alta qualidade publicados por governos ao redor do mundo, como os Dados Abertos
Conectados, com o propósito de orientar a publicação, uso e reutilização de
dados abertos governamentais. Tais praticas tem como público-alvo administradores
e desenvolvedores de sítios Web, bem como gestores e técnicos que atuam com
gestão de informações governamentais [2].
É composto de 10 melhores práticas que
consideram o nível de envolvimento de partes interessadas na publicação de
dados, cuidados com a legalidade, modelagem, processamento e organização dos
dados, semântica, tempestividade, alta disponibilidade dos dados e ainda, como
deve ser feita a sua divulgação para o público e sua manutenção. São descritas
resumidamente a seguir [2,3]:
- Preparar partes interessadas (Prepare stakeholders): Etapa que visa preparar as partes interessadas, em especial os decisores, sobre o processo de criação de manutenção de dados abertos conectados;
- Selecionar conjuntos de dados (Select data): Etapa que visa a seleção dos dados que serão publicados, bem como irão prover benefícios para os usuários, que poderão utilizá-los e reusá-los para diversas finalidades;
- Modelar os dados (Model the data): Esta etapa visa estabelecer uma melhor representação dos objetos de dados e como eles serão utilizados por aplicações de forma independente a sua origem;
- Especificar uma licença apropriada (Specify an Appropriated License): Visa o estabelecimento das condições de uso (e não uso) dos dados que serão publicados. O reuso dos dados ocorre com maior frequência quando existe clareza sobre a sua origem, propriedade (autoria) e demais condições relacionadas ao uso destes dados;
- Estabelecer bons identificadores universais (URIs) para dados conectados (The Role of “Good URIs” for Linked Data): O núcleo dos dados conectados se baseia num planejamento bem feito de identificação e referenciamento dos dados na Web, baseados em URIs HTTP. Devem ser estabelecidos os requisitos para objetos de dados, suporte a diversos idiomas, alteração de dados ao longo do tempo e estratégia de persistência
- Utilizar vocabulários padrão (Standard Vocabularies): Descrever objetos com vocabulários previamente definidos, sempre que possível. Quando necessário, ampliar tais vocabulários de acordo com a necessidade. Podem ser criados novos vocabulários (somente quando necessário) seguindo as melhores práticas para este fim.
- Converter e enriquecer dados (Convert Data to Linked Data): Esta etapa visa estabelecer as condições para a conversão e o enriquecimento de dados para dados conectados. Estão contempladas atividades técnicas de melhoria dos dados, como conversão para formatos mais apropriados, desenvolver serializações, dentre outras. Para esta pesquisa, serão consideradas tarefas técnicas que preparem os dados para que sejam conectados ou que sejam melhorados para serem conectados futuramente. Pode ser entendida como uma etapa de enriquecimento de dados. É uma atividade comumente realizada por scripts ou processos automatizados;
- Prover acesso automatizado aos dados (Provide Machine Access to Data): Devem ser providos diversos meios e formatos para que ferramentas de busca e outros recursos de processamento e consumo automatizado possam utilizar os dados mediante recursos padrões da Web;
- Anunciar os conjuntos de dados (Announce to the Public): Devem ser divulgados os novos dados publicados para que a comunidade possa fazer o devido uso;
- Estabelecer um contrato social para os dados publicados (Social Contract of a Linked Data Publisher): Esta etapa visa destacar a necessidade de se reconhecer a responsabilidade em garantir a disponibilidade, manutenção e atualização dos dados publicados. Por serem conectados, tais dados precisam ter a garantia que vão ficar disponíveis onde a organização publicadora estabelece e ainda, será mantido ao longo do tempo.
Nos próximos artigos desta série
poderemos detalhar cada uma das melhores práticas apresentadas neste artigo.
Até a próxima!!!
*
Este artigo foi desenvolvido a partir da pesquisa de Mestrado “Uma Proposta de
Modelo de Processo para Publicação de Dados Abertos Conectados Governamentais”,
de autoria de Thiago José Tavares Ávila, decorrente de pesquisas científicas desenvolvidas no Núcleo de Excelência em
Tecnologias Sociais (NEES), do Instituto de Computação da Universidade Federal
de Alagoas (UFAL). Esta série de artigos contam com a contribuição dos
pesquisadores Dr. Ig Ibert Bittencourt (UFAL), Dr. Seiji Isotani (USP), e
Armando Barbosa, Danila Oliveira, Judson Bandeira, Thiago Ávila e Williams
Alcântara (UFAL).
[1] W3C. (2011) Government Linked Data Working Group - http://www.w3.org/2011/gld/wiki/Main_Page
[2] W3C (2014) Best Practices for Publishing Linked Data. 2014.
Acessado em 02/05/2017. Disponível em: <http://www.w3.org/TR/ld-bp/>.
[3] ÁVILA, T. J. T. Uma proposta de modelo de processo para publicação de dados abertos conectados governamentais. 223 p. Dissertação (Mestrado) — Instituto de Computação, Universidade Federal de Alagoas, Maceió, Alagoas, Brasil, 2015. Dissertação de Mestrado em Modelagem Computacional do Conhecimento.
[3] ÁVILA, T. J. T. Uma proposta de modelo de processo para publicação de dados abertos conectados governamentais. 223 p. Dissertação (Mestrado) — Instituto de Computação, Universidade Federal de Alagoas, Maceió, Alagoas, Brasil, 2015. Dissertação de Mestrado em Modelagem Computacional do Conhecimento.
Comentários
Postar um comentário