Pular para o conteúdo principal

Seleção de dados para a publicação de Dados Abertos (Conectados) – parte 2


Por Thiago Ávila*

Dando continuidade à nossa série de artigos sobre Dados Abertos (conectados), vamos continuar apresentando a segunda melhor prática para a publicação de Dados Abertos Conectados, aplicando-os no contexto Governamental. Estes artigos têm como fundamentação a dissertação de mestrado, Uma Proposta de Modelo de Processo para Publicação de Dados Abertos Conectados Governamentais[1], onde desenvolvi uma revisão de literatura que identificou 70 recomendações para a publicação de Dados Abertos Conectados Governamentais, distribuído entre as 10 melhores práticas estabelecidas pelo W3C[12], que estão sendo exploradas em continuidade a esta série de artigos aqui no blog, cuja metodologia apresentei no artigo anterior.

Para identificar recomendações voltadas a implementar a segunda melhor prática, “2. Seleção de Conjuntos de Dados”, foi estabelecida a seguinte questão de pesquisa: “O que os processos de publicação de dados abertos (conectados) recomendam a ser feito para contemplar a melhor prática de Selecionar Conjuntos de Dados?"

Na sequência continuaremos apresentando as recomendações identificadas nos processos que poderão auxiliar a incorporação desta melhor prática em atividades de publicação de dados. Cumpre destacar que no artigo anterior já apresentamos cinco recomendações e neste artigo apresentaremos outras seis, totalizando onze recomendações para esta melhor prática.

A segunda melhor prática (BPLD) estabelecida consiste na seleção dos conjuntos de dados que serão publicados. Segundo o W3C (2014) [12], devem ser selecionados apenas os dados que são catalogados ou criados pela instituição que está implementando o processo de abertura. Preferencialmente, devem ser priorizados dados que, ao serem combinados com outros dados, produzam grande valor.  

2.6. Analisar o nível de sigilo dos dados e informações
É importante ressaltar que, apesar das leis vigentes nas nações recomendarem que o acesso à informação deva ser regra e o sigilo ser aplicado somente em casos excepcionais, há de se considerar que alguns dados governamentais não podem ser abertos por questões como ameaça a defesa nacional, ao desenvolvimento científico e tecnológico, dentre outros. Assim sendo, outra recomendação identificada consiste na análise do nível de sigilo dos dados e informações que podem ser considerados como objeto de abertura e publicação.







O processo da Colômbia (Colombia, 2012) sugere que as organizações estabeleçam os níveis de sigilo dos dados e informações, classificando em: 

  • Dados e informações publicáveis: Aquelas que devem estar à disposição de qualquer pessoa e que o governo é obrigado a disponibilizar, considerando que não há obrigação legal para mantê-las como sigilosa;
  •  Dados e informações não publicáveis: Aquelas que se enquadram como reservadas ou sigilosas conforme os parâmetros legais vigentes;
  • Dados e informações pessoais (semiprivadas): Dados e informações pessoais que não são de domínio público, mas foram obtidas por ordem de uma autoridade administrativa no exercício das suas funções ou no âmbito dos princípios de gestão de dados pessoais. Esta informação pode ou não pode estar sujeito ao sigilo, dependendo do caso.
O processo do Brasil tem como base legal a Lei Brasileira de Acesso a Informação (Lei Federal 12.527/2011) (Brasil:2011) [4] que aborda com clareza os casos e procedimentos para a adoção do sigilo das informações. Segundo o artigo 24 desta lei, a informação pública poderá ser classificada como reservada, secreta ou ultrassecreta e os respectivos prazos para se tornarem públicas são de 5 (cinco), 15 (quinze) e 25 (anos). O artigo 23 da lei estabelece os casos em que as informações devem ser classificadas como sigilosas.

 2.7. Analisar relatórios anuais e documentação existente
O entendimento do contexto organizacional é fator crítico de sucesso num processo de abertura de dados e por este motivo, o processo COMSODE sugere que devem ser localizados e analisados os relatórios anuais (balanços financeiros, relatórios de gestão, avaliação de desempenho e de projetos, etc.) e ainda outros documentos relevantes, incluindo o portal Web, que informem sobre as atividades e principais resultados alcançados da organização publicadora. Devem ser identificadas tabelas e gráficos nestes documentos que orientem sobre potenciais conjuntos de dados para serem abertos e conectados e ainda, deve se identificar quais unidades organizacionais são responsáveis pela sua preparação. Tais informações devem ser devidamente registradas numa relação de dados possíveis para serem abertos e conectados (COMSODE, 2014) [7]. 

Complementarmente, o processo “Methodological Guidelines” sugere que devem ser identificados ainda a documentação e os esquemas dos dados que serão objetos de publicação (quando houverem), bem como suas propriedades, relações, sistemas de informação geradores destes dados e arquiteturas Web (Villazon-Terrazas, 2011) [11]. 

2.8. Analisar o esforço para abertura de dados
Ademais, para que a publicação de dados seja exitosa e factível, o processo P14 ainda sugere que seja analisado o esforço de abertura de cada conjunto de dados. A análise de esforço deverá ser realizada a partir da priorização dos dados a serem publicados podendo, inclusive, resultar numa nova priorização, caso os dados inicialmente destacados para iniciarem o projeto de abertura tenham complexidade e demandem esforço muito alto (COMSODE, 2014) [7].
 
2.9. Fazer e validar mapa de responsabilidades entre conjuntos de dados e unidades de negócio responsáveis
Outra recomendação destacada pelo processo COMSODE consiste na criação de um mapa de responsabilidades entre os conjuntos de dados a serem publicados e respectivas unidades de negócio responsáveis, sendo este mapa graficamente representado. Especialmente, caso a unidade de negócio dependa do apoio de outra unidade, deve ficar explicitado às responsabilidades. Por exemplo, uma unidade de negócio que realiza e publica informações tabulares sobre o desempenho escolar pode depender de outra unidade de negócio para georreferenciar estes dados. Ademais, a relação de conjuntos de dados e o mapa de responsabilidades deve ser discutido e validado com pessoas que tenham poder de decisão sobre a publicação de dados (COMSODE, 2014) [7].

 2.10. Identificar e analisar sistemas de informação que poderão ser objeto da abertura de dados
A análise e identificação dos principais sistemas de informação da organização e os principais conjuntos de dados gerenciados por estes sistemas representa outra recomendação relevante, de acordo com o processo COMSODE (COMSODE, 2014) [7]. O processo do Brasil complementa sugerindo que seja estabelecida uma arquitetura para abertura de dados a partir de cada sistema de informação identificado (Brasil, 2014) [3].

Outro item sugerido consiste na análise se as fontes dos dados são Datawarehouses. De acordo com o processo “Geolinked Open Data for the Municipality of Catania”, quando for o caso, destacar a necessidade da construção de rotinas de extração/conversão destes dados ao iniciar o processo de publicação, devendo os descritores dos dados ser traduzidos para o idioma inglês ou o idioma nativo do país, quando aplicável (Consoli, 2014) [8].



 
2.11. Identificar dados que podem ser conectados
Além da identificação dos dados que serão abertos, sugere-se que sejam identificados os dados que tem potencial para serem conectados com menor esforço. Quando se tratar de um enriquecimento e reuso de dados já abertos e publicados por exemplo, devem ser procurados dados similares e relacionados (que possam se conectar ao dado que será publicado) em outros catálogos governamentais, como sugerido pelo processo “Methodological Guidelines” (Villazon-Terrazas, 2011) [11]. É destacado que o êxito desta atividade está relacionada com a recomendação de identificar a documentação e os esquemas dos dados que serão publicados, bem como suas propriedades, relações e arquiteturas Web. Outros autores, também destacam a identificação destes requisitos, entretanto, na etapa posterior, de modelagem dos dados.

Até a próxima!!!

* Este artigo foi desenvolvido a partir da pesquisa de Mestrado “Uma Proposta de Modelo de Processo para Publicação de Dados Abertos Conectados Governamentais”, de autoria de Thiago José Tavares Ávila, no âmbito do Programa de Pós-Graduação em Modelagem Computacional do Conhecimento, do Instituto de Computação da Universidade Federal de Alagoas (UFAL).

[1] ÁVILA, T. J. T. Uma proposta de modelo de processo para publicação de dados abertos conectados governamentais. 223 p. Dissertação (Mestrado) — Instituto de Computação, Universidade Federal de Alagoas, Maceió, Alagoas, Brasil, 2015. Dissertação de Mestrado em Modelagem Computacional do Conhecimento.
[2] BERNERS-LEE, T. Linked Data. 2006. Disponível em: 
<http://www.w3.org/DesignIssues/LinkedData.html>.
[3] BRASIL. Manual para Elaboração de Plano de Dados Abertos. [S.l.], 2014. v. 7, 38 p. Disponível em: <http://www.planejamento.gov.br/secretarias/upload/Arquivos/governoáberto/manual_elaboracao_plano_dados_abertos.pdf>.
[4] BRASIL. Lei No 12.527, de 18 de Novembro de 2011. 2011. Disponível em:
<http://www.planalto.gov.br/ccivil_03/_ato2011-2014/2011/lei/l12527.htm>.
[5] CHILE. Norma Técnica para Publicación de Datos Abiertos en Chile.
[S.l.], 2013. 1-28 p. Disponível em: 
< http://instituciones.gobiernoabierto.cl/NormaTecnicaPublicacionDatosChile_v2-1.pdf>.
[6] COLOMBIA. Guía para la apertura de datos en Colombia. [S.l.], 2012. 67 p. Disponível em: 
< http://programa.gobiernoenlinea.gov.co/apc-aa-files/da4567033d075590cd3050598756222c/Datos_Abiertos_Guia_v2_0.pdf >.
[7] COMSODE. Methodology for publishing datasets as open data - COMSODE. [S.l.], 2014.1-31 p. Disponível em: <http://www.comsode.eu/index.php/deliverables/>.
[8] CONSOLI, S. et al. Geolinked Open Data for the Municipality of Catania. Proceedings of the 4th International Conference on Web Intelligence, Mining and Semantics (WIMS14), p. 58, 2014.
[9] ECUADOR. Guia de Política Pública de Datos Abiertos. [S.l.], 2014. 21 p. Disponível em: <http://www.gobiernoelectronico.gob.ec/wp-content/uploads/2014/12/GPP-DA-v01-20141128-SNAP-SGE.pdf>.
[10] OKF. Guia de Dados Abertos. 2015. Disponível em: <http://opendatahandbook.org/guide/pt_BR>.
[11] VILLAZÓN-TERRAZAS, B. et al. Methodological guidelines for publishing government linked data. Linking Government Data, p. 27-49, 2011.
[12] W3C. Best Practices for Publishing Linked Data. 2014. Acessado em 02/05/2017. Disponível em: <http://www.w3.org/TR/ld-bp/>.
[13] URUGUAY. Guía rápida de publicación em datos.gub.uy. Montevideo, 2012.
17 p. Disponível em: 
< https://www.agesic.gub.uy/innovaportal/file/2478/1/guia_publicacion_datos_abiertos.pdf>.
Voltar

Comentários