Por
Thiago Ávila*
Dando
continuidade à nossa série de artigos sobre Dados Abertos (conectados), vamos
continuar apresentando a segunda melhor prática para a publicação de Dados
Abertos Conectados, aplicando-os no contexto Governamental. Estes artigos têm como
fundamentação a dissertação de mestrado, “Uma Proposta de Modelo de
Processo para Publicação de Dados Abertos Conectados Governamentais”[1],
onde desenvolvi uma revisão de literatura que identificou 70 recomendações para
a publicação de Dados Abertos Conectados Governamentais, distribuído entre as
10 melhores práticas estabelecidas pelo W3C[12], que estão sendo exploradas em
continuidade a esta série de artigos aqui no blog, cuja metodologia apresentei
no artigo anterior.
Para identificar
recomendações voltadas a implementar a segunda melhor prática, “2. Seleção
de Conjuntos de Dados”, foi estabelecida a seguinte questão de
pesquisa: “O que os processos de publicação de dados abertos (conectados)
recomendam a ser feito para contemplar a melhor prática de Selecionar Conjuntos
de Dados?"
Na sequência
continuaremos apresentando as recomendações identificadas nos processos que
poderão auxiliar a incorporação desta melhor prática em atividades de publicação
de dados. Cumpre destacar que no artigo anterior já apresentamos cinco
recomendações e neste artigo apresentaremos outras seis, totalizando onze
recomendações para esta melhor prática.
A segunda melhor
prática (BPLD) estabelecida consiste na seleção dos conjuntos de dados que
serão publicados. Segundo o W3C (2014) [12], devem ser selecionados apenas os
dados que são catalogados ou criados pela instituição que está implementando o
processo de abertura. Preferencialmente, devem ser priorizados dados que, ao
serem combinados com outros dados, produzam grande valor.
2.6. Analisar
o nível de sigilo dos dados e informações
É importante ressaltar que, apesar das leis vigentes
nas nações recomendarem que o acesso à informação deva ser regra e o sigilo ser
aplicado somente em casos excepcionais, há de se considerar que alguns dados
governamentais não podem ser abertos por questões como ameaça a defesa
nacional, ao desenvolvimento científico e tecnológico, dentre outros. Assim
sendo, outra recomendação identificada consiste na análise do nível de sigilo
dos dados e informações que podem ser considerados como objeto de abertura e
publicação.
O processo da
Colômbia (Colombia, 2012) sugere que as organizações estabeleçam os níveis de
sigilo dos dados e informações, classificando em:
- Dados e informações publicáveis: Aquelas que devem estar à disposição de qualquer pessoa e que o governo é obrigado a disponibilizar, considerando que não há obrigação legal para mantê-las como sigilosa;
- Dados e informações não publicáveis: Aquelas que se enquadram como reservadas ou sigilosas conforme os parâmetros legais vigentes;
- Dados e informações pessoais (semiprivadas): Dados e informações pessoais que não são de domínio público, mas foram obtidas por ordem de uma autoridade administrativa no exercício das suas funções ou no âmbito dos princípios de gestão de dados pessoais. Esta informação pode ou não pode estar sujeito ao sigilo, dependendo do caso.
O processo
do Brasil tem como base legal a Lei Brasileira de Acesso a Informação (Lei
Federal 12.527/2011) (Brasil:2011) [4] que aborda com clareza os casos e
procedimentos para a adoção do sigilo das informações. Segundo o artigo 24
desta lei, a informação pública poderá ser classificada como reservada, secreta
ou ultrassecreta e os respectivos prazos para se tornarem públicas são de 5
(cinco), 15 (quinze) e 25 (anos). O artigo 23 da lei estabelece os casos em que
as informações devem ser classificadas como sigilosas.
2.7.
Analisar relatórios anuais e documentação existente
O entendimento do
contexto organizacional é fator crítico de sucesso num processo de abertura de
dados e por este motivo, o processo COMSODE sugere que devem ser localizados e
analisados os relatórios anuais (balanços financeiros, relatórios de gestão,
avaliação de desempenho e de projetos, etc.) e ainda outros documentos
relevantes, incluindo o portal Web, que informem sobre as atividades e
principais resultados alcançados da organização publicadora. Devem ser
identificadas tabelas e gráficos nestes documentos que orientem sobre
potenciais conjuntos de dados para serem abertos e conectados e ainda, deve se
identificar quais unidades organizacionais são responsáveis pela sua
preparação. Tais informações devem ser devidamente registradas numa relação de
dados possíveis para serem abertos e conectados (COMSODE, 2014) [7].
Complementarmente,
o processo “Methodological Guidelines” sugere que devem ser identificados ainda
a documentação e os esquemas dos dados que serão objetos de publicação (quando
houverem), bem como suas propriedades, relações, sistemas de informação
geradores destes dados e arquiteturas Web (Villazon-Terrazas, 2011) [11].
2.8. Analisar o esforço para abertura de dados
Ademais,
para que a publicação de dados seja exitosa e factível, o processo P14 ainda
sugere que seja analisado o esforço de abertura de cada conjunto de dados. A
análise de esforço deverá ser realizada a partir da priorização dos dados a
serem publicados podendo, inclusive, resultar numa nova priorização, caso os
dados inicialmente destacados para iniciarem o projeto de abertura tenham
complexidade e demandem esforço muito alto (COMSODE, 2014) [7].
2.9. Fazer e
validar mapa de responsabilidades entre conjuntos de dados e unidades de
negócio responsáveis
Outra
recomendação destacada pelo processo COMSODE consiste na criação de um mapa de
responsabilidades entre os conjuntos de dados a serem publicados e respectivas
unidades de negócio responsáveis, sendo este mapa graficamente representado.
Especialmente, caso a unidade de negócio dependa do apoio de outra unidade,
deve ficar explicitado às responsabilidades. Por exemplo, uma unidade de
negócio que realiza e publica informações tabulares sobre o desempenho escolar
pode depender de outra unidade de negócio para georreferenciar estes dados.
Ademais, a relação de conjuntos de dados e o mapa de responsabilidades deve ser
discutido e validado com pessoas que tenham poder de decisão sobre a publicação
de dados (COMSODE, 2014) [7].
2.10. Identificar e analisar sistemas de informação
que poderão ser objeto da abertura de dados
A análise e
identificação dos principais sistemas de informação da organização e os
principais conjuntos de dados gerenciados por estes sistemas representa outra
recomendação relevante, de acordo com o processo COMSODE (COMSODE, 2014) [7]. O
processo do Brasil complementa sugerindo que seja estabelecida uma arquitetura
para abertura de dados a partir de cada sistema de informação identificado (Brasil,
2014) [3].
Outro item
sugerido consiste na análise se as fontes dos dados são Datawarehouses. De
acordo com o processo “Geolinked Open Data for the Municipality of Catania”,
quando for o caso, destacar a necessidade da construção de rotinas de
extração/conversão destes dados ao iniciar o processo de publicação, devendo os
descritores dos dados ser traduzidos para o idioma inglês ou o idioma nativo do
país, quando aplicável (Consoli, 2014) [8].
2.11. Identificar dados que podem ser conectados
Além da
identificação dos dados que serão abertos, sugere-se que sejam identificados os
dados que tem potencial para serem conectados com menor esforço. Quando se
tratar de um enriquecimento e reuso de dados já abertos e publicados por
exemplo, devem ser procurados dados similares e relacionados (que possam se
conectar ao dado que será publicado) em outros catálogos governamentais, como
sugerido pelo processo “Methodological Guidelines” (Villazon-Terrazas, 2011)
[11]. É destacado que o êxito desta atividade está relacionada com a
recomendação de identificar a documentação e os esquemas dos dados que serão
publicados, bem como suas propriedades, relações e arquiteturas Web. Outros
autores, também destacam a identificação destes requisitos, entretanto, na
etapa posterior, de modelagem dos dados.
Até a próxima!!!
* Este artigo foi
desenvolvido a partir da pesquisa de Mestrado “Uma Proposta de Modelo de
Processo para Publicação de Dados Abertos Conectados Governamentais”, de
autoria de Thiago José Tavares Ávila, no âmbito do Programa de Pós-Graduação em
Modelagem Computacional do Conhecimento, do Instituto de Computação da
Universidade Federal de Alagoas (UFAL).
[1] ÁVILA,
T. J. T. Uma proposta de modelo de processo para publicação de dados abertos
conectados governamentais. 223 p. Dissertação (Mestrado) — Instituto de
Computação, Universidade Federal de Alagoas, Maceió, Alagoas, Brasil, 2015.
Dissertação de Mestrado em Modelagem Computacional do Conhecimento.
[2] BERNERS-LEE, T. Linked Data. 2006. Disponível em:
<http://www.w3.org/DesignIssues/LinkedData.html>.
<http://www.w3.org/DesignIssues/LinkedData.html>.
[3] BRASIL. Manual para
Elaboração de Plano de Dados Abertos. [S.l.], 2014. v. 7, 38 p. Disponível em:
<http://www.planejamento.gov.br/secretarias/upload/Arquivos/governoáberto/manual_elaboracao_plano_dados_abertos.pdf>.
[4] BRASIL. Lei No
12.527, de 18 de Novembro de 2011. 2011. Disponível em:
<http://www.planalto.gov.br/ccivil_03/_ato2011-2014/2011/lei/l12527.htm>.
[5] CHILE. Norma Técnica para Publicación de Datos
Abiertos en Chile.
[S.l.], 2013. 1-28 p.
Disponível em:
< http://instituciones.gobiernoabierto.cl/NormaTecnicaPublicacionDatosChile_v2-1.pdf>.
< http://instituciones.gobiernoabierto.cl/NormaTecnicaPublicacionDatosChile_v2-1.pdf>.
[6] COLOMBIA. Guía para la apertura de datos en Colombia.
[S.l.], 2012. 67 p. Disponível em:
< http://programa.gobiernoenlinea.gov.co/apc-aa-files/da4567033d075590cd3050598756222c/Datos_Abiertos_Guia_v2_0.pdf >.
< http://programa.gobiernoenlinea.gov.co/apc-aa-files/da4567033d075590cd3050598756222c/Datos_Abiertos_Guia_v2_0.pdf >.
[7] COMSODE. Methodology for publishing datasets as open
data - COMSODE. [S.l.], 2014.1-31 p. Disponível em:
<http://www.comsode.eu/index.php/deliverables/>.
[8] CONSOLI, S. et al. Geolinked Open Data for the Municipality of
Catania. Proceedings of the 4th International Conference on Web
Intelligence, Mining and Semantics (WIMS14), p. 58, 2014.
[9] ECUADOR. Guia de
Política Pública de Datos Abiertos. [S.l.], 2014. 21 p. Disponível em: <http://www.gobiernoelectronico.gob.ec/wp-content/uploads/2014/12/GPP-DA-v01-20141128-SNAP-SGE.pdf>.
[10] OKF. Guia de Dados
Abertos. 2015. Disponível em: <http://opendatahandbook.org/guide/pt_BR>.
[11] VILLAZÓN-TERRAZAS,
B. et al. Methodological guidelines for publishing government linked data.
Linking Government Data, p. 27-49, 2011.
[12] W3C. Best Practices for Publishing Linked Data.
2014. Acessado em 02/05/2017. Disponível em:
<http://www.w3.org/TR/ld-bp/>.
[13] URUGUAY. Guía rápida
de publicación em datos.gub.uy. Montevideo, 2012.
17 p. Disponível em: < https://www.agesic.gub.uy/innovaportal/file/2478/1/guia_publicacion_datos_abiertos.pdf>.
Comentários
Postar um comentário