quarta-feira, 1 de julho de 2015

Dados: Saiba o que tem para poder tratar melhor


Há alguns anos, tive a oportunidade de ciceronear Paul Cotton, então co-chair do grupo de HTML do W3C, em uma viagem ao Brasil. Ao chegarmos ao aeroporto de Confins para retornar a São Paulo, Paul viu uma enorme fila em frente a uma lotérica no aeroporto e me perguntou o que estava acontecendo para tantas pessoas entrarem em uma fila no aeroporto, que não fosse para embarcar. Contei então que este era um dia em que haveria um sorteio milionário de uma de nossas loterias e que as pessoas estavam, então, tentando jogar antes do horário limite, às 19:00.

No dia seguinte, já em São Paulo, me perguntou se eu tinha conseguido ver o resultado do sorteio do dia anterior. Respondi que não só eu, como provavelmente outro milhão de pessoas, teria tentado entrar no site da Caixa Econômica para ver o resultado e o site tinha ficado indisponível por várias horas. Como estávamos caminhando para fazer uma conversa sobre computação em nuvem com um grupo de clientes, ficou a pergunta no ar: será que a Caixa não tinha avaliado colocar esta página de resultados de loteria num provedor de computação em nuvem, com maior chance de poder responder ao pico de solicitações com menos impacto em seus datacenters próprios? Minha resposta básica, sem muito tempo para pensar foi: talvez considerem oneroso ou inseguro hospedar os resultados em outro ambiente e tenham medo de haver alteração e, portanto, pessoas pensarem indevidamente que foram sorteadas. Depois de um tempo me senti um tanto estúpido, já que vários sites na Internet brasileira também disponibilizam os dados de sorteios de loterias e, aparentemente, não há problema com isso.

Aí ficou a pergunta que vem sempre martelando minha cabeça: será que muitas empresas, por não terem estabelecido a governança e os processos de classificação de dados, acabam por considerar tudo como sendo dado de acesso restrito, sem possibilidade de armazenamento fora de seus próprios equipamentos? Perguntei aqui, perguntei ali e uma quantidade razoável de pessoas me respondeu positivamente a esta suposição dizendo, principalmente, que não havia condições de, com o volume de dados armazenados e o atual crescimento, fazer uma análise apurada para entender o portfólio.

Eu mesmo, em casa, tenho uma coleção de tamanho razoável de CDs, que venho colecionando desde os tempos de faculdade o que dá, pelo menos, 30 de anos de coleção. Algumas interrupções causadas por anos menos saudáveis financeiramente e momentos de quase êxtase como chegar numa loja e conseguir proferir a frase “Um de cada!” quando o vendedor de uma loja me perguntou se eu estava interessado em comprar um dos relançamentos em CD do Premiata Forneria Marconi, fizeram esta coleção crescer bastante e, até hoje, tenho dificuldade em saber o que já digitalizei ou não. Usei então uma recomendação simples e objetiva de um colega: comece com o que é novo, colocando o passado meio de lado e organize sua coleção a partir do agora, como se ela fosse nova.
E assim tenho feito, por anos a fio, sempre digitalizando as novas aquisições (sim, ainda compro CDs físicos) e, de tempos em tempos, voltando às estantes do meu histórico e digitalizando os CDs mais antigos. A coleção digital cresce toda semana, sempre com base num método de classificação e ordenação que adotei antes de começar esta maratona. Fica para outro dia dizer como faço para ouvir tudo isso...

Em trabalhos anteriores, foi assim também que conseguimos fazer uma boa classificação de dados (confidenciais, públicos, restritos, etc.): a partir do momento em que estabelecemos as regras de classificação de dados e começamos a tratar todos os novos documentos de acordo com elas, pudemos iniciar o armazenamento do novo. Depois de pegarmos prática nesta análise e organização, começamos a dividir a tarefa de migração dos dados antigos, que decidimos inicialmente classificar genericamente como restritos, para esta nova classificação.

Isso permitiu, inclusive, determinar com muito mais segurança quais seriam os dados que poderíamos compartilhar com parceiros de negócio sem o risco de vazamento de informações consideradas confidenciais, melhorando sensivelmente a qualidade do relacionamento digital que tínhamos com todos esses parceiros.

Essa prática levo, inclusive, para o meu pequeno mundo de relações digitais em redes sociais. Se tem algo que não quero que ninguém saiba, com certeza essa informação não estará por lá. Se quero compartilhar com um ou outro amigo, faço essa configuração ao finalizar o post e por aí vai. Levo uma vida praticamente sem sustos, ciente de que minha privacidade ainda está protegida e é minha função, e não a do provedor da rede social, manter esta privacidade de forma saudável. O provedor me dá as ferramentas e eu as utilizo, espero, de forma correta para poder dormir tranquilo. E, caso ache que o software do provedor ou suas políticas não estejam adequadas, eu readequo as minhas práticas para contornar as deficiências que observo, podendo até optar por trocar de rede social ou mesmo não aderir a uma nova.

No frigir dos ovos, o recado aqui é simples: entenda os dados que você tem em mãos para saber como tratá-los adequadamente.

No próximo post, um pouco da visão dos trabalhos de tratamento de dados que estamos desenvolvendo no mundo de normalização internacional para ajudar as pessoas a desembaraçar suas vidas digitais.

Um comentário :

  1. Muito boa dica, Fernando.

    E é algo que da pra aplicar a diversas situações pessoais e profissionais, não apenas dados e digitalização. Concorda?

    Abs!

    ResponderExcluir