O que os dados podem dizer sobre cada um de nós na era do Big Data

June 8, 2017 | Autor: Krishma Carreira | Categoria: Banco de Dados, Buscadores, Dados Abertos Governamentais, Tecnologia digital, Internet

Share Embed

Denunciar este link

Descrição do Produto

O que os dados podem dizer sobre cada um de nós na era do Big Data

Krishma Carreira

Mais de dois séculos antes do desenvolvimento da internet, foi sancionada a primeira Lei de Acesso à Informação, na Suécia, em 1766. Das cinco primeiras leis de acesso em todo o mundo, quatro foram na Escandinávia: Suécia, Finlândia (1951), Estados Unidos (1966), Dinamarca e Noruega (1970). Certos autores "defendem que se deve em parte à Lei de Acesso à Informação (e sua efetiva aplicação) o fato de os países escandinavos terem se tornado os menos corruptos e os mais socialmente responsáveis no mundo" (ANGÉLICO, 2015, p.6). Logo após a primeira lei ser sancionada, começou a Revolução Industrial com o posterior desenvolvimento do motor de combustão e da eletricidade. E antes da segunda lei entrar em vigor, o mundo já havia transitado para a era da informação. Com esta mudança de paradigma, o controle econômico, politico e cultural passou a ser de quem conseguisse manipular quantidades cada vez maiores de informações.
Com a internet houve uma explosão do volume de dados. O conhecimento humano, as transações comerciais lícitas ou ilícitas, nossos desejos e sonhos, medos e inseguranças, as conversas no mundo off-line, enfim, tudo passou a ser digitalizado e transformado em bit. E com isso, passamos a deixar pegadas digitais, registros ou logs que mapeiam nossa navegação no ciberespaço.
A experiência internacional indica que informações obtidas por meio de procedimetos criados pela Lei à Informação facilitam a criação de bancos de dados para pesquisas científicas; ajudam investigações de casos de corrupção; auxiliam o trabalho de organizações não governamentais e grupos de interesses (ANGÉLICO, 2015, p. 80).

Desde o surgimento da Arpanet (uma rede de computadores criada a partir da década de 50, nos Estados Unidos, para facilitar comunicação entre universidades), a internet tem na sua origem ideias como colaboração e compartilhamento.
Mas apesar disso, o acesso a boa parte dos dados disponíveis tem sido restringido por algumas corporações privadas, por governos e até pela academia. Eles os mantêm inacessíveis ou, muitas vezes, quando os abrem parcialmente, não permitem uma integração amigável com outros bancos de dados. Zeineyp Tufekci (2014) elaborou um trabalho sobre como as tecnologias digitais permitem o crescimento da combinação de grandes dados com práticas computacionais e, como parte de suas conclusões, aponta que "the dynamics outlined (…) for computational politics require access to expensive proprietary databases, often controlled by private platforms, and the equipment and expertise required to effectively use this data" (p.13).
O programador e ativista na internet, Aaron Swartz, fez um manifesto chamado "Open Access Movement", onde alegou que as grandes corporações vendem o patrimônio científico e cultural digitalizado "a um preço por vezes muito caro, para um minoria de privilegiados" (REIS, 2015). Muitos dados obtidos a partir de pesquisas relevantes ficam fechados dentro de "silos" informativos e não podem ser cruzados com outras pesquisas. O movimento de dados abertos defende que
os cientistas publiquem seus trabalhos na internet sob termos que permitam o acesso a qualquer pessoa. (…) No momento, pesquisadores são obrigados a pagar para ler o trabalho de seus colegas. Bibliotecas são digitalizadas, mas apenas o pessoal do Google pode lê-las. E artigos científicos são fornecidos por grandes universidades de elite do primeiro mundo, mas não para as crianças do sul global (REIS, 2015).

Aaron foi um hack ativista. Ele morreu em 2013, mas existem outros como ele que veem a necessidade de abrir dados de utilidade pública. Os hackers têm habilidade de lidar com a imensa quantidade de dados e podem identificar "soluções para encontrar informações onde imperam os bloqueios à transparência" (SILVEIRA, 2015).
Steven Levy explica que os hackers surgiram a partir de 1950,
primeiramente dentro do Instituto de Tecnologia de Massachusetts (MIT) e depois na Califórnia, quando professores e alunos passaram a usar o termo para descrever pessoas com grande habilidade técnica na informática, que aprendiam fazendo, através da prática, e se tornavam excelentes programadores e desenvolvedores de sistemas (...) Estes personagens, autodidatas, eram apaixonados pela solução de problemas a ponto de varar madrugadas na resolução de algo que não tivesse funcionando (apud FOLETTO; DEAK, 2014, p.3).

Eles têm, em comum, a desconfiança em relação às autoridades e a promoção da descentralização, do compartilhamento, da transparência e da informação livre.
Alguns movimentos e hackers a favor dos dados abertos agem, muitas vezes, contra as leis para forçar a abertura dos dados. Aaron Swartz dizia que "não há justiça em seguir leis injustas" (REIS, 2015).
Em "Why Should Cities Have an Open Data Policy", Stephen Larrick cita quatro razões para estabelecer uma política efetiva de dados, que foram discutidas em New Orleans, nos Estados Unidos:
Codificar e avançar práticas existentes de dados abertos, estabelecendo uma estrutura padrão que facilite a prática da abertura e a integração de bancos de dados;
Construir aceitação interna nas organizações para que os pedidos das equipes de TI sejam acatados e não interpretados como algo opcional que pode ser feito de apenas quando e se houver tempo livre nos departamentos;
Comunicar o compromisso da organização para estimular o engajamento público;
Construir um enquadramento jurídico para a prestação de contas e para a execução da política de dados abertos. Esta medida é fundamental para que o programa sobreviva a mudança de qualquer adminstração.

Enquanto se debate a abertura e regulamentação de dados que podem ter consequências positivas para a pesquisa e para a sociedade, por outro lado, existe uma importante discussão sobre o uso de dados sobre os usuários e sobre o direito à privacidade. Entendemos privacidade como uma forma de "controle sobre a informação" (VAIDHYANATHAN, 2011, p. 108). Não interessa, neste caso, a natureza da informação, mas, sim, a garantia do direito de gerenciar a própria reputação.
Em um talk show realizado para a conferência TED (Tecnologia, Entretenimento e Design) em março de 2014,
Edward Snowden fez um apelo a empresas de conteúdo para que usem conexões seguras, ao explicar o que é possível recolher com metadados. A sua coleta é prevista pela legislação americana e permite obter todos os registros telefônicos feitos e saber se o telefone está público – nas inúmeras listas telefônicas disponíveis online, é possível saber com quem e quando você está falando e até para onde você viajou.Também é possível saber em quais livros você clicou no banco de dados da Amazon – e a partir deles você recebe novas sugestões de títulos relacionados. 'Todas as empresas precisam ter o hábito de navegação critptografada como padrão, para proteger os usuários que não tenham realizado qualquer ação ou escolhido quaisquer métodos especiais por conta própria", disse Snowden (PASSOS, 2014, p.3).

Em relação aos dados, existe, de fato, uma assimetria de poder quanto à posse dos mesmos. Governo, organizações, empresas e partidos políticos têm mais informações sobre os usuários do que os mesmos possuem sobre eles e os utilizam, em geral, sem respeitarem a privacidade deles.
Um exemplo de empresa com excessivo volume de informações sobre os usuários é o Google. Ele alega que tem como missão organizar todas as informações do mundo e torná-las mundialmente acessíveis e úteis. Mas em função do grande conhecimento que tem sobre o perfil dos usuários e de seus hábitos de consumo, o Google, na verdade, tornou-se uma empresa de publicidade. "Seu serviço de busca é o motivo pelo qual o visitamos. A publicidade é o que o faz seguir em frente" acredita Vaidhyanathan (p.30).
A seguir, estão elencadas algumas formas que o Google usa para coletar dados e que são reveladas em sua Política de Privacidade:
Informações que o usuário transmite. Por exemplo: muitos serviços oferecidos pelo Google pedem o que usuário se inscreva em uma Conta do Google. Para abrir, ele precisa dar informações pessoais como: "endereço de e-mail, número de telefone ou cartão de crédito;
Informações coletadas a partir do uso que o usuário faz dos serviços: o Google coleta informação do que o usuário acessa e como acessa (vendo video do YouTube, interagindo com anúncios, etc.);
2.1) Informações do dispositivo: a empresa pega dados sobre modelo do hardware, versão do sistema operacional, identificadores como o número do telephone;
2.2) Informações do registro: "quando o usuário utiliza serviços ou vê conteúdo fornecido pelo Google, nós coletamos e armazenamos automaticamente algumas informações em registros do servidor". Isso inclui: como o usuário usou o serviço, consultas feitas, número de telefone de quem liga para o usuário ou para quem ele telefona, endereço de protocolo de internet (IP), cookies, etc;
2.3) Informações do local real do usuário;

Na Política de Privacidade, o Google explica que o usuário pode controlar e gerenciar informações para proteger a privacidade e segurança em "Minha Conta". Mas quantos usuários fazem de fato isso? E quantos acessam a Política de Privacidade? Presume-se que um pequeno percentual. "A política de privacidade do Google não ajuda muito. Na verdade, trata-se muito mais de uma política de falta de privacidade" (VAIDHYANATHAN, 2011, p. 99). Esta situação fica ainda mais complicada em função das constantes mudanças nesta política que acontecem sem notificar o usuário. Este só descobrirá caso resolva entrar novamente na seção que a empresa mantém sobre ela.

Vaidhyanathan alega que
não somos clientes do Google; somos produto dele. Nós – nossas fantasias, fetiches, predileções e preferências – somos aquilo que o Google vende aos seus anunciantes. Quando usamos o Google para encontrar coisas na rede, o Google usa nossas pesquisas para encontrar coisas sobre nós (2011, p.17).

E o que os usuários sabem sobre o Google? Ele é "uma caixa preta. Ele sabe demais sobre nós e quase nada sabemos sobre ele, completa Vaidhyanathan (p.23).

Conclusão
Com as tecnologias digitais, os usuários deixam registros de seus passos na internet. Estes dados podem ser usados, por exemplo, para a elaboração de políticas públicas e para a produção de pesquisas em diversas áreas do conhecimento, desde que os bancos de dados sejam abertos e amigáveis do ponto de vista de integração. Mas para isto ocorrer é necessário haver uma regulamentação apta a proteger a privacidade do usuário. Entretanto, ter uma política de privacidade não é garantia de proteção de fato, como vimos no exemplo do Google. Toda vez que o internauta procura algo no buscador, o Google usa esta mesma pesquisa para descobrir algo sobre ele. Este usuário quer isto de fato? O que ele precisa? O que deseja revelar? Que dado prefere que seja esquecido? Estas indagações não deveriam ser desprezadas.

Referências Bibliográficas

ANGÉLICO, Fabiano. Lei de acesso à informação. Reforço ao controle democrático. São Paulo: Estúdio Editores, 2015.

FOLETTO, Leonardo; DEAK, Andre. Aproximações da cultura hacker ao jornalismo: práticas e produtos jornalísticos disruptivos brasileiros. Disponível em: . Acesso em: 20 nov.2015.

LARRICK, Stephen. Why should cities have na open data policy. Disponível em: < http://br.okfn.org/2015/10/21/por-que-as-cidades-devem-ter-uma-politica-de-dados-abertos/> . Acesso em 10 nov. 2015.

PASSOS, Juliana. O que os dados podem dizer sobre nós. ComCiência. Disponível em: . Acesso em: 10 nov. 2015.

REIS, Isis. Aaraon Swartz: contra a privatização do conhecimento. Disponível em: < http://br.okfn.org/2015/09/08/aaron-swartz-contra-a-privatizacao-do-conhecimento/>. Acesso em 10 out. 2015.

SILVEIRA, Sérgio Amadeu. A informação quer ser livre. Disponível em: < http://observatoriodaimprensa.com.br/interesse-publico/_ed843_a_informacao_quer_ser_livre/> . Acesso em: 03 nov. 2015

TUFEKCI, Zeinep. Engineering the public: Big data, surveillance and computacional politics. Disponível em: . Acesso em: 25 out. 2015.

VAIDHYANATHAN, Siva. A googlelização de tudo (e por que devemos nos preocupar). São Paulo: Cultrix, 2011.

O Brasil sancionou a Lei de Acesso à Informação em 2011 e foi, assim, o 89o. país do mundo a adotá-la.
Disponível em: < https://www.ted.com/talks/edward_snowden_here_s_how_we_take_back_the_internet?language=en > . Acesso em: 29 nov. 2015.

Disponível em: < https://www.google.com/intl/pt-BR/policies/privacy/#infocollect > . Acesso em: 29 nov. 2015.

Lihat lebih banyak...

O que os dados podem dizer sobre cada um de nós na era do Big Data

Descrição do Produto

Comentários