Por uma cultura de dados abertos no YouTube

Share Embed


Descrição do Produto

Por uma cultura de dados abertos no YouTube


Krishma Carreira

Desde que Tim Berners-Lee criou a WWW ((World Wide Web) para promover um amplo acesso à informação, ocorreram profundas mudanças no fluxo de comunicação. "E, embora, essa não seja a primeira revolução tecnológica de nossa história, será aquela que tornará possível a quase todos possuir, desenvolver e disseminar conteúdo em tempo real sem depender de intermediários" (SCHMIDT; COHEN, 2013, p.12). Um exemplo desta alteração de paradigma é o YouTube. Criado em 14 de fevereiro de 2005, ele é responsável por fazer do conteúdo audiovisual online um fenômeno de massa ao permitir a transformação de qualquer indivíduo em produtor. Nesta plataforma não existe um fluxo unidirecional de comunicação de um emissor para um receptor. Tanto o Youtuber, como os internautas que simplesmente acessam o conteúdo ou os que são assinantes de um canal, podem interagir sem barreiras.

Ter um site compartilhado significa que essas produções obtêm uma visibilidade muito maior do que teriam se fossem distribuídas por portais separados e isolados. Significa também a exposição recíproca das atividades, o rápido aprendizado a partir de novas ideias e novos projetos e, muitas vezes, a colaboração de maneiras imprevisíveis, entre as comunidades (JENKINS, 2009, p. 348).

O YouTube alcançou 7,9 bilhões de visualizações por dia em 70 países. Segundo informações dele próprio, são mais de 1 bilhão de usuários únicos por mês. Eles postam 300 horas de conteúdo audiovisual por minuto. O Brasil é o segundo país que mais consome conteúdo na plataforma e o terceiro que mais faz upload. No YouTube existe uma imensa diversidade de temas: raça, gênero, arte, aventura, educação, informação, saúde, estilo de vida, beleza, games, ativismo, gastronomia, humor, entre tantos outros. Tudo isso faz parte de um gigantesco mundo de dados dentro da web, que é conhecido por Big Data. Uma simples procura pela palavra "Youtube" no buscador Google, no dia 30 de setembro de 2015, deu 7.720.000.000 resultados. Conforme o conceito de sistema complexo de Melanie Mitchell (2009), esta plataforma é dotada de imensa complexidade, onde cada canal e cada usuário agem sem um comando central e em constante adaptação.
Esta pequena introdução sobre o YouTube mostra como ele é rico em dados, entendidos aqui como unidade elementar de informação antes da interpretação e do processo cognitivo (FLORIDI, 2000). Dentro deste universo seria extremamente interessante analisar e correlacionar dados para obter informações como, por exemplo, assuntos mais populares dentro de cada tema (que pode ser medido pelo simples acesso ao conteúdo ou pelo tempo de visualização); perfil de usuários e descobrir padrões de interações e opiniões. Os dados também poderiam ser analisados para ajudar no entendimento de fenômenos, previsão de eventos ou na tomada de decisões. Através da mineração deles seria válido saber se aumentou o número de posts sobre homofobia, violência policial ou ataques a minorias. Outra utilidade seria descobrir, por exemplo, se o crescimento da quantidade de conteúdo sobre determinada doença pode ser indicativo de alguma epidemia em determinada região. Ao procurar sobre bomba caseira na plataforma, encontramos vários conteúdos audiovisuais (como podemos ver abaixo) com considerável número de visualizações. Ao cruzarmos um conjunto de dados sobre eles, podemos descobrir, entre outras possibilidades, resultados que nos levam a descobertas sobre padrões indicativos de de aumento de violência.



Os dados sobre conteúdos como os que vimos acima poderiam ser repassados para o governo e para academia com o objetivo de promoção de estudos e políticas públicas mais assertivas. Mas apesar do que está postado na YouTube ser visto livremente, os dados não estruturados deste repositório não são fáceis de analisar. Algumas informações são acessíveis somente para quem tem canal na plataforma através de algumas ferramentas (como Analytics) ou para fins publicitários (anunciantes) e não são disponíveis para um amplo público externo.
O YouTube tem uma API (Application Programming Interface ou Interface de Programação de Aplicativos).
A API do Youtube atual é a versão 3.0. Nesta versão, é possível buscar por informações de vídeos e canais com base nos seus ids. Entretanto, não é possível buscar por usuários que comentaram em um determinado vídeo ou mesmo por comentários de um vídeo. Isso pode ser uma grande limitação quando se pensa em análises utilizando o YouTube (FRANÇA et al., 2014, p. 16).

Falar sobre necessidade de uma cultura de dados abertos como defendemos no caso do YouTube, não significa perda de privacidade para os usuários. Mas sim tratar o dado de forma ética e como um elemento capaz de ganhar relevância ao gerar insights através de análises, identificando padrões de comportamento individual ou de grupo que têm potencial de transformar nosso entendimento sobre a sociedade, empresas e até sobre nos nós mesmos.
Tim Berners-Lee e outros pesquisadores e estudiosos explicam o papel que a web science tem nesta questão. Segundo eles, ela vai ajudar na criação de novos protocolos de estrutura da internet ao entender não só os algoritmos, mas também a sociedade que os utiliza. Desta forma, ela transforma comportamentos isolados em padrão (saem do mundo microscópico para o macroscópico). Este objetivo da web science é muito importante porque, ainda hoje, e contrário aos princípios básicos contidos na criação da WWW, a maioria dos dados está trancada em grandes repositórios de armazenamento e não é publicada em uma web aberta.
Defender uma cultura de dados abertos para que eles não fiquem disponíveis apenas para grandes empresas, mas que possam ser acessados eticamente pelo governo e pela academia, implica na necessidade da presença de cientistas de dados. Davenport e Patil (2012) alegam que há mais entusiasmo com a tecnologia que possibilitou a explosão dos dados do que com a formação de quem possa usá-los com eficiência. No mundo contemporâneo, estes cientistas precisam saber identificar fontes de dados, juntá-los, "limpá-los" e gerar resultado. Trata-se de um profissional híbrido de hacker, analista, comunicador e conselheiro.
Conclui-se, portanto, que apesar do YouTube democratizar a produção de conteúdo online, ele não contribuiu com uma ampla cultura de dados aberta que permite identificar padrões de comportamento atual e prever outros comportamentos futuros que são importantes para a sociedade.
Referências bibliográficas

BERNERS- LEE, Tim; HALL, Wendy; HENDLER, James; SHADBOLT, Nigel; WEITXNER, Daniel J. Creating a science of the web. Disponível em: < http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.518.2448&rep=rep1&type=pdf>. Acesso em: 25 set. 2015.


DAVENPORT, Thomas H.; PATIL, D.J. Data scientist: the sexiest job of the 21st century. Havard Business Review. Disponível em: < https://hbr.org/2012/10/data-scientist-the-sexiest-job-of-the-21st-century/ >. Acesso em 29 set. 2015.


FLORIDI, Luciano. The language of information. In: __________ Information: a very short introduction. New York: Oxford University Press, 2000. p. 19-36.


FRANÇA, Tiago Cruz; FARIA, Fabrício Firmino de; RANGEL, Fabio Medeiros, FARIAS, Claudio Miceli de; OLIVEIRA, Jonice. Big social data: princípios sobre coleta, tratamento e análise de dados sociais. Tópicos em gerenciamento de dados e informações. Disponível em: < http://www.inf.ufpr.br/sbbd-sbsc2014/sbbd/proceedings/artigos/pdfs/127.pdf > Acesso em: 29 set. 2015.


KIM, Gary. Ensuring the data-rich future of the social sciences. Science. New York, 2011. P.719- 721.
LEV-RAM, Michal. Data scientist: the hot new gig in tech. Fortune. Disponível em:
< http://fortune.com/2011/09/06/data-scientist-the-hot-new-gig-in-tech/>. Acesso em: 28 set. 2015.


LIMA JUNIOR, Walter Teixeira. Big data e jornalismo: datasets, APIs, algoritmos e sensores. ComCiência. Disponível em: < http://www.researchgate.net/profile/Walter_Lima_Junior/publication/280491337_Big_data_e_jornalismo_datasets_APIs_algoritmos_e_sensores/links/55b640db08aed621de03227c.pdf?inViewer=true&&origin=publication_detail&inViewer=true>. Acesso em 16 de set. 2015.


MITCHELL, Melanie. Complexity: a guide tour. New York: Oxford University Press, 2009.


SCHMIDT, Eric; COHEN, Jared. A nova era digital: como será o futuro das pessoas, das nações e dos negócios. Rio de Janeiro: Intrínseca, 2013.


SCHUTT, Rachel. 10 important data science ideas. Disponível em: < http://columbiadatascience.com/2012/10/15/10-important-data-science-ideas/> . Acesso em 25 set. 2015.


WRIGHT, Alex. Web science meets network Science. Communications of the ACM. Mai. 2011,


https://royalsociety.org/~/media/Royal_Society_Content/policy/projects/sape/2012-06-20-SAOE.pdf\


http://columbiadatascience.com/2012/10/15/10-important-data-science-ideas/

http://fortune.com/2011/09/06/data-scientist-the-hot-new-gig-in-tech/

https://hbr.org/2012/10/data-scientist-the-sexiest-job-of-the-21st-century/

http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.518.2448&rep=rep1&type=pdf

https://royalsociety.org/~/media/Royal_Society_Content/policy/projects/sape/2012-06-20-SAOE.pdf\




Youtuber é o nome atribuído a quem tem um canal no YouTube.

Disponível em: < http://issuu.com/telaviva/docs/tv_258_tablet?e=1344148/14221243>. Acesso em: 25 set. 2015

Big Data é um imenso e variável volume de dados de rápida circulação. Para defini-lo como tal é preciso empregar um conjunto de técnicas com a finalidade de encontrar padrões não triviais informativos, "criar transparência, habilitar descobertas experimentais originar segmentações informativas, substituir e auxiliar processos de decisão e inovar por meio de novos modelos de negócios" (LIMA JUNIOR, 2015).

A Google adquiriu o YouTube em 2006.
API é um conjunto de padrões que são criados para um determinado software para permitir o uso dos recursos por outras aplicações.
A web science reúne as ciências físicas, biológicas, computacional e humanas. A computação social também tem os mesmos objetivos da web Science, assim como aposta na interdisciplinaridade de áreas como sociologia, educação, comunicação, economia, administração, psicologia, entre outras.




Lihat lebih banyak...

Comentários

Copyright © 2017 DADOSPDF Inc.