Programa Open Refine facilita tratamento de dados no jornalismo
Software auxilia profissionais da imprensa a trabalhar com grandes volumes de tabelas, planilhas e números
Heloísa Scognamiglio
Luana Brigo
Muito tem se falado ultimamente sobre jornalismo de dados, expressão que é cada vez mais recorrente no cotidiano dos jornalistas. Por conta da evolução das tecnologias digitais, vivemos em uma época na qual, além de haver uma incrível quantidade de dados disponíveis, também é possível processar todos esses dados de forma eficiente. Isso ocorre através de ferramentas que ajudam os profissionais de comunicação não somente a lidar com as informações, mas também a organizá-las, filtrá-las e analisá-las. Uma destas ferramentas é o Open Refine.
Surgimento e funcionalidades
O Open Refine é um programa que possibilita o tratamento e a manipulação de dados, especialmente quando estes estão desorganizados ou apresentam inconsistências. Suas funções vão desde limpar, corrigir, clusterizar e filtrar os dados, até transformá-los de um formato para outro. Para utilizá-lo, é necessário fazer o seu download gratuitamente no site do software. Nesse mesmo site, também é possível encontrar tutoriais que explicam melhor como o programa funciona, como o que pode ser conferido abaixo (em inglês):
O surgimento do Open Refine se deu com a criação do Freebase Gridworks pela empresa Metaweb Technologies, Inc. Em sua primeira versão, ele era uma ferramenta para limpeza e upload de dados. Com a aquisição da Metaweb pelo Google, em 2010, o programa foi renomeado para Google Refine. Foram realizadas três atualizações com o apoio de engenheiros do Google, mas, desde 2012, a gigante das buscas não apoia mais o projeto – que, a partir daí, passou a ser conhecido como Open Refine.
Os sistemas operacionais em que o software pode ser usado são Windows, Mac e Linux. Ele suporta arquivos SV, CSV, Microsoft Excel (.xls and .xlsx), JSON, XML, RDF, XML e documentos do Google Data e oferece como opção para exportação os formatos TSV, CSV, Microsoft Excel e HTML. Ele funciona no navegador, mas é executado localmente no computador para que os dados não tenham que ser hospedados em outros servidores.
Prós e contras
O Open Refine é muito útil para jornalistas que desejam filtrar dados ou encontrar anomalias ou casos isolados. Como exemplo de uso do programa no jornalismo, pode ser citado o Basômetro, ferramenta desenvolvida pelo Estadão Dados que mede o apoio que o governo federal tem na Câmara dos deputados e no Senado. O projeto utilizou o software quando ele ainda se chamava Google Refine. Também há a ProPublica, redação independente de jornalismo investigativo, sediada em Nova York e sem fins lucrativos, que também se serviu do Google Refine em um de seus projetos, o Dollars for Docs.
O software oferece inúmeras possibilidades de encadeamento nas buscas, auxilia no manuseio de planilhas que possam conter erros humanos e/ou de sistemas e permite refazer as ações em caso de erro. No entanto, apesar de o programa estar disponível em diversos idiomas, português não é um deles. Ele também não funciona offline e tem uma interface pouco intuitiva.