#49 Cruzando bases de dados eleitorais e superando desafios para investigar candidatos nas eleições de 2024
Uma newsletter sobre jornalismo investigativo oferecida pelo projeto CruzaGrafos, da Abraji
Olá!
Eu sou Lucas Maia*, jornalista de dados do Projeto CruzaGrafos e na edição 49 da Investigadora, vamos mostrar como a decisão do Tribunal Superior Eleitoral (TSE) de retirar das bases de dados abertos o CPF dos candidatos tornou a cobertura eleitoral mais difícil para quem trabalha com jornalismo investigativo. Além disso, vamos mostrar as estratégias utilizadas por quem conseguiu superar, mesmo que parcialmente, as dificuldades causadas por essa limitação.
O Fórum de Direito de Acesso a Informações Públicas também manifestou preocupação com a retirada dos IDs únicos de candidatos nesta eleição.
Conversamos com os jornalistas Luiz Fernando Toledo e Gabriel Ronan para entender como eles conseguiram produzir reportagens de profundidade sobre os candidatos, mesmo sem acesso ao CPF, que é o que permite identificar cada candidato sem que ele seja confundido com pessoas que possuem os mesmos nomes que elas, seus homônimos.
Luiz Fernando Toledo é repórter da BBC News Brasil em Londres e pesquisador da Universidade de Cambridge. Ele escreveu a reportagem Os 2,8 mil candidatos multados por danos ao meio ambiente, que mostra que as cidades onde há o maior número de candidatos autuados estão nos mesmos lugares onde há mais queimadas no Brasil.
Gabriel Ronan é coordenador do Núcleo de Dados do jornal Estado de Minas e professor de jornalismo de dados da PUC Minas. Ronan escreveu a reportagem Ibama multa candidato a prefeito por provocar queimada na Grande BH. Além disso, o jornalista também foi responsável pelo editorial TSE restringe acesso a dados, onde mostra, na prática, os problemas da retirada do CPF da base de dados do tribunal para a garantia da transparência pública.
Novidades
O projeto CruzaGrafos passou por duas importantes atualizações recentes. A primeira envolve a incorporação dos dados dos candidatos das eleições municipais de 2024 em sua base de dados, permitindo o cruzamento dessas informações com outras já disponíveis, como processos judiciais e doações de campanha. Essa atualização visa facilitar investigações jornalísticas, principalmente as relacionadas à vida pregressa dos candidatos e suas conexões políticas.
Além disso, o CruzaGrafos expandiu suas bases de dados com sanções federais, incluindo penalidades administrativas aplicadas a empresas e indivíduos pelo governo. Outra melhoria significativa foi a atualização da interface da ferramenta, tornando-a mais intuitiva e acessível para jornalistas e pesquisadores. A nova interface simplifica o processo de investigação e o uso de filtros para a análise de grandes volumes de dados.
Dica do dia
As jornalistas Judite Cypreste e Camila da Silva produziram reportagens mostrando candidatos com mandados de prisão em aberto e envolvidos nos ataques de 8 de janeiro.
Judite falou desse trabalho em vídeo na série de treinamentos que a Abraji e o Brasil.IO vem promovendo. Saiba como as reportagens foram realizadas e veja como participar dos próximos treinamentos ao vivo.
Se esta é a sua primeira vez por aqui, sinta-se em casa! Esta é uma newsletter sobre jornalismo investigativo oferecida pelo projeto CruzaGrafos, ferramenta que ajuda a investigar políticos e empresas, desenvolvida em parceria pela Abraji e o Brasil.IO.
O CruzaGrafos está disponível para todos os associados da Abraji. Não associados podem solicitar acesso através deste formulário.
Deseja se associar à Abraji? Acesse abraji.org.br/associe-se.
Conheça e apoie o trabalho do Brasil.IO.
Boa leitura!
Os candidatos recordistas em infrações ambientais
Em 26 de setembro, em meio a queimadas intensas em diversos lugares do país, que deixaram parte importante do Brasil coberta de fumaça, o jornalista Luiz Fernando Toledo publicou na BBC News Brasil uma das primeiras reportagens que conseguiram revelar os candidatos com as maiores infrações ambientais do país.
À Investigadora, Toledo explicou os métodos e desafios enfrentados durante a apuração.
"Eu precisei utilizar a base de dados divulgada por um pesquisador que conseguiu consolidar os CPFs a partir da lista dos filiados a partidos políticos", explica.
Toledo desenvolveu uma ferramenta personalizada no Google Colab para facilitar o cruzamento de dados sempre que precisar. "Eu tenho um código de programação no meu Google Colab que já está pronto para isso. Sempre que quero cruzar alguma base de dados com multas do Ibama, eu faço isso bastante", explica. Essa ferramenta foi resultado de seu trabalho no projeto DataFixers, focado em multas ambientais do Ibama.
Apesar disso, ele explica na reportagem que é possível que o número de candidatos autuados seja ainda maior que os 2.800 encontrados pelo jornalista. “Para chegar aos nomes, a BBC News Brasil cruzou dados de filiação partidária e CPF dos candidatos, mas nem todos estavam disponíveis publicamente”, diz a matéria.
O jornalista também destacou a importância de fontes documentais para levar a investigação mais longe. Por ser associado à Abraji e ter acesso ampliado ao JusBrasil, ele pôde encontrar a íntegra dos infração de alguns candidatos citados. "Eu vi que existiam alguns processos judiciais abertos contra algumas dessas pessoas e aí eu encontrei a cópia da multa dentro do processo judicial", conta.
Dados abertos?
Ele critica a decisão do TSE de remover informações de CPF dos dados abertos dos candidatos. "É um completo absurdo eles retirarem essa informação do Tribunal Superior Eleitoral, porque é uma informação de utilidade pública", argumenta.
Ele aponta que essa medida prejudica não apenas jornalistas, mas também pesquisadores e até mesmo as próprias campanhas e candidatos.
O jornalista também levanta uma questão ética sobre o acesso à informação: "Fica até um jogo injusto a gente que quer jogar com dados públicos, quer trabalhar com informação que é pública, enquanto várias empresas conseguem e vendem esse tipo de informação".
Verificação manual em nome do interesse público
O jornalista Gabriel Ronan, do Estado de Minas, compartilhou os bastidores de sua investigação sobre candidatos com multas ambientais em Minas Gerais. A reportagem, que enfrentou obstáculos devido à falta de transparência do Tribunal Superior Eleitoral (TSE), revelou 18 candidatos com diversas infrações ambientais no estado de Minas Gerais.
"A reportagem nasceu da minha experiência em fazer outras matérias do tipo em períodos eleitorais anteriores", explica Ronan. Ele destaca que trabalhou com a base de dados abertos do Ibama e do TSE em 2020 e 2022, mas enfrentou dificuldades este ano devido à redução na transparência do TSE.
Ele conta que o processo de investigação foi dividido em três etapas principais:
1. Cruzamento entre as bases do Ibama e dos candidatos pelo nome completo.
2. Filtragem de homônimos através de pesquisa manual para verificar candidaturas anteriores.
3. Consulta às bases de dados anteriores do TSE para confirmar CPFs e identidades dos candidatos.
"Todo esse trabalho, que levou dois dias de expediente extra, resultou em 18 candidatos com multas ambientais em Minas. Alguns autuados mais de uma vez", revela o jornalista.
Ronan decidiu focar a reportagem em um candidato à Prefeitura de Lagoa Santa, cuja multa foi aplicada durante o período eleitoral deste ano por atividades em uma área de proteção ambiental, coincidindo com a crise das queimadas no país.
O jornalista também critica a falta de transparência do TSE: "A medida, na prática, prejudica o eleitor em primeiro lugar. Em tempos nos quais o uso indevido da inteligência artificial e das redes sociais tanto prejudica o processo democrático, a partir do compartilhamento em massa de notícias fraudulentas, o interesse público fica comprometido quando a imprensa deixa de ter acesso a informações que deveriam ser abertas”.
Ronan também aponta uma inconsistência na aplicação das regras de privacidade: "Quando se consulta os doadores de campanha no Divulgacand, chama atenção que o CPF dessas pessoas físicas permanece disponível para consulta do cidadão. Essas pessoas não deveriam, em tese, ter os mesmos direitos dos candidatos, já que a decisão do tribunal se baseia na LGPD?"
Dica do dia
As jornalistas Judite Cypreste e Camila da Silva realizaram duas investigações publicadas no G1 sobre candidatos nas eleições municipais de 2024 com mandados de prisão em aberto e envolvidos nos ataques de 8 de janeiro. A metodologia utilizada por elas foi baseada em algumas etapas principais, que estão detalhadas a seguir:
Coleta de dados:
As jornalistas usaram o Banco Nacional de Mandados de Prisão (BNMP), que contém mais de 300 mil mandados em aberto. O desafio maior foi o limite de downloads de registros, como o imposto pelo estado de São Paulo. No BNMP é possível baixar os mandados de prisão em Emitir documento, e nos mandados constam CPFs
A base de dados de candidaturas do Tribunal Superior Eleitoral (TSE) também foi utilizada, com mais de 461 mil candidaturas registradas.
Cruzamento de dados:
Para relacionar os candidatos com mandados de prisão em aberto, as jornalistas utilizaram a linguagem de programação Python para automatizar o processo de cruzamento entre os dados da BNMP e as candidaturas do TSE.
Checagem manual:
Um obstáculo surgiu porque o TSE retirou dados de CPF das candidaturas em 2024, o que complicou a verificação dos dados. Assim, as jornalistas tiveram que buscar alternativas e realizar checagens manuais, utilizando o sistema DivulgaCand
Por exemplo, no DivulgaCand cada candidato pode ser visto, como neste link, e aí deve se clicar em Certidão e depois baixar algumas das certidões. O CPF está borrado, porém os documentos baixados devem ter um Código de Autenticação ou de Validação. Este código pode ser procurado depois em Tribunais de Justiça, nos links de Certidões Judiciais em Autenticidade da Certidão.
Nos documentos PDF de Certidão também existem casos de documentos com QRCode, aí o processo é mais simples, escaneando
Investigação local:
Com prazos curtos e muitos candidatos a serem investigados, elas contaram com a colaboração de afiliadas do g1 em diversos estados, que ajudaram a localizar e entrevistar candidatos, além de consultar os partidos.
Impacto das reportagens:
A investigação gerou prisões de candidatos procurados pela Justiça e levantou discussões sobre brechas no sistema eleitoral. A publicação da metodologia, além de permitir a replicação, trouxe transparência ao processo investigativo.
Este trabalho ilustra como o uso de bases públicas e a automação, combinados com checagens manuais e colaborações locais, são ferramentas poderosas para o jornalismo investigativo, especialmente em casos de eleições e processos judiciais.
Judite falou desse trabalho em vídeo na série de treinamentos que a Abraji e o Brasil.IO vem promovendo nessas eleições. Veja aqui o link do vídeo no YouTube. O último treinamento deste ano será no dia 13 de novembro, Live no YouTube da Abraji, das 17h30 às 19h.
A iniciativa é resultado de uma parceria entre a Abraji e o Brasil.IO, contando com o apoio da Earth Journalism Network, e visa aprimorar o uso da ferramenta CruzaGrafos, da Abraji, em temas de biodiversidade. Entenda mais sobre o que está sendo criado neste link.
Nos ajuda muito saber sua opinião
O que você achou desta edição da Investigadora?
>> Encaminhe a newsletter para seus amigos e compartilhe o conteúdo nas suas redes sociais.
Fortaleça o trabalho de quem faz a Investigadora. Contribua com qualquer quantia. O pagamento pode ser feito via Pix, por meio da chave aleatória 61699d2c-28f7-4d90-b618-333a04f13e0a. É só copiar e colá-la. Também dá para usar o QR Code a seguir:
Autor
*Lucas Maia é jornalista e programador com experiência em Python, data storytelling e dataviz. Também é diretor de tecnologia na Agência Tatu, um veículo focado em jornalismo de dados localizado no estado de Alagoas. Acredita na atuação jornalística como forma de fortalecer a democracia e no poder de tornar dados públicos mais acessíveis a todos.
Ficou com alguma dúvida? Quer saber sobre os bastidores de uma determinada reportagem ou aprender mais sobre alguma ferramenta? Vem com a gente: cruzagrafos@abraji.org.br.
Para ler as edições passadas da Investigadora, clique aqui.
Saiba mais sobre o CruzaGrafos
Consultamos milhões de dados da Receita Federal do Brasil, do Tribunal Superior Eleitoral e de autos de infração lavrados pelo Ibama.
Temos, por exemplo, candidaturas em eleições, informações sobre empresas e cruzamentos com o Portal da Transparência. Você pode ler mais sobre nossa última atualização do projeto aqui.
O CruzaGrafos, indicado como finalista do Sigma Awards 2021, conta com um programa de treinamentos voltado para redações, grupos de freelancers, universidades e organizações do terceiro setor ligadas à educação e à transparência de dados.
Você pode ler mais sobre o projeto aqui. Preparamos um guia escrito, um vídeo tutorial com legendas em português, inglês e espanhol, além de uma web stories.
Vale lembrar que as informações disponibilizadas pelo CruzaGrafos são públicas, mas o trabalho de curadoria, seleção, limpeza, cruzamento, estudo de relações de poder, diferentes tipos de download (manual, pedidos de LAI, webscraping, OSINT), descrição e pesquisa de exemplos é feito pela equipe da Abraji e do Brasil.IO. Dar crédito às organizações é importante para a manutenção desse trabalho e para mostrar a outros colegas que a ferramenta é útil.
Usou o CruzaGrafos na sua reportagem?
Adoraríamos conhecer o seu trabalho. Cita o CruzaGrafos na matéria e responde a news com o link!
Confira as informações mais recentes do projeto aqui.