#42 | Reconhecimento facial no jornalismo e governador vendendo carne para o próprio estado
Uma newsletter sobre jornalismo investigativo baseada em dados do projeto CruzaGrafos e em investigações brasileiras
Olá!
Eu sou Lucas Maia* e é com muita alegria que me uno ao timaço de jornalistas da Abraji e assumo o desafio de escrever a newsletter Investigadora. Hoje falaremos sobre uma reportagem do Estadão que usou inteligência artificial para identificar por quantas horas cada participante do último BBB apareceu no programa e as implicações deste tipo de tecnologia para o jornalismo.
Também iremos mostrar uma excelente série investigativa do Infoamazônia, que, entre diversas técnicas de investigação, utilizou o Cruzagrafos para descobrir negócios suspeitos entre o Governo de Roraima e empresas ligadas ao governador Antonio Denarium (Progressistas).
Na dica do dia, você fica com a programação imperdível do 18º Congresso da Abraji e do Domingo de Dados.
Se esta é a sua primeira vez por aqui, sinta-se em casa. Esta é uma newsletter sobre jornalismo investigativo baseada em dados do projeto CruzaGrafos – parceria da Abraji e do Brasil.IO, com o apoio da Google News Initiative.
A ferramenta está disponível para todos os associados da Abraji. Para não associados, basta clicar aqui. Quem quiser fazer parte da Abraji pode ver os passos para se associar neste link. E aqui dá para apoiar o Brasil.IO.
Boa leitura!
Reconhecimento facial no BB
Durante o último Big Brother Brasil, muitos fãs foram às redes sociais para questionar se a edição do programa privilegiava a aparição de alguns participantes em detrimento de outros durante os VTs. Comentários como "Fulano tem muito tempo de tela" e "a Globo dá mais evidência na edição para Beltrano" eram comuns.
Os jornalistas Lucas Thaynan, Cindy Damasceno e Bruno Ponceano viram os questionamentos e decidiram tentar tirar isso à prova, o que rendeu a matéria BBB 23: Inteligência artificial revela quem mais apareceu nos VTs do programa, publicada em 19 de abril no Estadão.
O processo foi dividido em etapas, começando pela identificação de rostos nas imagens. “Começamos com alguns vídeos curtos dos programas, selecionando dois ou três trechos de cerca de um minuto cada, que representavam diferentes situações do jogo. Após testar várias bibliotecas Python, descobrimos que a OpenCV apresentava o melhor desempenho, mas foi necessário ajustar diversos parâmetros para aprimorar a detecção”, conta Lucas Thaynan, que até esse momento ainda avaliava se seria possível responder a pergunta central da pauta.
#ParaTodosVerem: print de tela mostra trecho do script escrito para a reportagem.
Com a etapa de captura dos rostos superada, o próximo passo foi realizar o reconhecimento de cada uma das faces, o problema é que os modelos tradicionais de aprendizado de máquina exigem um grande volume de dados de treinamento. Thaynan explicou que seria necessário ter centenas ou milhares de fotos de cada participante apenas para treinar o modelo, e isso não seria viável.
Diante da limitação, a equipe decidiu explorar soluções baseadas em deep learning, e o modelo de Rede Neural Convolucional (CNN) se mostrou o mais eficaz.
Eles utilizaram a biblioteca Face Recognition para aplicar o modelo CNN. Esse modelo é capaz de identificar 128 pontos característicos no rosto de cada pessoa, com uso de rede neural, permitindo calcular a semelhança facial entre os indivíduos. Surpreendentemente, com apenas uma foto de treinamento, o script já conseguia identificar corretamente a maior parte dos rostos.
#ParaTodosVerem: print de tela mostra pasta com 11 fotos do participante Alface.
A jornalista Cindy Damasceno conta que, depois do script estar pronto, foi preciso treinar a inteligência artificial, selecionando imagens do rosto dos participantes em diversas situações de iluminação e posição do rosto, sem falar nos diferentes acessórios e fantasias que os participantes mudavam constantemente.
Cindy explica que o script precisava processar os vídeos em tempo real, por isso foi preciso deixar um computador da redação ligado durante duas semanas inteiras para processar 89 horas de vídeo. Apesar da redação do jornal contar com bons computadores, não foi necessário nenhum tipo de equipamento especial. Além dessa parte computacional, a jornalista conta que foi preciso um olhar humano para determinar qual a margem de erro da ferramenta.
#ParaTodosVerem: quadro retirado VT do Big Brother Brasil. Na imagem aparecem os participantes MC Guime e Antonio. Ao redor de seus rostos um retângulo indica os nomes.
“A gente não pode jogar tudo nas costas da Inteligência Artificial. Ainda existe o cuidado jornalístico de refazer aquele procedimento para saber se o que está sendo apresentado para você de uma forma automatizada faz sentido para sua matéria, eu acho que esse cuidado em fazer uma confirmação meio que analógica previne enviesamentos e faz com que você tenha muito mais confiança no seu material final”, diz Cindy.
Thaynan concorda com Cindy. Ele conta que a tecnologia foi usada primeiro em um assunto leve, justamente para testar o seu potencial e modos de aplicação.
“É importante reconhecer que, ao utilizar a tecnologia em outros contextos, é necessário compreender e avaliar a margem de erro que o modelo pode apresentar. Isso é fundamental para garantir resultados confiáveis e precisos em diferentes cenários”, diz o jornalista, que já pensa em futuras reportagens que utilizem um método semelhante.
“Já temos no nosso radar outras possíveis aplicações da tecnologia, como em eleições, eventos esportivos e em casos de pessoas desaparecidas e foragidas. Mas cada projeto desses tem um novo nível de complexidade e precisamos tentar superá-lo primeiro”, conclui.
O governador dono de frigorífico que vende carne para o próprio governo
Até a última newsletter, a jornalista Flávia Faria compôs o time de jornalistas da Abraji e fez um trabalho excelente escrevendo a Investigadora. Foi ela quem entrevistou o jornalista Fábio Bispo para entender os detalhes da investigação que levou à reportagem “Frigorífico do governador Antonio Denarium abasteceu contratos públicos em Roraima”, publicada em 4 de abril no site InfoAmazonia.
Fábio Bispo explicou que, ao longo de quatro meses, foram analisados muitos documentos e bases de dados relacionados ao governo de Roraima e os negócios pessoais do governador Antonio Denarium. “A pesquisa incluiu pesquisas em uma série de documentos públicos, como ações judiciais, diários oficiais, portais de transparência, pedidos de Lei de Acesso à Informação, notas fiscais, ofícios, entre outros”, conta.
Ele diz que a pauta surgiu de um levantamento de dados prévio no projeto Lab de Geojornalismo da InfoAmazonia, no início de janeiro de 2023, e que teve como foco apurar a evolução das áreas de pastagens em terras indígenas na Amazônia, buscando relação entre o pasto e crimes ambientais.
O jornalista explica que as análises realizadas apontaram o fazendeiro Ermilo Paludo como um dos maiores infratores da Terra Indígena Yanomami, criando gado dentro do território indígena por mais de duas décadas e sendo multado em R$ 3,7 milhões pelo Ibama.
Ao buscar o nome de Paludo no Cruzagrafos, a reportagem descobriu sua sociedade com o governador Antônio Denarium no Frigo 10, maior frigorífico de Roraima, fruto do investimento de 10 grandes empresários do agronegócio.
“Essa informação foi chave para entendermos melhor como o governador de Roraima estava ligado com empresários acusados de invasões em terras indígenas e com empresas que lucraram em contratos públicos da sua gestão”, diz Bispo.
#ParaTodosVerem: em vermelho, as fazendas de Paludo embargadas dentro da Terra Indígena Yanomami
O jornalista utilizou as conexões da Frigo 10 encontradas no Cruzagrafos para buscar contratos, notas fiscais e processos de empresas e pessoas ligadas ao governador Denarium.
Com o resultado das investigações, Fábio Bispo conseguiu publicar uma série de 4 reportagens no InfoAmazonia: na primeira delas, mostrou a sociedade de Denarium com Paludo, que é um dos maiores desmatadores da Terra Indígena Yanomami; na sequência, trouxe à luz a contratação de José Lopes Primo para levar sementes transgênicas ilegais para terras indígenas, em um processo completamente financiado pelo governo do estado; também entrevistou a antropóloga Emília Carneiro Cunha, na matéria “A beleza do roçado indígena está na diversidade” e, finalmente, chegou às relações diretas entre uma empresa do governador fazendo negócios com o próprio governo.
#ParaTodosVerem: tela do Cruzagrafos mostra a relação entre o governador Denarium com os sócios Ermilo Paludo e o empresário e ex-deputado José Lopes Primo e com as empresas Frigo 10 e Garrote.
Bispo nos presenteou ainda com algumas dicas para quem deseja investigar contratos públicos. “Não existe uma receita de bolo para investigar contratos públicos, muito também porque não temos um padrão nas bases que armazenam essas informações”, diz.
Ele sugere desenvolver métodos básicos de apuração, como a verificação de nomes em bases como Receita Federal, diários oficiais, tribunais de Justiça e de Contas, portais de transparência, entre outros.
Fábio Bispo também menciona o uso do CruzaGrafos e do Aleph como termômetros para iniciar as pesquisas sobre os indivíduos e empresas. Ele ressalta a importância de também buscar informações nas juntas comerciais, que guardam atas registradas com o histórico societário das empresas, e destaca a necessidade de manter a organização quando a apuração envolve grandes volumes de dados e arquivos.
Nesta série de reportagens, Bispo utilizou o Milanote para organizar visualmente a apuração, estabelecendo conexões com anotações e links externos relacionados aos personagens.
Faltam menos de 30 dias para o Congresso da Abraji
Em 29 de junho terá início o 18º Congresso Internacional de Jornalismo Investigativo. Entre quinta-feira e domingo, haverá palestras, entrevistas, oficinas e cursos — que começam às 9h30, cada sessão tendo a partir de 1h30 de duração.
Cada faixa de horário terá atividades distribuídas em salas de aula ou auditórios. Elas foram enquadradas dentro de 15 trilhas.
São elas: Jornalismo investigativo e/ou jornalismo colaborativo; Cobertura especializada; Diversidade, equidade e inclusão; Produtos jornalísticos em áudio e vídeo; Ameaças à democracia; Proteção e segurança de jornalistas; Acesso à informação; Jornalismo de dados e técnicas de investigação; Desinformação e checagem de fatos; Provocações; Jornalismo independente e/ou jornalismo local; Modelo de negócios e empreendedorismo no jornalismo; Ciência e meio ambiente; Estudos sobre jornalismo; e Cerimônias e homenagens.
O último dia será completamente dedicado ao Domingo de Dados, com oficinas sobre jornalismo de dados, bastidores de investigações, novas ferramentas e técnicas de investigação. O 18º Congresso Internacional de Jornalismo Investigativo será realizado de 29.jun.2023 a 2.jul.2023 no campus Álvaro Alvim da ESPM, em São Paulo.
Confira a programação e se inscreva:
Confira detalhes da programação internacional
Confira detalhes da programação nacional
Veja como se inscrever
Fortaleça o trabalho de quem faz a Investigadora. Contribua com qualquer quantia. O pagamento pode ser feito via Pix, por meio da chave aleatória 61699d2c-28f7-4d90-b618-333a04f13e0a. É só copiar e colá-la. Também dá para usar o QR Code a seguir:
*Flávia Faria é jornalista especializada na cobertura guiada por dados. Foi repórter da Folha e editora do DeltaFolha, núcleo de jornalismo de dados do jornal. Foi finalista do Sigma Awards 2022
Ficou com alguma dúvida? Quer saber sobre os bastidores de uma determinada reportagem ou aprender mais sobre alguma ferramenta? Vem com a gente: cruzagrafos@abraji.org.br.
Para ler as edições passadas da Investigadora, clique aqui.
Saiba mais sobre o CruzaGrafos
Consultamos milhões de dados da Receita Federal do Brasil, do Tribunal Superior Eleitoral e de autos de infração lavrados pelo Ibama.
Temos, por exemplo, candidaturas em eleições, informações sobre empresas e cruzamentos com o Portal da Transparência. Você pode ler mais sobre nossa última atualização do projeto aqui.
O CruzaGrafos, indicado como finalista do Sigma Awards 2021, conta com um programa de treinamentos voltado para redações, grupos de freelancers, universidades e organizações do terceiro setor ligadas à educação e à transparência de dados.
Você pode ler mais sobre o projeto aqui. Preparamos um guia escrito, um vídeo tutorial com legendas em português, inglês e espanhol, além de uma web stories.
Vale lembrar que as informações disponibilizadas pelo CruzaGrafos são públicas, mas o trabalho de curadoria, seleção, limpeza, cruzamento, estudo de relações de poder, diferentes tipos de download (manual, pedidos de LAI, webscraping, OSINT), descrição e pesquisa de exemplos é feito pela equipe da Abraji e do Brasil.IO. Dar crédito às organizações é importante para a manutenção desse trabalho e para mostrar a outros colegas que a ferramenta é útil.
Se você usar a ferramenta como referência para sua reportagem, não se esqueça de citar!
Confira as informações mais recentes do projeto aqui.
Contribua avaliando o conteúdo da Investigadora:
>> Divulgue a Investigadora: encaminhe a newsletter para seus amigos e compartilhe os conteúdos nas suas redes sociais.
>> Comece a escrever sua newsletter hoje. Use o botão abaixo para criar seu próprio Substack e conecte sua publicação com a Investigadora.