SQL: a ferramenta para o jornalismo de dados

Uma ferramenta importante para a análise de dados no contexto jornalístico é a SQL (Structured Query Language), uma poderosa linguagem de consulta que opera sobre bancos de dados. Neste primeiro post você entenderá o que é a SQL e terá uma demonstração de seus poderes.

Um banco de dados, também chamado de base de dados, possui seus dados organizados na forma de tabelas. Neste post vamos considerar um exemplo real, a tabela de “doações para campanhas eleitorais”. Nessa tabela, cada linha representa uma doação e cada coluna representa algum tipo de informação. Algumas colunas dessa tabela são: nome do doador, documento do doador (CPF ou CNPJ), valor da doação e partido que recebeu a doação.

Agora pense na análise de dados como uma entrevista na qual você é o entrevistador e a entrevistada é a base de dados. Você faz perguntas, e a base lhe dá respostas. Mas para isso é preciso usar uma língua que sua entrevistada entenda. Pois bem, essa língua é a SQL! E aprender SQL não é difícil. É, pelo menos, muito mais fácil que aprender uma língua natural, como o inglês por exemplo.

Vamos agora dar uma mostra do poder da SQL. Não se preocupe ainda em entender como as coisas funcionam. Foque-se em captar o que é possível fazer, assim como ter uma ideia do pouco esforço necessário para se chegar aos resultados.

Nos exemplos a seguir utilizamos a base de dados de doações eleitorais aos partidos no Estado de São Paulo nas eleições de 2014, disponibilizada pelo TSE.

Exemplo 1 – Seleciona a maior doação realizada,

Pergunta:

SELECT max(Valor), NomeDoador, SiglaPartido FROM doacoes;

Resposta:

4750000, JBS S/A, PT

Opa, acho que a essa altura a JBS já dispensa apresentações.

Exemplo 2 – Seleciona a maior doação feita por pessoa física.

Pergunta:

SELECT max(Valor), NomeDoador, SiglaPartido FROM doacoes WHERE TipoReceita like '%físicas%';

Resposta:

1000000, JOSE AURIEMO NETO, PSDB

Procurando o nome desse sujeito no Google, até não impressiona que o primeiro resultado seja uma matéria sobre investigações da polícia federal.

Exemplo 3 – Seleciona a quantidade de doações de pessoas físicas por partido.

Pergunta:

SELECT SiglaPartido, count(*) as quantas_doacoes FROM doacoes WHERE TipoReceita like '%físicas%' GROUP BY SiglaPartido ORDER BY quantas_doacoes DESC;

Resposta:

PSTU, 305
PSOL, 59
PT, 35
PSDB, 18
PMN, 6
PSC, 5
PTC, 5
PTB, 4
PC do B, 3
PCB, 3
PMDB, 2
PRB, 2
PSDC, 2
PT do B, 2
PV, 2
DEM, 1
PEN, 1
PP, 1
PPS, 1
PROS, 1
PRTB, 1
PSL, 1
SD, 1

Não é à toa que o PSTU defende a doação exclusiva por pessoas físicas. Mas esse resultado suscita a questão: será que o PSTU não recebeu nenhum dinheiro de pessoa jurídica?

Pergunta:

SELECT NomeDoador, Valor FROM doacoes WHERE SiglaPartido = 'PSTU' and TipoReceita like '%jurídicas%';

Resposta:

-- Nada aparece.

De acordo com essa análise, não recebeu mesmo!

Nos exemplos apresentados, pudemos ver como interessantes questões jornalísticas podem ser respondidas com comandos SQL relativamente simples. No próximo post vamos contextualizar como o uso da SQL se insere no fluxo de produção de matérias de jornalismo de dados. Dentro de alguns poucos posts já estaremos aprendendo SQL na prática!

Até a próxima!

Um comentário sobre “SQL: a ferramenta para o jornalismo de dados

  1. Olá! Sou estudante de jornalismo, estou no terceiro período, vendo exatamente jornalismo de dados. Já tenho alguma familiaridade com linguagens como Python. Me interessei bastate sobre a área. Obrigado por compartilhar seus conhecimentos.

    Curtir

Deixe um comentário