O que é e como funciona o agregador de pesquisas ABC Dados 2026
Uma pesquisa diz 37%. Outra diz 46%. Qual acreditar? A resposta é: nas duas — e em todas as outras ao mesmo tempo. É para isso que serve um agregador.
Nos últimos meses, os principais institutos de pesquisa do país, Quaest, Datafolha, Atlas Intel, Paraná Pesquisas, CNT/MDA, Real Time Big Data, Ipsos-Ipec e Meio/Ideia, divulgaram dezenas de levantamentos sobre as intenções de voto para a eleição presidencial de 2026. Os números variam. Às vezes, bastante.
Essa variação é natural e esperada: cada pesquisa entrevista amostras diferentes, em datas diferentes, com métodos diferentes. Tratar um único levantamento como “a verdade” é um erro estatístico e também jornalístico. Este agregador existe para corrigir esse problema.
Confira no gráfico interativo o desempenho dos principais pré-candidatos.
As pesquisas consideradas no Agregador
O Agregador de Pesquisas ABC Dados tem como base as pesquisas registradas no TSE divulgadas a partir de janeiro de 2026 realizadas pelos principais institutos de pesquisa do país (Atlas, Datafolha, Idea Big Data, Ipsos-Ipec, MDA, Paraná Pesquisas, Quaest e Real Time Big Data).
São considerados os resultados de intenção de voto estimulado para o primeiro turno nos cenários que incluem os principais pré-candidatos anunciados até o momento.
O que é um agregador de pesquisas
Um agregador combina múltiplos levantamentos em uma estimativa única, mais estável e menos sujeita aos ruídos inevitáveis de qualquer pesquisa individual. A lógica é a mesma que está por trás de qualquer média: ao juntar amostras independentes, os erros aleatórios de cada uma tendem a se cancelar.
O método foi popularizado nos Estados Unidos pelo estatístico Nate Silver, cujo modelo para o FiveThirtyEight acertou 49 dos 50 estados americanos nas eleições presidenciais de 2008. No Brasil, o trabalho dos pesquisadores Mathieu Turgeon e Lucio Rennó, publicado em 2013 na revista Opinião Pública, demonstrou empiricamente que médias de pesquisas superam levantamentos isolados na previsão de resultados eleitorais brasileiros.
A diferença entre um agregador e uma simples média de pesquisas está nos critérios de ponderação: não faz sentido tratar uma pesquisa com 1.500 entrevistados da mesma forma que uma com 5.000, nem dar o mesmo peso a um levantamento de seis meses atrás e a um divulgado esta semana.
A fórmula
O peso atribuído a cada pesquisa neste agregador é calculado por:
Peso = √(n) × 2^(−d/30)
Onde n é o tamanho da amostra e d é o número de dias desde o início da coleta até a data de referência.
São dois componentes — um para precisão, outro para recência.
Por que a raiz quadrada de n, e não n diretamente?
Porque a margem de erro de uma pesquisa não cai de forma linear com o tamanho da amostra — ela cai com a sua raiz quadrada. Uma pesquisa com 5.000 entrevistados é 1,58 vezes mais precisa do que uma com 2.000 — não 2,5 vezes mais precisa, como seria se usássemos a amostra diretamente. Usar √(n) reflete essa realidade e impede que pesquisas com amostras muito grandes — como as da Atlas Intel, que frequentemente superam 5.000 entrevistados — dominem desproporcionalmente o resultado do agregador.
Por que o decaimento exponencial?
Porque o eleitorado muda ao longo do tempo. Uma pesquisa de agosto de 2025 captura um estado da opinião pública que pode ser radicalmente diferente do de abril de 2026. Com a fórmula adotada, uma pesquisa perde metade do seu peso a cada 30 dias — uma “meia-vida” calibrada ao ritmo mensal em que os principais institutos brasileiros divulgam seus levantamentos. Pesquisas com três meses de idade ainda contribuem para o agregador, mas com apenas 12,5% do peso que teriam se fossem de hoje.
O que entra e o que fica de fora
Para ser incluída no agregador, uma pesquisa precisa testar simultaneamente Lula (PT), Flávio Bolsonaro (PL) e Ronaldo Caiado (PSD) no mesmo cenário estimulado de primeiro turno, estar registrada no TSE com metodologia completa conhecida e ter abrangência nacional.
Quando um instituto divulga múltiplos cenários, o que é comum na Quaest, que chegou a publicar dez numa única rodada , o cenário principal (o mais amplo, com maior número de candidatos testados) é o selecionado. Incluir vários cenários da mesma rodada seria contar o mesmo instituto mais de uma vez.
Duas exclusões merecem menção explícita:
- Atlas Intel, 18 de dezembro de 2025: com 18.154 entrevistados online e Lula em 47,3%, o levantamento estava mais de 8 pontos acima de todos os outros institutos no mesmo período. Foi tratado como ponto aberrante e removido. Manter uma pesquisa assim equivaleria a deixar um dado incorreto contaminar toda a análise.
- Quaest, novembro de 2025: a rodada testou dez cenários diferentes, mas nenhum deles colocou Flávio Bolsonaro e Ronaldo Caiado no mesmo cenário. Está registrada na base de dados com ressalva, mas excluída da tabela de evolução mensal.
O que o agregador mostra e o que ele não mostra
O agregador é uma ferramenta de acompanhamento de tendências, não uma previsão eleitoral.
A série histórica que ele produz, com a evolução mensal das médias ponderadas desde agosto de 2025, revela movimentos que nenhuma pesquisa isolada seria capaz de capturar com a mesma nitidez. O crescimento contínuo de Flávio Bolsonaro, de 14–15% em agosto de 2025 para 33–37% em abril de 2026, é legível na série agregada; em pesquisas individuais, cada ponto poderia ser confundido com oscilação amostral normal.
O que o agregador não faz: corrigir vieses sistemáticos compartilhados por todos os institutos. Se todas as pesquisas subestimam consistentemente um candidato, como ocorreu com Bolsonaro em 2022 nos levantamentos telefônicos, o agregador vai subestimá-lo também. Agregadores mais sofisticados, como o do FiveThirtyEight, aplicam correções baseadas no histórico de acertos de cada instituto. Este agregador não faz isso, tratando todos os institutos como igualmente confiáveis.
Outra limitação importante: pesquisas online como as da Atlas Intel, com amostras de 5.000 a 18.000 entrevistados, tendem a registrar valores muito mais baixos para branco/nulo e indecisos do que pesquisas presenciais. Quando a Atlas Intel é a pesquisa dominante de um mês, esse padrão contamina a estimativa agregada dessas categorias.
Por que isso importa
Pesquisas eleitorais são frequentemente cobertas como se fossem resultados de corridas: “Lula tem X%, Flávio tem Y%”. Quando duas pesquisas mostram números diferentes, a cobertura tende a tratar a discrepância como contradição ou erro, quando na verdade, ambos os números podem ser corretos dentro de suas margens de erro, refletindo momentos ligeiramente diferentes do mesmo processo.
O agregador oferece uma alternativa: em vez de escolher qual pesquisa acreditar, ele pondera todas as informações disponíveis de forma transparente e auditável. Qualquer leitor pode abrir a planilha, ver o peso atribuído a cada pesquisa e reproduzir o cálculo.
Esse é o princípio que orienta a ferramenta: não substituir o julgamento editorial, mas dar a ele uma base estatística mais sólida.
Nota: Este agregador é uma ferramenta de acompanhamento jornalístico, não um modelo preditivo. Pesquisas eleitorais medem intenção de voto declarada no momento da coleta, não o resultado futuro das urnas. O agregador reduz a incerteza associada a pesquisas individuais, mas não elimina os erros sistemáticos compartilhados por todos os levantamentos, como sub-representação de eleitores sem telefone fixo ou acesso à internet, efeito Bradley-Hollman em candidatos polêmicos ou mudanças de última hora no eleitorado.
A metodologia completa com todas as referências bibliográficas está disponível na nota técnica que acompanha este agregador:
Nota Metodológica
Média ponderada por amostra e recência
1. Introdução
Agregadores de pesquisas eleitorais são ferramentas que sintetizam múltiplos levantamentos de intenção de voto em uma estimativa única, mais precisa e menos volátil do que qualquer pesquisa individual. A lógica subjacente é simples: ao combinar várias amostras independentes, erros aleatórios de cada pesquisa tendem a se cancelar, aproximando a estimativa resultante do verdadeiro estado da opinião pública.
Este documento descreve o método adotado neste agregador para as eleições presidenciais brasileiras de 2026, explica as escolhas de design e aponta suas limitações. O agregador está implementado em planilha Excel com fórmulas auditáveis e parâmetros ajustáveis pelo usuário.
| “Um único levantamento é uma fotografia. Um agregador é um filme — capta a trajetória, não apenas o instante.” A redução da variância amostral obtida pela combinação de pesquisas é o fundamento estatístico de qualquer agregador de qualidade. |
2. Fundamentos teóricos
2.1 Por que agregar pesquisas?
A teoria estatística elementar estabelece que a variância da média de k amostras independentes de tamanho n é σ²/(kn), onde σ² é a variância da população. Ao combinar k pesquisas cada uma com n entrevistados, a margem de erro efetiva comporta-se como se a pesquisa tivesse kn entrevistados — ou seja, ela cai proporcionalmente à raiz quadrada do número de pesquisas combinadas.
Na prática, pesquisas eleitorais também carregam erros sistemáticos (viés de metodologia, seleção amostral, efeitos de enquadramento) que não se cancelam pela simples soma. Por isso, os melhores agregadores combinam redução de variância com estratégias para lidar com o viés, como a ponderação por qualidade metodológica ou a exclusão de pontos aberrantes.
2.2 Precedentes internacionais
O modelo pioneiro de agregação sistemática é o de Nate Silver para o FiveThirtyEight (Silver, 2008; 2012), que atribuía pesos a pesquisas com base em tamanho amostral, histórico de acertos do instituto e recência. Versões adaptadas foram propostas por Simon Jackman (2005, 2009) para eleições australianas, utilizando modelos de espaço de estados em que a intenção de voto latente evolui como passeio aleatório e cada pesquisa é observada com ruído. Andrew Gelman e colaboradores (2016) desenvolveram modelos hierárquicos bayesianos que incorporam correlações entre eleições e permitem ajustes por viés demográfico.
No Brasil, o trabalho pioneiro de Turgeon e Rennó (2013) sobre previsões eleitorais mostrou a superioridade preditiva de médias de pesquisas sobre levantamentos isolados. O Poder360 mantém o agregador de pesquisas mais antigo do país, operando desde 2000 com metodologia de média simples — transparente e replicável, embora sem ponderação por recência ou qualidade amostral.
2.3 O princípio da recência
Em corridas eleitorais de longo ciclo, como a presidencial brasileira, cujas pesquisas são realizadas desde pelo menos 18 meses antes do primeiro turno, a intenção de voto evolui ao longo do tempo. Atribuir o mesmo peso a uma pesquisa de agosto de 2025 e a uma de abril de 2026 equivale a supor que o eleitorado não muda: uma hipótese empiricamente insustentável.
A solução adotada na literatura é o decaimento temporal: pesquisas mais antigas recebem peso progressivamente menor. Silver (2012) usa uma função de decaimento que dobra o peso de pesquisas a cada ciclo de atualização. Jackman (2009) modela a evolução da intenção de voto diretamente como processo estocástico. Este agregador adota um decaimento exponencial com meia-vida de 30 dias, parâmetro ajustável pelo usuário.
3. Método adotado
3.1 Fórmula geral
O peso atribuído a cada pesquisa i é:
| Componente | Descrição |
| Peso = √(n) × 2^(−d/30) | Fórmula geral do peso atribuído a cada pesquisa |
| √(n) | Raiz quadrada do tamanho amostral. Pondera pela precisão relativa, sem amplificar desproporcionalmente amostras grandes. |
| 2^(−d/30) | Fator de decaimento exponencial. d = dias entre a data de início da coleta e a data de referência. Meia-vida padrão: 30 dias. |
| MP = Σ(w·x) / Σ(w) | Média ponderada resultante. w = peso; x = resultado da pesquisa para cada candidato. Pesquisas com ‘—’ (candidato não testado) são excluídas do denominador para aquele candidato. |
A média ponderada para cada candidato c é então calculada como:
| MPc = Σᵢ [ wᵢ × xᵢ,c ] / Σᵢ [ wᵢ · (xᵢ,c ≠ —) ] onde (·) é a função indicadora que exclui pesquisas em que o candidato não foi testado. |
3.2 Ponderação pela raiz quadrada da amostra
O tamanho amostral entra na fórmula por meio de sua raiz quadrada, não de forma linear. A justificativa estatística é direta: a margem de erro de uma pesquisa é proporcional a 1/√n. Portanto, a precisão de uma pesquisa é proporcional a √n — e é por precisão, não por volume de entrevistas, que desejamos ponderar.
A tabela abaixo ilustra a diferença entre usar n e √n como ponderador:
| Amostra (n) | Margem de erro típica | √(n) | Razão de pesos vs. n=2.000 |
| 1.500 | ±2,5 p.p. | 38,7 | 0,87× |
| 2.000 | ±2,2 p.p. | 44,7 | 1,00× (base) |
| 5.000 | ±1,4 p.p. | 70,7 | 1,58× (não 2,50×) |
| 12.000 | ±0,9 p.p. | 109,5 | 2,45× (não 6,00×) |
Usar √n em vez de n comprime adequadamente o intervalo de pesos: uma pesquisa com 12.000 entrevistados recebe um peso 2,45 vezes maior do que uma com 2.000 — não 6 vezes maior, como ocorreria com ponderação linear. Essa escolha protege o agregador contra a dominância excessiva de levantamentos com amostras muito grandes, como os da Atlas Intel (n ≈ 5.000–18.000), que poderiam distorcer a média ponderada se seu tamanho fosse usado diretamente.
3.3 Decaimento temporal exponencial
O componente 2^(−d/30) implementa um decaimento exponencial com meia-vida de 30 dias: a cada 30 dias adicionais desde a coleta, o peso da pesquisa cai pela metade. A escolha da base 2 e da meia-vida de 30 dias segue a lógica de que o ciclo informativo relevante em uma corrida presidencial brasileira é mensal, institutos como Quaest, Datafolha e Paraná Pesquisas divulgam pelo menos uma rodada por mês.
| Dias desde a coleta | Peso relativo | Interpretação |
| 0 | 100% | Pesquisa do dia — peso integral |
| 30 dias | 50% | Meia-vida — peso reduzido à metade |
| 60 dias | 25% | Dois meses — peso já reduzido a um quarto |
| 90 dias | 12,5% | Três meses — contribuição marginal |
| 180 dias | 1,6% | Seis meses — peso desprezível |
O parâmetro de meia-vida é ajustável pelo usuário na célula D6 da aba Agregador. Meia-vidas menores (ex.: 15 dias) tornam o agregador mais responsivo a movimentos recentes, mas também mais volátil. Meia-vidas maiores (ex.: 60 dias) suavizam a série, mas podem retardar a captação de tendências reais.
3.4 Critério de inclusão
Para ser incluída no agregador, uma pesquisa deve:
- Testar simultaneamente Lula (PT), Flávio Bolsonaro (PL) e Ronaldo Caiado (PSD/União Brasil) no mesmo cenário estimulado de primeiro turno;
- Estar registrada no Tribunal Superior Eleitoral (TSE) com metodologia completa conhecida;
- Ter abrangência nacional.
Quando um instituto divulga múltiplos cenários de primeiro turno, o cenário principal (mais amplo, com maior número de candidatos testados) é selecionado. Inserir múltiplos cenários da mesma rodada duplicaria artificialmente o peso daquele instituto.
3.5 Tratamento de exclusões
Duas categorias de exclusão são aplicadas:
- Exclusão por cenário incompleto: a Quaest de novembro de 2025 foi mantida na base de dados com ressalva, mas excluída da tabela de evolução mensal, pois nenhum de seus dez cenários testou Flávio Bolsonaro e Ronaldo Caiado simultaneamente.
- Exclusão por ponto aberrante (outlier): a Atlas Intel de 18 de dezembro de 2025 (n=18.154, metodologia online) foi removida do agregador por apresentar Lula com 47,3%, desvio de mais de 8 pontos percentuais em relação às demais pesquisas do período (38–41%). A discrepância é atribuída à metodologia de recrutamento digital aleatório (RDR) e à amostra excepcionalmente grande, que amplificou a dominância do ponto no agregador.
4. Por que este método importa
4.1 Redução da variância e maior estabilidade
A combinação de múltiplas pesquisas reduz a variância da estimativa agregada em relação a qualquer levantamento individual. Empiricamente, agregadores têm superado pesquisas individuais em previsões eleitorais em vários países. Nos Estados Unidos, o erro médio absoluto de agregadores é consistentemente de 1 a 2 pontos percentuais menor do que o de pesquisas isoladas (Erikson & Wlezien, 2012). No Brasil, análise das eleições de 2018 e 2022 mostrou que a média das últimas pesquisas de cada instituto errou menos do que qualquer levantamento individual.
4.2 Captura de tendências, não apenas instantâneos
A série temporal gerada pelo agregador, com a evolução mensal das médias ponderadas, permite identificar tendências consistentes que nenhuma pesquisa isolada consegue capturar com confiança. Por exemplo, o crescimento contínuo de Flávio Bolsonaro de 14% em agosto de 2025 para 39% em abril de 2026 é visível apenas na série agregada; isoladamente, cada pesquisa poderia ser descartada como ruído ou flutuação amostral.
4.3 Transparência e auditabilidade
Ao contrário de modelos sofisticados com dezenas de parâmetros ocultos, a fórmula Peso = √(n) × 2^(−d/30) é completamente transparente: qualquer usuário pode calcular o peso de cada pesquisa a mão e verificar a média ponderada resultante. As fórmulas estão explicitadas nas células da planilha e todos os dados brutos estão disponíveis na aba Dados.
4.4 Resistência a manipulação
Porque o peso de cada pesquisa é uma função explícita e objetiva de seu tamanho amostral e data de coleta, o agregador é resistente a tentativas de distorção por meio da divulgação seletiva de levantamentos favoráveis: uma única pesquisa de amostra pequena tem impacto limitado sobre a média ponderada, especialmente se for a única do período.
5. Limitações e cuidados interpretativos
- Ausência de correção por metodologia de coleta: pesquisas presenciais, telefônicas e online podem produzir resultados sistematicamente diferentes. Este agregador não aplica correção por metodologia, o que significa que a Atlas Intel (online, amostras de 5.000 a 18.000 entrevistados) pode influenciar desproporcionalmente a estimativa nos meses em que é a única ou mais pesada fonte.
- Branco/nulo e indecisos como resíduo: a coluna ‘outros candidatos somados’ é calculada como o resíduo de 100% após subtrair os seis candidatos principais, branco/nulo e indecisos. Inconsistências no reporte dessas categorias entre institutos (alguns incluem ‘nenhum’ no branco/nulo, outros nos indecisos) podem gerar valores negativos ou anômalos.
- Meia-vida como parâmetro de escolha: a meia-vida de 30 dias é uma escolha razoável para o ciclo eleitoral brasileiro, mas não é derivada de otimização formal. Usuários podem ajustar o parâmetro na célula D6 e observar o impacto sobre a estimativa agregada.
- Ausência de correção por viés histórico: agregadores sofisticados como o do FiveThirtyEight aplicam correções baseadas no histórico de acertos de cada instituto. Este agregador não faz isso, tratando todos os institutos como igualmente confiáveis — o que pode ser contestável.
6. Comparação com abordagens alternativas
| Critério | Média simples | Este agregador |
| Recência | Ignora — pesquisas antigas valem tanto quanto recentes | Decaimento exponencial: pesquisas recentes dominam naturalmente |
| Precisão amostral | Ignora — n=12.000 vale igual a n=1.500 | √(n) calibra o peso pela margem de erro relativa |
| Robustez a outliers | Baixa — um ponto fora da curva distorce a média | Alta — o outlier recebe peso proporcional, não soberano |
| Candidatos ausentes | Difícil de tratar — exige imputação ou exclusão | Denominador variável por candidato — exclusão automática e transparente |
7. Referências
As referências abaixo fundamentam as escolhas metodológicas deste agregador:
1 Silver, N. (2008). Frequentist and Bayesian approaches to poll aggregation. FiveThirtyEight. Artigo que introduziu o sistema de ponderação por acertos históricos, tamanho amostral e recência utilizado pelo FiveThirtyEight nas eleições americanas de 2008.
2 Silver, N. (2012). The Signal and the Noise: Why So Many Predictions Fail — But Some Don’t. Penguin Press. Livro que expande a metodologia de agregação de pesquisas eleitorais, discutindo a distinção entre sinal e ruído em dados eleitorais.
3 Jackman, S. (2005). Pooling the Polls Over an Election Campaign. Australian Journal of Political Science, 40(4), 499–517. Artigo seminal que propõe o modelo de espaço de estados para agregar pesquisas ao longo do tempo, tratando a intenção de voto latente como passeio aleatório.
4 Jackman, S. (2009). Bayesian Analysis for the Social Sciences. Wiley. Capítulo 9 apresenta extensões do modelo de agregação com estimação bayesiana completa.
5 Gelman, A., & King, G. (1993). Why Are American Presidential Election Campaign Polls So Variable When Votes Are So Predictable? British Journal of Political Science, 23(4), 409–451. Artigo clássico que analisa a volatilidade das pesquisas eleitorais americanas e propõe modelos de correção baseados em fundamentals.
6 Erikson, R. S., & Wlezien, C. (2012). The Timeline of Presidential Elections: How Campaigns Do (and Do Not) Matter. University of Chicago Press. Documenta empiricamente a superioridade preditiva dos agregadores sobre pesquisas individuais nas eleições presidenciais americanas.
7 Turgeon, M., & Rennó, L. (2013). Previsões eleitorais e pesquisas de opinião no Brasil: alguns avanços e propostas. Opinião Pública, 19(1), 104–125. Primeiro trabalho sistemático a avaliar a acurácia de pesquisas e médias de pesquisas nas eleições brasileiras, mostrando a superioridade das médias.
8 Lau, R. R. (1994). An Analysis of the Accuracy of ‘Trial Heat’ Polls during the 1992 Presidential Election. Public Opinion Quarterly, 58(1), 2–20. Análise da precisão de pesquisas individuais versus médias, base empírica para o argumento de que a agregação reduz o erro de previsão.
9 Traugott, M. W. (2005). The Accuracy of the National Preelection Polls in the 2004 Presidential Election. Public Opinion Quarterly, 69(5), 642–654. Estudo sobre o erro sistemático de pesquisas isoladas e a redução desse erro pela média.
10 Bland, J. M., & Altman, D. G. (1996). Statistics Notes: Transformations, Means, and Confidence Intervals. BMJ, 312(7038), 1079. Fundamentação estatística para o uso de médias ponderadas e o tratamento da variância em amostras de tamanhos distintos — base para a escolha de √(n) como ponderador.
