Há uma fraude, intencional "ou não", no tamanho da amostra da pesquisa Datafolha de março em relação à de fevereiro. Da pesquisa divulgada hoje ainda não há estes dados para conferir. Mas os dados de fevereiro e março, disponíveis no TSE, são suficientes como prova.
Na pesquisa de fevereiro o instituto fez entrevistas em 18 bairros na cidade de São Paulo.Na pesquisa de março, o Datafolha elevou a pesquisa para 71 bairros na cidade de São Paulo. Porém, inexplicavelmente, não aumentou o número de bairros nem na cidade do Rio de Janeiro, nem em Belo Horizonte.
A pesquisa do Datafolha é na rua, em lugares de movimento. Cada bairro é um ponto de coleta de entrevistas de intenção de votos.Rio e Belo Horizonte perderam importância relativa na amostragem para São Paulo.
No Rio de Janeiro (segundo colégio eleitoral) a pesquisa foi feita em 10 bairros (10 pontos de entrevista).O eleitorado da capital paulista é 1,8 vezes maior do que o da capital fluminense.Pela proporção, se o Rio teve 10 pontos de coleta, São Paulo deveria escolher 18 bairros, e foi esse o número da pesquisa de fevereiro, o que estava certo. Resultado naquela data: apenas 4% de diferença entre Serra e Dilma.
Subitamente, em março, o DataFolha ampliou a coleta de amostra de São Paulo para 71 bairros. Inexplicavelmente, manteve para o Rio os mesmos 10 bairros. Resultado: a diferença aumentou para 9% entre Serra e Dilma. Se o objetivo era ampliar a amostra para maior precisão, também seria necessário aumentar o número de bairros no Rio na mesma proporção, elevando de 10 para 39.
A mesma coisa aconteceu com Belo Horizonte. Tanto em fevereiro como em março, as pesquisas abrangeram 4 bairros. BH tem cerca de 22% do número de eleitores de São Paulo. Assim, para 18 bairros pesquisados em São Paulo em fevereiro, 4 em BH estava proporcionalmente correto. Mas para 71 bairros na capital paulista, seria necessário aumentar para 15 em BH.
O Datafolha vai argumentar que o tamanho da amostra em São Paulo não quer dizer nada, porque os resultados finais são ponderados de acordo com os dados do IBGE. É apenas uma meia verdade, pois uma pesquisa "bem feita" em São Paulo, e "mal feita" no Rio de Janeiro e Minas Gerais, afeta os resultados de toda a região sudeste e do Brasil.
Além disso, qual é a explicação para um estatístico "anabolizar" a amostragem justamente na cidade de São Paulo, onde José Serra tem índices muito melhores do que no Rio de Janeiro e em Belo Horizonte? É inexplicável que um estatístico escolha fazer esse plano de amostras desbalanceado. Está usando critérios desproporcionais ao tamanho do eleitorado, para cidades diferentes, o que nenhum estatístico faria.
O fato indiscutível é que o Datafolha mudou sua metodologia no meio do jogo, e não comunicou ao distinto público, o que, por si só, já é prá lá de suspeito. O segundo fato indiscutível é que o Datafolha está aumentando a importância do Estado de São Paulo na pesquisa, justamente no estado onde Serra é mais forte, o que torna tudo mais suspeito ainda. Por fim, é um engôdo, uma forma de fraude, comparar a evolução do próprio Datafolha de fevereiro para março, quando foram feitas com metodologias diferentes, com planos de amostragem diferentes.
Qual o impacto dessa lambança no resultado nacional da pesquisa não dá para saber, inclusive porque seria necessário analisar o que foi mudado também nas demais cidades.
Só o Datafolha pode explicar. Mas quem vai confiar nas explicações do Datafolha depois disso?
Confira a relação dos bairros na pesquisa de março, feita entre 25/03/2010 a 26/03/2010 nesta
página do TSE, clicando na protocolo 6617/2010:
Depois, confira a relação dos bairros na pesquisa de fevereiro, feita entre 24/02/2010 a 25/02/2010 repetindo o processo acima, porém clicando no protocolo 4080/2010 (é preciso virar para a página seguinte, na tela acima).