segunda-feira, 19 de fevereiro de 2024

Saiu a 16.ª sondagem e, cada vez mais, estamos no empate.

Já foram publicadas 16 sondagens mas os comentários na comunicação social continuam fracos.

As nossas universidades, os professores, interpretam o conceito de probabilidade de forma muito restritiva e limitada. 

Como as nossas universidades são instituições destruidora das novas ideias (só quem diz amém e lambe botas é que progride), esta visão estreita perdura ao longo da décadas, acabando transmitida aos alunos que, depois de entrarem na vida activa, não são capazes de criar conhecimento a partir da informação disponível nas sondagens.

Todos que fomos avaliados numa universidade sabemos que a "verdade" é imposta pela autoridade e não pela razão,  que quem não responder como a autoridade disse ser a "verdade", terá a resposta classificada como errada.


Para que serve a estatística?

A estatística surgiu para descrever problemas naturais que têm "muitos graus de liberdade", isto é, muitos números mas cada número individual contém pouca informação.

Quando um vendedor de "bandeiras do FCP" decide a quantidade de bandeiras que vai levar para a sua banca à porta do Estádio do Dragão, a sua decisão não está dependente do conhecimento aprofundado de um um adepto particular mas da "massa", das centenas de milhar de adeptos do FCP que vão estar presentes no jogo do dia seguinte.

Cada adepto tem muito pouca informação, não sendo possível adivinhar se o adepto vai comprar uma bandeira mas, a "massa" com centenas de milhares de adeptos no seu conjunto mesmo tratada de forma "grosseira", já contém informação que permite ao vendedor prever uma quantidade óptima de bandeiras.

Com os dados dos jogos anteriores, o vendedor consegue prever, em função de algumas variáveis (temperatura, se vai chove,  lugar na classificação, número de jogos já realizados) quantas bandeiras vai, a média e o desvio, vender.

Com os dados tratados no conjunto, apesar de forma grosseira, o vendedor passa a ser capaz de calcular o lucro médio em função do número de bandeiras que vai levar (e a variabilidade do lucro) e, desta forma, determinar o número óptimo de bandeiras.


Onde está o problema das estatística das nossas universidades?

Assumem que as vendas vão ser um valor concreto e, por isso, não podemos avançar com um número partindo das observações do passado.

Quem estudou estatística, no estudo da significância de um parâmetro, vai-se recordar que "O parâmetro é um valor concreto e, por isso, nada mais podemos dizer do que H0: é zero ou H1: é diferente de zero".

No caso das sondagens, o resultado eleitoral (o número de deputados) vai ser um número concreto e, por isso, não podemos dizer a partir das sondagens qual vai ser esse número. 

Sendo assim, os estatísticos das nossas universidades e, consequentemente, os comentadores, ficam-se pela análise à Lapalice ("O PS tem 25% de intenções de voto e a AD de 23% de voto pelo que o PS está à frente nas intenções de voto" :-).


Mas as sondagens têm informação e, por isso, permitem obter conhecimento.

Vamos supor que um país desconhecido, o Baristão, vai a eleições e há dois partidos, o AB e o CD.

Se nada nos for dito, o melhor que podemos dizer é que "a probabilidade de ganhar o AB é de 50%".

Mas se nos for disponibilizada uma sondagem com 1500 respostas, recolhida de forma aleatória, em que o partido AB obteve 25% das intenções de voto, posso afirmar que a probabilidade do AB ganhar é inferior a 50%.

A última máxima dos comentadores é que as sondagens falham mas o que falha são os seus comentários.

Não me vou alongar mais neste ponto pois o estimado leitor já deve estar aborrecido.


Como estão as perspectivas para o dia 10 de Março.

Primeiro, cada sondagem que aparece torna mais claro que o PS e a AD estão empatados mas com uma muito ligeira vantagem para o PS.

Além de haver empate, não existe tendência da AD aumentar nem diminuir, está tudo estacionário, parado, flat.

Fig. 1 - Evolução da "vantagem" da AD relativamente ao PS (16 sondagens publicadas)


Para quem percebe de inferência estatística,  apresento o teste estatístico WLS:

                   Estimate     Std. Error      t value    Pr(>|t|)

(Intercept)  -0.5031      2.3290           -0.216     0.832    Não significativo

x                 0.0194       0.2392           0.081      0.937    Não significativo


Vamos aos resultados.

O que vou afirmar a partir deste ponto é totalmente impossível de ser afirmado pelo estatísticos das nossas universidades. Ficam como o "burro no meio da ponto" dizendo que não posso dizer isto nem o seu contrário.


No sentido de provar que não falham, vou apresentar o intervalo de confiança de 99% e de 95% e garanto que os resultados eleitorais vão cair nestes intervalos de confiança.

Com 99% de confiança, o PS + BE + PCP + Livre vai ficar com uma máximo de 100 deputados e o PSD+CHEGA com um mínimo de 118 deputados (maioria absoluta).

Fig. 2 - Resultados eleitorais que vamos observar na noite de 10 de Março de 2024


E como estamos de probabilidades?

O PCP está a caminhar rapidamente para se reduzir a apenas 2 deputados por Lisboa.

O Livre está na "moeda ao ar" tanto pode eleger como não o rui Tavares por Lisboa.

O PAN está totalmente condenado ao fracasso (tem 5% de probabilidade de reeleger Sousa Real).

As possibilidades do Montenegro aumentaram ligeiramente por causa da descida do BE+PCP+Livre. Neste momento está com uma probabilidade de 1 para 16 de chegar a primeiro-ministro (contando com a abstenção do CHEGA que pode não acontecer) o que é muito poucochinho.

Fig.3 - Não é por os estatísticos dizerem que não posso engravidar que não vou continuar a tentar.


Para confirmação, aqui vão as sondagens que eu tenho.





0 comentários:

Enviar um comentário

Twitter Delicious Facebook Digg Stumbleupon Favorites More

 
Design by Free WordPress Themes | Bloggerized by Lasantha - Premium Blogger Themes | Best Hostgator Coupon Code