quinta-feira, 27 de março de 2008

Sobre... Notícias

Público do UOL acerta o resultado da final do BBB 8 - UOL
Notícia original:
http://televisao.uol.com.br/bbb8/ultnot/2008/03/25/ult5628u3401.jhtm

Eu não sei se alguém que tá lendo esse blog não sabe, mas eu faço faculdade de Estatística. E, na última aula, a gente tava discutindo Data Mining, que é uma técnica para analisar amostras muito grandes - basicamente porque os testes estatísticos tradicionais, em amostras muito grandes, tornam-se tão precisos que detectam diferenças milimétricas, e os pesquisadores acabam tendo que "fechar os olhos" para o teste. Ou seja, eles fazem uma análise e depois fingem que não fizeram nada, e que descobriram a resposta intuitivamente.
A Estatística tem umas coisas muito engraçadas, e boa parte destas coisas referem-se a amostras. Segundo vive reclamando o Rafael, se você pega a população brasileira inteira como amostra, o resultado será completamente diferente do que se você realizar um censo (que consiste em entrevistar a população inteira, hehe). Ou seja: a Estatística é muito, muito subjetiva... é mais ou menos como se o resultado de uma análise inteira dependesse do título que você, estatístico, quisesse dar pra ela.
E por que eu to comparando isso com o BBB? Bom, é mais ou menos assim. No meu trabalho eu analiso várias estatísticas de sites, mas não costumo me preocupar muito em ficar realizando testes com elas. Por que? Hehe, porque meus chefes só querem uma análise descritiva (que é escrever e fazer gráficos somente do que eu to vendo - basicamente o que todo mundo que tem estatística na faculdade aprende...). :p
Sério. As amostras às vezes são de mais de um milhão de pessoas, na população apenas das pessoas que acessam a internet - é bem grandinha! Eu acabo meio que confiando que o aumento de 1% que eu to enxergando ali vai ser detectada pelo teste, com uma amostra tão grande (e claro, levando em conta as peculiaridades da estatística que eu to analisando... mas eu não quero me aprofundar muito aqui). E é mais ou menos aqui que entra o BBB.
Minha mãe é apaixonada por BBB (pra ser bem sincera eu também gostava, mas desde que a Globo colocou a Sirigaitalene Istefaneli e o Alemão vestidos de anjinhos percebi como tava perdendo meu tempo). Aí ela sempre vinha me pedir (porque ela tem um pouco de receio de mexer no pc) pra eu abrir algum site e ver quem era líder, quem era anjo, etc etc etc, antes de passar na Globo. E eu sempre dava uma de "vidente", abria o UOL e falava: "mãe, hoje o fulano que vai sair". Aí minha mãe dizia: "imagiiiina Rêê, ele é mentiroso e não sei mais o quê!!!". E ele saía, batata.
É verdade. O UOL não errou NENHUM resultado, até na final (pra quem não teve saco de ler a reportagem, eram dois finalistas, e o vencedor acabou vencendo com 50,15% dos votos) eles chegaram bastante perto. Aí você pode pensar: ah, mas foi acidente, esse 0,15% dos votos poderia ter sido alterado depois de um minutinho, a Gynojentaselle poderia ter ganho se a votação continuasse, etc etc. Mas eu acho importante ressaltar aqui que na final do BBB 76 milhões de crédulos votaram (ai pai), e que a diferença de 0,15% citada acima se traduz em mais de 100 MIL votos... sei lá se isso é tão descartável assim... não sei mesmo.
E aí, será que é errado um estatístico trabalhar diferente quando a amostra é muito grande? Será que é errado confiar nesses resultados "não-refinados", não provenientes de um teste formal? Ou pra tornar essa discução um pouco mais agradável pra quem não gosta de Estatística (VULGO pra quem é normal VULGO pra quem tem juízo): será que um médico deve receitar um paciente sem examiná-lo baseado apenas em sintomas que indicam muito forte determinada doença? Eu particularmente sempre odiei médicos que fazem isso...
E agora meio que faço igual.

16 comentários:

Unknown disse...

Em medicina, não tem como um médico encontrar o problema do paciente fazendo testes, primeiro porque gasta muito dinheiro, segundo porque gasta muito tempo.
Também não tem como ele ter certeza só analizando os sintomas.
A soluçao é através dos sintomas escolher os exames que o paciente vai fazer que confirmem as suspeitas do médico.
Talvez seja também uma boa abordagem para um estatístico.

Minha mãe e irmão ficaram falando do BBB: Nossa, essa passou pertinho... acho que eles não fazem nem idéia de que 0,15% podem ser mais de 100mil votos...
Detalhe a sacada da Globo: "Vamos deixr mais um minuto de votação porque está empatado!" Essa eu achei fantástica...

Unknown disse...

Pelo que eu ouvi de
algumas pessoas que foram ao medico
no bairro, alguns médicos fazem
teste com remedios, a cada semana
ele dá um remedio diferente para
algumas opções de doença relativas
ao sintoma... não creio que esse
seja um caminho cientifico...

rizbicki disse...

Quanto a pegar toda a população: o que eu falo é que os métodos que a gente usa (tanto clássicos quanto bayesianos) em eleições supõe uma população infinita (a gente usa uma binomial, que supõe independência, e não uma hipergeométrica, que seria mais correto). Essa aproximação é razoável quando o tamanho da amostra é pequeno em relação ao da população...por isso o problema de pegar toda a população como amostra. Mas existem métodos que supõe população finita (vide amostragem).


E outra...isso acho que não acontece muito com BBB, mas o problema de fazer pesquisas pela internet é que a população de interesse é outra: uma é das pessoas que usam o telefone e outra é das pessoas que usam internet. Nesse caso, mesmo a amostra sendo gigantesca, pode haver uma diferença entre os resultados, afinal são duas populações podem ser distintas.

(depois comento mais, tenho que ir pra aula...:P)

Rafael Stern disse...

Uma vez que fui chamado para comentar esse post, não vou me importar em ser um cara mala :D

Como foi visto nas aulas de inferência, quando se tem um teste pontual (do tipo H0: X = mu contra H1: X != mu) então mandando-se o tamanho da amostra pro infinito rejeita-se H0 com probabilidade 1. Isso significa que, mais do que encontrar diferenças milimétricas, com uma amostra suficientemente grande você SEMPRE vai rejeitar a hipótese nula. Tanto é que existe o famoso ditado "aumente a amostra para rejeitar".

Acho que isso não é uma crítica à análise estatística de bancos de dados grandes mas, sim, uma crítica aos métodos que os estatísticos geralmente usam quando aplicados a eles...

A solução? Turn bayesian!

rizbicki disse...

Acho que os clássicos muitas vezes confundem significante com significativo, por mais que eles falem que não se pode confundir esses dois conceitos.
Quero dizer o seguinte: quando a amostra é grande se fala "Se rejeitamos H_0 devemos ver se a diferença é realmente significativa". Contudo, fala-se que os teste são bons para "amostras não muito grandes", ou seja, fica implícito que significante e significativo são a mesma coisa para esses casos. E eu pergunto, se você já vê que a diferença não é significativa, então por que fazer testes? Muito estranho...


Quanto a diferenças pequenas, indivíduos que nascem em dias pares tem altura média diferente que indivíduos que nascem em dias ímpares. Para verificar isso, basta tomar uma amostra suficientemente grande...

Mas testes bayesianos também apresentam alguns problemas, na minha opinião não tão graves, mas...

Renata Brunelli disse...

Eu acho que se você tem uma amostra muuuuito grande, não deve ficar se preocupando muito em testar... porque se com milhões você consegue ver uma diferença no olho, o teste vai ver essa diferença com certeza, porque ele é muito menos míope que você... :pp
As pessoas testam simplesmente porque fazer só descritiva é meio visto com maus olhos, como se fosse preguiça ou incopetência do estatístico...
Também acho que alguns médicos são malucos, e eu tenho vááárias histórias. Uma vez fiquei 3 horas na fila do hu porque tava vomitando e, beeem, o que mais vc faz qdo vomita?? Enfim, fiquei 3 horas na fila, e qdo entrei na sala do médico ele deu dois soquinhos na minha barriga, falou: dói? E eu disse que sim. Aí ele falou que era uma virose e eu tomei buscopan na veia, fim.
:pp
Acho que ele pensou que eu tava vomitando pq tinha enchido a cara... deve ser....

rizbicki disse...

Muitas vezes o que vc quer testar não é a igualdade, mas sim uma proximidade (que é expressa pelo que é dito significativo). Nesse caso, a estatística bayesiana encaixa como uma luva...

Quanto ao médico do HU, é bem provável que ele não estivesse nem aí...

obs: malucos = folgados?!

Renata Brunelli disse...

Tá, mas até aí tem casos em que a estatística clássica se encaixa como uma luva... e outros em que a estatística bayesiana simplesmente não se encaixa... falar assim é muito generalista, e essa discussão nunca vai ter fim, nunca...
E o médico queria era ir embora com o dindin dele no bolso, isso sim...

Unknown disse...

Um comentário nada a ver: numa
estória de gibi, um pai chama
o amigo para melhorar o
apetite do filho, por que o amigo
disse que tinha feito faculdade de
nutrição. A mulher não gostava desse
rapaz mas depois que viu como ele
conseguiu fazer o menino comer
melhor, foi pedir desculpas, por
que não podia confiar num
nutricionista que trabalhava de
pedreiro. Ele disse, mas não sou
nutricionista. E ela pergunta, mas
meu marido disse que vc fez nutrição. E ele, não, eu fiz o
prédio da faculdade mesmo...

Unknown disse...
Este comentário foi removido pelo autor.
Unknown disse...

By the way, estou feliz que só vi
a foto do vencedor do BBB 8 após
o anuncio do resultado. Eu não
sabia nada desta ultima edição :)

Unknown disse...

Provavelmente eles não falam
quantas pessoas votam por minuto,
se o numero de novos votantes
fosse por exemplo 1% do total
acumulado, então os 0,15% realmente
é pouca coisa, caso contrário...

Renata Brunelli disse...

É, eu tava lendo agora que não é assim... na verdade, dependendo do horário e do meio de comunicação pelo qual o voto foi enviado, o voto tem um peso...
Parece q o cara q ganhou teve 3 milhões a mais que a seguda colocada, mas como o Bial falou ao vivo que teve empate, vários políticos no Piauí exigiram no plenário que fosse aberta uma investigação para apurar fraude, porque a segunda colocada era de lá...
Agora, imagina: por pouco ela não ganhou, mesmo ele tendo 3 milhões a mais. E os caras ainda querem falar de fraude?? Isso aí parece a eleição dos eua... queria ver se o vencedor tivesse tido a minoria dos votos, como é que a Globo ia se explicar pro público não tão bem ilustrado, mas chegado num bbb...

Unknown disse...

usar o bbb para fazer propaganda
politica é novidade ou já ocorreu
em outras edições?

Renata Brunelli disse...

Hehe, sinceramente não sei... mas é ridículo ficar contestando resultado de bbb. Até parece que a Globo vai voltar atrás!!!
Mas já vi tanta propaganda política sendo feita em torno de motivos bestas... como se a prioridade dos políticos não fosse solucionar os problemas mais urgentes, mas sim discutir se o Rafinha merecia ganhar da Gyselle. Enquanto isso, o povo morre de dengue, a CPI dos cartões corporativos não consegue quebrar o sigilo dos políticos do governo, etc etc etc...

Unknown disse...

a teve fornece o circo