Pular para o conteúdo principal

Kit Covid e Big Data, ou como enganar quem quer ser enganado usando "estatísticas"

 



Vamos aqui fazer um experimento juntos, que tal? Peguemos uma amostra aleatória de 1000 pessoas que usaram cloroquina como tratamento precoce da Covid. Dessas 1000 infectadas, digamos que 800 tiveram sintomas leves e se curaram, 180 tiveram algumas complicações e necessitaram de auxílio médico e hospitalar, e 20 faleceram. Não sabemos mais nada sobre elas, se tinham comorbidades, seu sexo, nada disso.
Muito tentador dizer que, por conta da cloroquina, 98% das pessoas se curaram, logo o remédio tem eficácia de 98%. Certo? É isso que pessoas má intencionadas ou ignorantes colocam como manchete da notícia no site que só quer cliques, e é isso que pessoas que querem ser enganadas leem e compartilham.... apenas a manchete má intencionada.
Big Data é o nome chique que se dá à abundância de informações que se tem hoje.... o que você pesquisa na Internet, o que você compra no supermercado, o que você compartilha, tudo isso em tese pode ser capturado em um grande conjunto de dados, que pode ser uma ótima ferramenta das Ciências Sociais, ou um ótimo jeito de se mostrar qualquer coisa que se queira, pra quem quiser comprar a ideia. 
Voltando ao nosso experimento, e usando Big Data, vamos analisar outras variáveis desse grupo de mil pessoas: consumo de chocolate, quantidade de chuva no período que a pessoa está doente, número de familiares morando no mesmo lugar, quantidade de brotos de feijão mágicos do pastor Everaldo que a pessoa comprou, e o resultado do lançamento de uma moeda que eu fiz pra cada pessoa observada.
Rodando uma regressão estatística para esse grupo e essas variáveis, chegamos à conclusão que quanto mais chocolate a pessoa comeu, mais ela saiu ilesa da doença, mas para as outras variáveis não houve correlação significativa. Posso então criar uma manchete dizendo que chocolate é eficaz para o tratamento do Covid, certo? Pouco importa se na verdade a pessoa come mais chocolate porque está se sentido melhor, e não o contrário. Eu quero mesmo é vender meus chocolates...
Inclusive, dependendo do espaço amostral, posso até achar uma correlação entre o cara e coroa e as pessoas que faleceram.... seria sinistro pensar que o meu lançamento da moeda causou a morte ou a vida de alguém, ao melhor estilo Duas Caras.

Correlação é quando uma variável anda junto com a outra, sem efeito causal..... Causalidade, quando uma coisa causa a outra.... Quer provar causalidade? Escolha uma amostra aleatória de pacientes, dê pra metade cloroquina e pra metade placebo.... Já foi feito isso aos montes.... e adivinhem o que descobriram?

Fun fact, como diria Sheldon Cooper: quanto mais variáveis você testa, sem critério, maior a chance de achar correlações espúrias... Se você pegar um grupo de pessoas e, digamos, 40 variáveis aleatórias, você provavelmente encontrará correlações absurdas, e se for mal intencionado, pode usar isso como um "estudo", publicar, etc. Querem um exemplo? Entre 1999 e 2009, nos Estados Unidos, o número de pessoas afogadas em piscinas é correlacionado com o número de filmes que Nicolas Cage apareceu. Vejam o site Spurius Correlations , e divirtam-se.

PS 1 - Quer eliminar a correlação entre os lançamentos das moedas e as mortes por Covid? Aumente o número de pessoas.... Pela Lei dos Grandes Números, quanto maior o número de observações, mais a observação chega próxima de seu valor esperado, ou 50% pra cada, no caso da moeda

PS 2 - Lembrem-se disso quando aquela sua tia ou conhecido dizerem que na casa deles todos pegaram Covid e não tiveram nada, por causa de qualquer remédio que te contarem. Se forem do time Bozo então, melhor nem discutir, só sorrir e acenar.



Comentários

Postagens mais visitadas deste blog

O consumo de sorvete e os afogamentos

Muito cuidado precisa ser tomado ao se analisar pesquisas e manchetes de jornais que associam alguma coisa a outra. Explico-me: quando lemos na internet que, por exemplo, comer vegetais faz a gente viver mais, é preciso ser crítico ao entender como se chegou no resultado, ou se apenas estão querendo chamar sua atenção com a manchete (como eu tentei fazer, inclusive). Quando estudamos duas variáveis, e percebemos que o movimento de uma acompanha o da outra, diz-se que as variáveis são correlacionadas. Por exemplo, em dias de maior número de afogamentos nas praias os vendedores de picolés também faturam mais. Isso quer dizer que sorvetes podem fazer você se afogar? Ou que as pessoas que estão acompanhando o resgate se entretém tomando um picolé? Para esse exemplo, é fácil perceber que em dias quentes tem mais gente nas praias, que tomam mais sorvete, e que também infelizmente acabam se afogando mais. Mas tomem a notícia abaixo: http://www.minhavida.com.br/bem-estar/ma...

Um ano

  Um ano se passou, um ano que meu pai se foi. Um ano que tenho que aprender a conviver com o luto, um novo sentimento que vem me acompanhado desde então. Com a raiva lido bem, já era minha companheira há algum tempo, na verdade até me ajuda vez ou outra. Agora ela ganhou um companheiro. Um ano desde que caiu a ficha que estou por conta própria pra resolver meus próprios BOs. Não teria condições de escrever sobre minha mãe, ela é tudo, ela nos criou. Mas pra nós, nascidos nos anos 70, pai era aquele que trazia o dinheiro pra casa, que resolvia todos os problemas, ou pelo menos os encaminhava. Mesmo já sendo um adulto funcional há muito tempo, quando a gente perde o pai parece que nos damos conta que é isso, vai que é sua. Um ano de sonhos e pesadelos recorrentes com ele, alguns com ele sorrindo e saudável, outros nem tão floridos. Um ano que minha relação com seres humanos mudou mais ainda, no sentido de esperar menos ou nada do próximo, com a óbvia exceção de minha família. Afinal...

Você acredita em coincidências?

  Será que alguém ainda lê um texto com mais de um parágrafo? Por via das dúvidas, escrevo pra mim mesmo.  Primeiro parênteses: A Lei dos Grandes Números, sempre ela. Uma possível interpretação para a mesma é que, um dado fato que talvez possamos entender como coincidência, ou um sinal, na verdade nada mais é que a combinação de milhares ou milhões de observações de eventos, alguma hora iria acontecer. Deixo aqui mal explicado de propósito, pra chegar logo no tema.  Segundo parênteses: na minha vida toda, sempre que ouvi "The Sounds of Silence", da dupla Simon & Garfunkel, era tomado por um sentimento grande de tristeza. A primeira memória que tenho dessa música é ver meu pai assistindo um show deles na TV, em um sábado ou domingo de manhã. Sempre associei essa música a meu pai indo embora deste planeta, sempre. Final dos parênteses. No dia que meu pai faleceu, coube a mim ir buscar a roupa para trocá-lo, enquanto meu irmão cuidava da liberação do corpo. Não consigo i...