Vamos aqui fazer um experimento juntos, que tal? Peguemos uma amostra aleatória de 1000 pessoas que usaram cloroquina como tratamento precoce da Covid. Dessas 1000 infectadas, digamos que 800 tiveram sintomas leves e se curaram, 180 tiveram algumas complicações e necessitaram de auxílio médico e hospitalar, e 20 faleceram. Não sabemos mais nada sobre elas, se tinham comorbidades, seu sexo, nada disso.
Muito tentador dizer que, por conta da cloroquina, 98% das pessoas se curaram, logo o remédio tem eficácia de 98%. Certo? É isso que pessoas má intencionadas ou ignorantes colocam como manchete da notícia no site que só quer cliques, e é isso que pessoas que querem ser enganadas leem e compartilham.... apenas a manchete má intencionada.
Big Data é o nome chique que se dá à abundância de informações que se tem hoje.... o que você pesquisa na Internet, o que você compra no supermercado, o que você compartilha, tudo isso em tese pode ser capturado em um grande conjunto de dados, que pode ser uma ótima ferramenta das Ciências Sociais, ou um ótimo jeito de se mostrar qualquer coisa que se queira, pra quem quiser comprar a ideia.
Voltando ao nosso experimento, e usando Big Data, vamos analisar outras variáveis desse grupo de mil pessoas: consumo de chocolate, quantidade de chuva no período que a pessoa está doente, número de familiares morando no mesmo lugar, quantidade de brotos de feijão mágicos do pastor Everaldo que a pessoa comprou, e o resultado do lançamento de uma moeda que eu fiz pra cada pessoa observada.
Rodando uma regressão estatística para esse grupo e essas variáveis, chegamos à conclusão que quanto mais chocolate a pessoa comeu, mais ela saiu ilesa da doença, mas para as outras variáveis não houve correlação significativa. Posso então criar uma manchete dizendo que chocolate é eficaz para o tratamento do Covid, certo? Pouco importa se na verdade a pessoa come mais chocolate porque está se sentido melhor, e não o contrário. Eu quero mesmo é vender meus chocolates...
Inclusive, dependendo do espaço amostral, posso até achar uma correlação entre o cara e coroa e as pessoas que faleceram.... seria sinistro pensar que o meu lançamento da moeda causou a morte ou a vida de alguém, ao melhor estilo Duas Caras.
Correlação é quando uma variável anda junto com a outra, sem efeito causal..... Causalidade, quando uma coisa causa a outra.... Quer provar causalidade? Escolha uma amostra aleatória de pacientes, dê pra metade cloroquina e pra metade placebo.... Já foi feito isso aos montes.... e adivinhem o que descobriram?
Fun fact, como diria Sheldon Cooper: quanto mais variáveis você testa, sem critério, maior a chance de achar correlações espúrias... Se você pegar um grupo de pessoas e, digamos, 40 variáveis aleatórias, você provavelmente encontrará correlações absurdas, e se for mal intencionado, pode usar isso como um "estudo", publicar, etc. Querem um exemplo? Entre 1999 e 2009, nos Estados Unidos, o número de pessoas afogadas em piscinas é correlacionado com o número de filmes que Nicolas Cage apareceu. Vejam o site Spurius Correlations , e divirtam-se.
PS 1 - Quer eliminar a correlação entre os lançamentos das moedas e as mortes por Covid? Aumente o número de pessoas.... Pela Lei dos Grandes Números, quanto maior o número de observações, mais a observação chega próxima de seu valor esperado, ou 50% pra cada, no caso da moeda
PS 2 - Lembrem-se disso quando aquela sua tia ou conhecido dizerem que na casa deles todos pegaram Covid e não tiveram nada, por causa de qualquer remédio que te contarem. Se forem do time Bozo então, melhor nem discutir, só sorrir e acenar.
Comentários
Postar um comentário