Afinal, o que é um resultado "significativo"?

Artigo

4 nov 2025

Autor

Imagem

Frame do filme "Earth Vs. Flying Saucers"

Na minha coluna anterior, apresentei uma avaliação de alegações recentes sobre a detecção de objetos transientes (fontes pontuais de luz que aparecem em uma fotografia do céu, mas ausentes em fotos anteriores ou posteriores da mesma região) em imagens astronômicas da era pré-espacial. Portanto, quando não havia objetos artificiais em órbita da Terra construídos por seres humanos. Hoje, aproveito a controvérsia para conversar com vocês sobre alguns conceitos importantes quando falamos de evidência estatística a favor ou contra algo.

Resultados recentemente reportados por Villarroel et al. (2025) sobre a descoberta de múltiplos transientes (efêmeros flashes de luz) alinhados, registrados em placas fotográficas astronômicas dos anos 1950, incluem um alinhamento – pontos de luz que aparecem enfileirados, e não distribuídos claramente ao acaso, nas imagens fotográficas – com significância estatística de aproximadamente 3,9σ (esse símbolo “σ” é a letra grega “sigma”).

Os autores do trabalho afirmam que é difícil explicar esse enfileiramento apelando para fenômenos naturais, e sugerem a possibilidade de que teriam sido causados por “reflexões rápidas de objetos altamente refletivos em órbita geoestacionária ou emissões provenientes de fontes artificiais situadas acima da atmosfera terrestre”, ou seja, óvnis. E acrescentam: “Também encontramos um déficit altamente significativo (~22σ) de transientes do POSS-I dentro da sombra da Terra, quando comparado à cobertura teórica da sombra hemisférica a uma altitude de 42.164 km. O déficit ainda está presente, embora com significância reduzida (~7,6σ), quando se considera uma cobertura mais realista baseada nas placas”.

Mas o que os cientistas querem dizer com significância estatística? O que quer dizer um resultado ter uma significância de 3,9 sigmas?

Para entender isso, podemos voltar ao didático exemplo de jogar um dado comum: a chance de sair um número específico é de uma em seis (um dado tem seis lados; um número em cada lado). Agora imagine lançar dois dados. As somas possíveis variam em probabilidade. Por exemplo, só há uma maneira de obter o número dois (tirar 1 em ambos os dados), mas existem seis maneiras de obter o número sete (1+6, 2+5, 3+4, etc.). Se lançássemos esses dois dados muitas e muitas vezes, e registrássemos os resultados, o formato do gráfico seguiria uma curva em forma de sino, conhecida como distribuição normal.

A distribuição normal é uma grande amiga dos cientistas e estatísticos, pois tem propriedades muito interessantes. É simétrica; seu pico é chamado de média, e a dispersão dos dados, que se dá igualmente à direita e à esquerda da média, é medida pelo desvio-padrão, representado pela letra grega sigma (σ). Para dados que seguem essa distribuição, cerca de 68% das observações (no caso de jogar dois dados, cada soma é uma observação) estão dentro de um desvio-padrão (1σ) da média; cerca de 95% estão dentro de dois desvios (2σ); e 99,7% estão dentro de três desvios (3σ).

O número de sigmas indica o quanto um determinado resultado está distante da média – que, por ser o pico da curva, representa o valor esperado, ou seja, aquele que tem maior probabilidade de aparecer, caso nossos pressupostos (por exemplo, de os dados usados serem honestos) estejam corretos.

Em um teste estatístico, essa ideia se traduz em hipóteses. A hipótese nula (H₀) representa o pressuposto de que nada de novo está acontecendo, ou seja, os resultados observados são compatíveis com o que se esperaria apenas pelo acaso. Já a hipótese alternativa (H₁) propõe que há algo diferente ou novo interferindo no resultado.

Quando os cientistas calculam quantos sigmas um resultado se afasta da média esperada sob a hipótese nula, estão, na prática, testando o quanto seria improvável observar aquele valor, se a hipótese nula fosse verdadeira.

No caso dos transientes alinhados relatados por Villarroel et al. (2025), a hipótese nula é que os alinhamentos observados são coincidências, isto é, pequenos grupos de pontos brilhantes que, por acaso, parecem formar linhas em uma mesma placa fotográfica. A hipótese alternativa, por outro lado, é que esses alinhamentos refletem um fenômeno real, talvez físico, como reflexões especulares de objetos artificiais em órbita geoestacionária, ou emissões luminosas genuínas.

Quando os autores afirmam que um dos alinhamentos tem significância estatística de 3,9σ, estão dizendo que a probabilidade de esse alinhamento ter surgido por puro acaso, se a hipótese nula for verdadeira, é muito pequena, cerca de 0,01%. Isso não prova que o fenômeno é real, mas torna o acaso uma explicação pouco provável, sugerindo que a hipótese alternativa merece ser levada a sério.

Contudo, na astronomia, costuma-se exigir níveis de significância ainda maiores (como 5σ ou mais) para considerar um resultado uma descoberta confirmada. Por isso, embora os alinhamentos reportados sejam intrigantes, ainda não constituem prova definitiva de um novo fenômeno, mas um convite para investigações mais profundas.

Nesse contexto, quanto mais improvável for o fenômeno ou mais extraordinária a hipótese, maior deve ser a significância exigida, 7σ ou mais para algo que contradiga fortemente o conhecimento estabelecido. Mais uma vez, voltamos ao velho adágio: alegações extraordinárias exigem evidências extraordinárias. No presente contexto, uma alegação extraordinária é um resultado que contradiz algo muito bem estabelecido, ou que estabelece uma nova descoberta. E a evidência extraordinária são os sigmas. Quanto mais extraordinária for uma alegação, maior o número de sigmas que se deve exigir.

Os alinhamentos parecem interessantes, mas ainda não constituem uma descoberta confirmada. Assim como um físico não anuncia uma nova partícula antes de atingir 5σ, os astrônomos também precisam acumular mais dados e eliminar explicações alternativas (como artefatos fotográficos, reflexos ou falhas de processamento) antes de concluir que se trata de um fenômeno realmente novo.

Porém, há um problema com a significância desses alinhamentos, que Villarroel et al. (2025) infelizmente não fizeram questão de esclarecer no artigo. O alinhamento mais promissor identificado, entre um conjunto de 83 candidatos mais significativos, consiste em cinco transientes dispostos em linha, com uma probabilidade de apenas 0,01% de ser uma mera flutuação estatística naquela placa específica. Contudo, essa não é a história completa: foram analisadas 635 placas ao todo.

Esse tipo de situação é análogo ao clássico exemplo de “efeito procure em outro lugar”. Um arqueólogo observou que uma linha imaginária traçada entre duas pedras de Stonehenge apontava diretamente para um antigo monumento na França. Ele calculou que a chance de isso acontecer ao acaso era extremamente pequena, e concluiu que o monumento devia ter sido projetado com essa intenção. Mas, se considerarmos todas as combinações possíveis de pares de pedras e todos os monumentos existentes no mundo, a probabilidade de pelo menos uma dessas linhas apontar para algum local significativo ultrapassa 50%.

O mesmo raciocínio se aplica aqui. A probabilidade de 0,01% refere-se ao p-valor local, a chance de um alinhamento como aquele ocorrer por acaso em uma placa específica. O p-valor é uma medida estatística que expressa a probabilidade de obter um resultado igual ou mais extremo do que o observado, assumindo que não há nenhum fenômeno real envolvido (a nossa hipótese nula). Costuma-se converter o p-valor em número de desvios-padrão, nosso amigo sigma (σ). Mais uma vez: quanto maior o número de sigmas, menor a probabilidade de que o resultado seja uma simples flutuação aleatória. Por exemplo, um p-valor de 0,01% corresponde a cerca de 3,9σ, o que na física e na astronomia, normalmente seria considerado uma evidência interessante, mas não definitiva.

No entanto, quando se analisam centenas de placas, o número de oportunidades para que uma coincidência ocorra também aumenta. A probabilidade de encontrar pelo menos um alinhamento tão improvável em 635 placas não é difícil de calcular, e o valor é aproximadamente 6%. Ou seja, há cerca de 6 chances em 100 de observar um alinhamento tão impressionante apenas por acaso em todo o conjunto de dados, o que corresponde a apenas 1,55σ, uma significância estatística bastante modesta.

Antes de finalizar, voltemos a Villarroel et al. 2025.

“Também encontramos um déficit altamente significativo (~22σ) de transientes do POSS-I dentro da sombra da Terra, quando comparado à cobertura teórica da sombra hemisférica a uma altitude de 42.164 km. O déficit ainda está presente, embora com significância reduzida (~7,6σ), quando se considera uma cobertura mais realista baseada nas placas”.

Primeiro, note a queda abrupta na significância, de 22 para 7,6, quando se sai de um modelo teórico, mais distante da realidade, para um modelo mais condizente com a cobertura real do levantamento fotográfico do céu realizado pelo Observatório Palomar. Adicionalmente, cabe enfatizar que o próprio artigo reconhece que nem todos os transientes são responsivos à luz solar, mas apenas cerca de um terço deles.

Por enquanto, meu julgamento (para uma versão mais longa e em vídeo, ver aqui e aqui) sobre os artigos apresentados é que eles são, no máximo, interessantes, mas não constituem evidência definitiva de que objetos voadores não identificados estavam em órbita antes do lançamento do primeiro satélite projetado por humanos, o Sputnik I, pela União Soviética em 4 de outubro de 1957. As alegações foram feitas com base nos melhores dados disponíveis? Talvez, mas mesmo esses melhores dados ainda não demonstraram ter qualidade suficiente. Esse é outro problema com os artigos, mas daí já é outra conversa.

João Lucas da Silva é mestre em Ciências Biológicas pela Universidade Federal do Pampa, e atualmente doutorando em Ciências Biológicas na mesma universidade

ufologia

método científico

estatística

Afinal, o que é um resultado "significativo"?

Mais Acessadas

Disforia de gênero: momento atual requer cautela

O detergente e a lógica torta da polarização

A falsa questão da "neutralidade" da ciência

A autocrítica de Yale traz lições para o Brasil

Quando a IA cai em fake news

Sua Questão

Tags

método científico

Saúde

pseudociências

história

políticas públicas

COVID-19

psicologia

filosofia

coronavírus

evolução

política científica

jornalismo

Pandemia

biologia

universidade

medicina alternativa

dieta e nutrição

comunicação

homeopatia

vacinas

Busca em Questão

Atendimento à imprensa