A imagem é familiar na ficção: um suspeito está sentado em uma cadeira, conectado a inúmeros sensores , ansioso; do lado um investigador, ligado a uma tela que exibe as respostas dos sensores, calmamente segue uma lista de perguntas para avaliar, a partir dos indicadores, se as respostas são verdades ou mentiras. Mas, a despeito do que se vê em filmes e seriados de TV, o detector de mentiras mais comum, o polígrafo, não é confiável e não há evidência clara de que funcione para separar o falso do verdadeiro.
Robert Trivers, em The Folly of Fools, discute como a mentira é um comportamento adaptativo. Isso quer dizer que ser capaz de mentir, para os outros e para nós mesmos, possui vantagens evolutivas em relação ser honesto o tempo todo. Mentimos desde bebês, mesmo antes de adquirir capacidade de comunicação verbal. Pequenas “mentiras brancas”, inclusive, são o lubrificante social que atenua o atrito inevitável da vida em grupos. “A comida tá uma delícia”, “seu vestido é lindo”, etc.
Problemas surgem quando mentiras, ao invés de atenuar conflitos, encobrem uma quebra de contrato. Historicamente, os problemas maiores se concentraram na quebra do contrato social - habitualmente pelo encobrimento de crimes - e no adultério. Dada a capacidade de mentir e o interesse em se desvelar mentiras consideradas graves, criou-se uma miríade de técnicas interessantes.
Barr e Ben-Shakhar descrevem como hindus faziam com que suspeitos mastigassem arroz e cuspissem em uma folha de figueira; se o arroz grudasse na folha, o suspeito era inocente. O Livro de Números da Bíblia sugere como teste para mulheres adúlteras a ingestão de uma mistura de água benta e terra; se da ingestão resultar flacidez das coxas e inchaço do ventre, há culpa.
Essas técnicas precedem o polígrafo, mas seguem os mesmos princípios: medo e ansiedade ativam o sistema nervoso autônomo, responsável por atividades sem controle voluntário. Quem, contudo, não ficaria ansioso e com medo nessas condições? Ainda assim, a base para a maioria dos detectores de mentira, da antiguidade até hoje, é a crença de que quem não é culpado não tem nada a temer e, portanto, não terá reações autônomas associadas.
Ido Weijers, no livro A Social History of Psychology, associa o surgimento do polígrafo à emergência da psicologia experimental na Alemanha e aos insights sobre seu uso em contexto forense. Nessa linha, William Marston desenvolveu nos EUA durante os anos 20/30 um aparelho que se propunha a detectar variações na pressão sanguínea que indicariam inverdades, sendo a máquina aperfeiçoada por John Larson – considerado o inventor do primeiro equipamento viável comercialmente.
A máquina exigia um método. Não se deveria analisar as respostas fisiológicas frente a apenas um tipo de questão, mas a diferentes respostas a diferentes perguntas. Essa necessidade se dava por dois fatores principais. As respostas medem ativação autônoma de excitação, mas não suas causas, fazendo com que a conclusão sobre a mentira seja necessariamente indireta. E há diferenças individuais nas respostas fisiológicas, fazendo com que a resposta a estímulo similar seja diferente entre pessoas.
Dentre as várias metodologias desenvolvidas, a que se tornou mais relevante é o Teste de Comparação de Perguntas (CQT). Funciona mais ou menos assim: o investigado é conectado a uma máquina que mede sua respiração, sua pressão e batimentos cardíacos e a condutância de sua pele (alterada por suor) e segue uma sequência de pré-teste de acomodação e, em seguida, de algo em torno de 10 perguntas, separadas em 3 a 4 irrelevantes, 3 a 4 relevantes e 2 a 3 comparativas. Irrelevantes são perguntas genéricas (peso, idade, nome) que têm como objetivo apenas medir as respostas basais ao teste. As relevantes perguntam diretamente ao sujeito testado se ele cometeu o ato em questão (“você roubou o banco?”). E, por fim, questões comparativas investigam desvios de conduta relativos ao assunto, excluindo o ato específico (“já pegou algo que não era seu”?).
A mentira seria detectada pela diferença de respostas fisiológicas às respostas relevantes e comparativas, sendo as irrelevantes usadas como controle. A lógica por trás desse método está na crença de que o suspeito inocente terá uma reação mais forte à questão comparativa que à questão relevante e, em contraste, o suspeito culpado irá responder de maneira mais intensa à questão relevante que à questão comparativa – já que há óbvio interesse em se desvincular do caso específico. Os resultados obtidos do pareamento das respostas fisiológicas às perguntas feitas são então submetidos à avaliação subjetiva do examinador. Quais seriam, então, os problemas dessa metodologia?
Não há base teórica na conexão entre respostas fisiológicas e o ato de mentir, sendo possível que haja oscilações que tenham por fundo outras variáveis que não a ansiedade pela mentira. Não há padronização no método de aplicação, o que é indispensável à confiabilidade do teste, sendo possível que diferentes métodos de questionamento e o uso de intuição do examinador interfiram no resultado. Não há uma quantificação das respostas fisiológicas, sendo sua variação avaliada globalmente pelo examinador ao invés de passar por crivos numéricos. São possíveis contramedidas para trapacear no teste, podendo uma pessoa culpada treinada induzir respostas favoráveis. E, por fim, é possível contaminação do examinador, já que ele conhece o caso criminal, fazendo com que esteja presente o risco de viés de confirmação.
Indo à ciência do teste, Barr e Ben-Shakhar preceituam que qualquer pesquisa acadêmica sobre o assunto deveria levar em conta quatro condições: critério claro e inequívoco do que define culpa ou inocência; critério esse independente da avaliação do examinador e das informações disponíveis a ele; uma amostra estatística da população examinada e os casos para os quais o teste do polígrafo é exigido; e que as condições do teste sejam similares à realidade, ou seja, que a mentira ou crime sejam reais. Para eles, seguidos esses critérios, nenhuma pesquisa realizada até hoje sobre CQT passaria no crivo.
Assim, embora haja uma grande quantidade de experimentos e até de meta-análises relacionadas ao assunto, grande parte indicando alguma capacidade dos testes captarem mentiras melhor que o acaso, as condições experimentais inerentes à natureza do teste fazem com que a ciência em torno do tópico seja frágil. Apesar das alegações da American Polygraph Association quanto ao corpo de evidências a favor do teste do polígrafo, os pareceres do National Research Council, das National Academies e da American Psychological Asociation, sobre suas deficiências e incertezas representam a posição majoritária da academia. No Brasil e na maior parte do mundo, cabe ressaltar, o uso de polígrafo é inadmissível como prova judicial, demonstrando que a justiça moderna também tem dúvidas sobre a eficácia de seu uso.
Apesar dos quase 100 anos de uso do polígrafo, as evidências de que há benefício em seu uso em contexto forense são fracas, e ainda menos importantes em contextos desvinculados de um evento específico, como para avaliação de honestidade de funcionários.
Há alternativas mais promissoras, ainda incipientes, como o uso de ressonância magnética funcional e de inteligência artificial, mas o CQT continua como teste preponderante no mundo. Ainda que o avanço tecnológico venha a permitir que, em algum momento, seja possível discriminar com eficácia exemplar uma verdade de uma mentira, um Pinóquio instrumental, cabe avaliar se é desejável, ética e pragmaticamente, uma ferramenta dessa natureza.
Paulo Almeida é psicólogo, advogado, doutorado em administração pública e membro do Conselho Editorial da Revista Questão de Ciência