O problema da IA é acertar bem demais

Opinião de Mário Porfírio, professor de Política Comercial e Marketing da AESE Business School

Executive Digest

Por Mário Porfírio, professor de Política Comercial e Marketing da AESE Business School

Um dos temas de discussão frequente pelos utilizadores de Large Language Models são as alucinações, as falhas nos resultados que obtemos quando colocamos um desafio a qualquer sistema de Inteligência Artificial. Toda a gente tem ou conhece uma situação anedótica em que uma resposta foi totalmente fora do contexto e da imagem ou vídeo que apresenta pessoas com seis dedos ou mais do que um par de mãos. Mas e quando a IA acerta cada vez melhor? Como reagimos? Confiamos e…

Quanto mais limpo e completo parece o output da Inteligência Artificial (IA), menor a probabilidade de ser verificado. Esta é uma das tendências claras do AI Fluency Index da Anthropic (2026) e a mesma já tinha sido identificada em situações onde as respostas são apresentadas de forma detalhada e estruturada passo a passo, aumentando a confiança e reduzindo ainda mais a propensão para questionar os resultados. O erro evidente levanta suspeitas, o erro potencial passa, levando a que o texto bom, paradoxalmente, seja o mais perigoso, não porque esteja certo ou errado, mas porque parece suficientemente certo para não ser escrutinado.

Para além da confiança existem outros fatores. Um deles é o automation bias, a tendência para aceitar automaticamente a resposta de um sistema automatizado, mesmo quando está errada ou deva ser reavaliada. Este comportamento, bastante estudado pela psicologia cognitiva em contextos como a aviação e a medicina, sugere que profissionais experientes que o adotam ignoram informação crítica e seguem de forma automatizada recomendações erradas sugeridas pelos equipamentos. Também a economia cognitiva é associada à utilização de sistemas de apoio à decisão. A poupança de energia pode ser relacionada com o benefício esperado: por exemplo, numa tarefa de baixo risco, o resultado da IA pode ser mais facilmente aceite sem verificação; se, pelo contrário, for uma tarefa muito complexa, é também mais económico aceitar o resultado do que verificar a sua autenticidade.

E o expoente máximo é a “rendição cognitiva” (cognitive surrender), um conceito recentemente formalizado, que descreve a adoção das respostas da IA sem qualquer escrutínio, abdicando do próprio julgamento crítico. Num conjunto de três experiências com mais de 1300 participantes, os autores demonstraram que este comportamento aumenta a confiança dos utilizadores, mesmo perante erros óbvios da máquina. Participantes que consultavam um modelo de linguagem de IA seguiam as suas recomendações em cerca de 80% dos casos, mesmo quando estas estavam deliberadamente erradas e faziam-no com mais confiança do que quando respondiam sozinhos.

Continue a ler após a publicidade

O fenómeno é mais pronunciado em pessoas com elevada confiança na tecnologia ou menor motivação para o esforço analítico e pode ser mais frequente do que se pensa. Já no passado tinha sido demonstrado que o acesso constante a motores de busca na Internet altera os nossos processos cognitivos e a retenção de dados. Numa série de quatro experiências publicadas na revista Science, quando colocado perante questões difíceis, o cérebro humano é condicionado a pensar imediatamente em computadores como ferramenta de auxílio.

Investigadores do MIT que acompanharam utilizadores do ChatGPT, ao longo de vários meses, apresentam indicadores ainda mais perturbadores: uma redução do envolvimento cognitivo com diminuições mensuráveis ao nível neural, linguístico e comportamental fruto da utilização de IA. E pior: o efeito agravou-se com o tempo. Os participantes não eram menos exigentes no início, mas à medida que o tempo foi passando tornaram-se. O que confirma resultados anteriores que apontavam para uma erosão progressiva do pensamento crítico de alguns utilizadores.

Em paralelo com a perspetiva comportamental, é também relevante considerar a natureza do desempenho da IA ao nível das tarefas. Num estudo com 758 consultores da empresa BCG, nos EUA, sugere-se que a IA não melhora o desempenho de forma uniforme, operando antes numa jagged technological frontier. Este conceito sugere que os modelos de linguagem não são bons para todas as tarefas e que existe uma fronteira irregular que afeta a produtividade dos trabalhadores do conhecimento, pois algumas tarefas podem ser totalmente automatizadas, enquanto outras exigem supervisão humana total para corrigir erros. Esta fronteira não tem contornos definidos de forma clara, move-se à medida que os modelos de IA evoluem, é desigual, porque podemos resolver problemas extremamente complexos (dentro da fronteira) e, ao mesmo tempo, falhar em tarefas simples ou triviais (fora da fronteira) e é de difícil previsão.

Continue a ler após a publicidade

Assim, da próxima vez que usar um modelo de linguagem ou avaliar a utilização na sua equipa ou organização, reserve um momento para observar os seus comportamentos com a ferramenta. Que tarefas estão a ser delegadas sem verificação? Onde é que os resultados são aceites por serem “bons o suficiente”? A resposta a estas perguntas pode revelar pontos de melhoria concretos e ajudar a distinguir as tarefas em que a utilização de IA é mais adequada. As melhores práticas estão ainda a ser definidas, mas a recolha e análise consistente destes indicadores pode levar a melhorias do desempenho pessoal, das equipas e das organizações.

Partilhar

Edição Impressa

Assinar

Newsletter

Subscreva e receba todas as novidades.

A sua informação está protegida. Leia a nossa política de privacidade.