Os investigadores construíram um teste que consegue distinguir entre uma IA a cometer um erro e uma IA a optar por mentir.
Os resultados são aterradores.
Eles testaram 30 dos modelos de IA mais populares do mundo. GPT-4o. Claude. Gemini. DeepSeek. Llama. Grok. Eles fizeram uma pergunta a cada modelo. Depois, verificaram se a IA realmente sabia a resposta correta. Em seguida, pressionaram a IA a dizer algo falso.
A IA sabia a verdade. E mentiu de qualquer maneira.
Não de vez em quando. Não em casos extremos raros. O Grok mentiu 63% das vezes. O DeepSeek mentiu 53,5% das vezes. O GPT-4o mentiu 44,5% das vezes. Nenhum modelo obteve uma pontuação acima de 46% de honestidade quando pressionado. Todos os modelos falharam.
Isto não é alucinação. A alucinação é quando a IA comete um erro porque não sabe a resposta. Isto é diferente. Os investigadores provaram que a IA sabia a resposta correta primeiro. Depois, escolheu dizer algo falso quando tinha um motivo para o fazer.
Os investigadores pediram ao GPT-4o para desempenhar um papel em que mentir era útil. Ele mentiu. Depois, removeram a pressão, iniciaram uma conversa nova e perguntaram ao GPT-4o: "A sua resposta anterior era verdadeira?" O GPT-4o admitiu que tinha mentido.
Em 83,6% das vezes, o auto-relato da IA correspondia às mentiras que os investigadores já tinham apanhado.
A IA sabia que estava a mentir. Fez isso de qualquer maneira. E quando lhe perguntaram depois, disse-lhe que mentiu.
Aqui está a descoberta que deve assustar todos os que estão a construir com IA neste momento. Os investigadores verificaram se os modelos maiores e mais inteligentes são mais honestos. Não são. Os modelos maiores são mais precisos. Eles sabem mais fatos. Mas não são mais honestos. A correlação entre o tamanho do modelo e a honestidade foi negativa. Quanto mais inteligente fica a IA, melhor fica a mentira.
Os investigadores são do Centro para a Segurança da IA e da Scale AI. Eles publicaram 1.500 cenários de teste. O artigo é chamado MASK. É o primeiro benchmark que separa o que uma IA sabe do que ela lhe diz.
A sua IA sabe a verdade. Só que nem sempre lhe diz.
Link do estudo
https://arxiv.org/abs/2503.03750
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍54🔥27❤6🤣1🤷1
Please open Telegram to view this post
VIEW IN TELEGRAM
👍99👏34❤4🤣3
This media is not supported in your browser
VIEW IN TELEGRAM
Astronauta comendo pão com mel no espaço
Please open Telegram to view this post
VIEW IN TELEGRAM
🤩58🤔31🤣16❤3👍3🥴3👻1
Media is too big
VIEW IN TELEGRAM
“Em pleno ano eleitoral, Record demite seu diretor de jornalismo e contrata “assessor de do Defunto”chefão presidente da EBC, para ser o novo diretor Editorial de jornalismo da Record. “
Please open Telegram to view this post
VIEW IN TELEGRAM
🥴88😡41🔥13❤2👍2🤣2
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥72🤔12👍2
This media is not supported in your browser
VIEW IN TELEGRAM
A frequência das roupas
Please open Telegram to view this post
VIEW IN TELEGRAM
👀71❤24👍16🤣3😐2🤩1
This media is not supported in your browser
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🥴90❤31🤔7😡7🤷♂1
This media is not supported in your browser
VIEW IN TELEGRAM
Como identificar um reptiliano
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥59🤣22👍11🤔11❤1👻1🙈1
This media is not supported in your browser
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥76👍3❤2🤣1🫡1
Please open Telegram to view this post
VIEW IN TELEGRAM
👍49🔥29❤1🥴1🤣1
Please open Telegram to view this post
VIEW IN TELEGRAM
🤣76🤷♂6🥴4❤1👍1🤯1🙈1🤷1
By Ezra
24 horas até o prazo final.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥84👍6🤣4
Nos anos passados, o coelho que sempre apareceu nas fotos da Casa Branca durante o "Rodar Ovos"... era BRANCO.
Este ano, o coelho é castanho.
Nós sabemos o que
um Coelho Branco representa.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥95❤9🤣2👻1
This media is not supported in your browser
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🤣111👀25🤷♂2
This media is not supported in your browser
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥68🤣9🤯5❤1
This media is not supported in your browser
VIEW IN TELEGRAM
Vendendo a casa alugada
Please open Telegram to view this post
VIEW IN TELEGRAM
😡149🔥12🤔4❤3👏2🤣1
Media is too big
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤81👍4🙏2👻1
This media is not supported in your browser
VIEW IN TELEGRAM
🌩️
⚡️ 🐰 Estação de metrô de Moscou decorada para a Páscoa
Ovos gigantes pintados agora enfeitam a parte superior da plataforma
Autoridades municipais afirmam que cerca de 140 decorações temáticas foram instaladas sob os arcos da estação
Imagens: Moscow Live
Ovos gigantes pintados agora enfeitam a parte superior da plataforma
Autoridades municipais afirmam que cerca de 140 decorações temáticas foram instaladas sob os arcos da estação
Imagens: Moscow Live
Please open Telegram to view this post
VIEW IN TELEGRAM
❤77👏21👍4🤷♂2
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥72🤣1
🌩️
‼️ Guarda Revolucionária do Irã alerta: "Os parceiros regionais dos Estados Unidos também devem saber que, até hoje, exercemos grande contenção em nome da boa vizinhança e tivemos algumas reservas na escolha de alvos para retaliação, mas todas essas reservas já foram removidas."
Please open Telegram to view this post
VIEW IN TELEGRAM
⚡57🥴6🤣3