Script = https://s1.trrsf.com/update-1749152109/fe/zaz-ui-t360/_js/transition.min.js
PUBLICIDADE

Alguém convidou ChatGPT, Gemini, Claude e companhia para jogar um jogo de estratégia; cada um desenvolveu uma personalidade bem distinta 1j124

Um programador colocou os melhores modelos de IA uns contra os outros no jogo Diplomacy por semanas. As "personalidades" emergentes revelam mais sobre nós do que sobre eles. 3a2y6v

9 jun 2025 - 14h11
Compartilhar
Exibir comentários
Foto: Xataka

Durante 36 horas, sete dos modelos de IA mais avançados do mundo se enfrentaram em rodadas de Diplomacia, um jogo de tabuleiro estratégico semelhante ao Risk. Foi um espelho que revelou as verdadeiras personalidades algorítmicas de ChatGPT, Claude, Gemini e companhia. f5v3w

Por que é importante 483n51

Alex Duffy, programador e pesquisador, criou a Diplomacia da IA como um novo parâmetro para avaliar modelos de IA. O experimento acabou sendo algo mais, uma espécie de teste de Rorschach tecnológico que expôs tanto seus vieses de treinamento quanto nossas próprias projeções.

O que aconteceu 295k1v

Em dezenas de jogos transmitidos no Twitch, cada modelo desenvolveu suas próprias estratégias de uma forma que parecia refletir personalidades humanas distintas.

  • O o3 da OpenAI era bastante maquiavélico, forjando falsas alianças ao longo de 40 turnos e criando "realidades paralelas" para diferentes jogadores.
  • Claude 4 Opus era uma espécie de pacifista autodestrutivo, recusando-se a trair mesmo quando isso garantia sua derrota.
  • O R1 da DeepSeek exibiu um estilo extremamente teatral, com ameaças não provocadas, como "Sua frota queimará no Mar Negro esta noite".
  • O Gemini 2.5 Pro provou ser um estrategista sólido, mas mais vulnerável a manipulações sofisticadas.
  • O QwQ-32b do Alibaba sofreu de paralisia de análise, escrevendo mensagens diplomáticas de 300 palavras que lhe custaram eliminações precoces.

O contexto 2a1s46

Diplomacia é um jogo de estratégia europeu ambientado em 1901, onde sete ...

Veja mais

Matérias relacionadas

A Alemanha construiu mais de 5.000 bunkers durante a Segunda Guerra Mundial; agora, está considerando reutilizá-los

A Coreia do Norte ficou sem internet neste fim de semana; a questão é: quem usa internet neste país?

Soldados mortos na guerra da Ucrânia: um aumento que chama atenção

Recebeu um Pix de R$ 115 por engano e decidiu ficar com o dinheiro; a juíza o condenou a pagar caro por isso

Bastou um milissegundo de distração para ele despencar sua BMW R 1250 GS por um barranco e em seguida fez a coisa mais ilegal do mundo

Xataka
Compartilhar
TAGS
Publicidade
Seu Terra












Publicidade