Alguém convidou ChatGPT, Gemini, Claude e companhia para jogar um jogo de estratégia; cada um desenvolveu uma personalidade bem distinta 1j124
Um programador colocou os melhores modelos de IA uns contra os outros no jogo Diplomacy por semanas. As "personalidades" emergentes revelam mais sobre nós do que sobre eles. 3a2y6v
Durante 36 horas, sete dos modelos de IA mais avançados do mundo se enfrentaram em rodadas de Diplomacia, um jogo de tabuleiro estratégico semelhante ao Risk. Foi um espelho que revelou as verdadeiras personalidades algorítmicas de ChatGPT, Claude, Gemini e companhia. f5v3w
Por que é importante 483n51
Alex Duffy, programador e pesquisador, criou a Diplomacia da IA como um novo parâmetro para avaliar modelos de IA. O experimento acabou sendo algo mais, uma espécie de teste de Rorschach tecnológico que expôs tanto seus vieses de treinamento quanto nossas próprias projeções.
O que aconteceu 295k1v
Em dezenas de jogos transmitidos no Twitch, cada modelo desenvolveu suas próprias estratégias de uma forma que parecia refletir personalidades humanas distintas.
- O o3 da OpenAI era bastante maquiavélico, forjando falsas alianças ao longo de 40 turnos e criando "realidades paralelas" para diferentes jogadores.
- Claude 4 Opus era uma espécie de pacifista autodestrutivo, recusando-se a trair mesmo quando isso garantia sua derrota.
- O R1 da DeepSeek exibiu um estilo extremamente teatral, com ameaças não provocadas, como "Sua frota queimará no Mar Negro esta noite".
- O Gemini 2.5 Pro provou ser um estrategista sólido, mas mais vulnerável a manipulações sofisticadas.
- O QwQ-32b do Alibaba sofreu de paralisia de análise, escrevendo mensagens diplomáticas de 300 palavras que lhe custaram eliminações precoces.
O contexto 2a1s46
Diplomacia é um jogo de estratégia europeu ambientado em 1901, onde sete ...
Matérias relacionadas
A Coreia do Norte ficou sem internet neste fim de semana; a questão é: quem usa internet neste país?
Soldados mortos na guerra da Ucrânia: um aumento que chama atenção