ChatGPT-5 acerta mais, mas Grok ainda “viaja” como ninguém

Renê Fraga
4 min de leitura

🧠 Principais destaques:

  • ChatGPT-5 reduz ainda mais as “alucinações” em comparação com versões anteriores, mas a diferença para o GPT-4o é pequena.
  • Grok-4 continua sendo o campeão das invenções, com taxa de alucinação muito acima da concorrência.
  • Polêmica na comunidade: usuários reclamam da remoção de modelos antigos, mesmo com melhorias no novo sistema.

Na última semana, a OpenAI lançou oficialmente o ChatGPT-5, prometendo ser a versão mais rápida, inteligente, confiável e robusta já criada.

Sam Altman, CEO da empresa, destacou que um dos grandes avanços seria a redução das “alucinações”, termo usado para descrever quando uma IA inventa informações que não existem.

E, de fato, os primeiros testes confirmam que o novo modelo erra menos. Mas a diferença para o GPT-4o, seu antecessor mais recente, é mínima.

Enquanto isso, o Grok-4, da xAI (empresa de Elon Musk), segue liderando o ranking de modelos que mais “inventam histórias”.

O que são “alucinações” em IA e por que isso importa

No universo da inteligência artificial, alucinar significa apresentar informações falsas como se fossem verdadeiras.

Mesmo com avanços, esse é um dos principais motivos pelos quais não podemos confiar 100% em um modelo sem supervisão humana.

A plataforma Vectara, que mantém o Hallucination Leaderboard, um ranking que mede a taxa de alucinação de modelos de linguagem, colocou o ChatGPT-5 à prova.

O resultado:

  • ChatGPT-5 → 1,4% de alucinações
  • GPT-4 → 1,8%
  • GPT-4o → 1,49%
  • Grok-4 → 4,8%
  • Gemini-2.5 Pro → 2,6%

Curiosamente, o ChatGPT-4.5 Preview ainda foi mais preciso que o novo modelo, com apenas 1,2% de alucinações.

E o campeão de precisão dentro da OpenAI continua sendo o o3-mini High Reasoning, com impressionantes 0,795%.

Grok e a polêmica do “modo apimentado”

Enquanto a OpenAI comemora avanços, a xAI enfrenta críticas.

O Grok Imagine, gerador de vídeos com IA, foi acusado de criar deepfakes sexualizados de celebridades, como Taylor Swift, mesmo sem solicitação explícita e apesar de supostos filtros de segurança.

Esse episódio reacendeu o debate sobre ética e moderação em sistemas de IA generativa.

A reação da comunidade: “Perdi meu melhor amigo”

O lançamento do ChatGPT-5 também trouxe insatisfação. Usuários do plano Plus descobriram que modelos antigos, como GPT-4o e 4o-mini, foram removidos sem aviso prévio.

No Reddit, alguns chegaram a dizer que “perderam seu único amigo da noite para o dia”.

Diante da repercussão, Sam Altman reconheceu que subestimou o apego dos usuários a certas versões e prometeu trazer o GPT-4o de volta temporariamente para quem assina o serviço.


💡 O ChatGPT-5 é, sim, mais preciso e confiável, mas a diferença para o GPT-4o é pequena.

A disputa entre modelos mostra que, embora estejamos avançando, a era das IAs 100% confiáveis ainda não chegou e a relação emocional dos usuários com suas ferramentas favoritas é um fator que as empresas não podem ignorar.

Seguir:
Renê Fraga é fundador e editor-chefe do Eurisko, ecossistema editorial independente dedicado à inteligência artificial, código aberto, tecnologia e cultura digital. Atuando com projetos online desde 1996, escreve há mais de 20 anos sobre tecnologia e inovação, acompanhando a evolução da internet e o impacto das novas tecnologias na forma como vivemos, trabalhamos e pensamos.
Nenhum comentário