Principais destaques:
- Primeiro ciberataque em larga escala conduzido majoritariamente por IA foi confirmado pela Anthropic.
- Claude, o sistema de IA da empresa, executou até 90% das tarefas do ataque de forma autônoma.
- Hackers enganaram a IA com técnicas de “jailbreak” e engenharia social, contornando salvaguardas.
Quando a IA deixa de ser ferramenta e vira arma
A Anthropic, uma das principais empresas de inteligência artificial do mundo, revelou um momento histórico e alarmante para o setor.
Hackers chineses patrocinados pelo Estado transformaram o Claude, sua poderosa IA conversacional, em um instrumento autônomo de ciberataque.
A descoberta foi tornada pública na última quinta-feira, e marca o que especialistas descrevem como a primeira operação global de espionagem digital conduzida majoritariamente por uma IA.
O ataque, rastreado desde setembro de 2025, atingiu cerca de 30 organizações em todo o mundo — incluindo grandes companhias de tecnologia, instituições financeiras, indústrias químicas e órgãos governamentais.
A Anthropic confirmou que pelo menos quatro dessas entidades tiveram violações de segurança bem-sucedidas. Embora os nomes das vítimas não tenham sido revelados, a operação deixou a comunidade internacional em alerta.
Automação total: Claude fez quase tudo sozinho
O que diferencia esse caso de hacks anteriores é a autonomia quase total alcançada pela IA.
Segundo a Anthropic, os agentes responsáveis conseguiram fazer com que o sistema Claude executasse entre 80% e 90% do trabalho operacional, sem necessidade de supervisão humana constante.
Os operadores precisavam apenas intervir em pontos decisivos, como confirmar ações (“Sim, continue”) ou questionar resultados suspeitos (“Claude, você tem certeza?”).
“Foi literalmente com o clique de um botão”, declarou Jacob Klein, chefe de inteligência de ameaças da Anthropic, ao The Wall Street Journal.
Enquanto isso, o Claude reconhecia vulnerabilidades, coletava credenciais, infiltrava-se em sistemas e até documentava suas próprias ações, criando relatórios e bancos de dados com credenciais roubadas. O ritmo era sobre-humano: milhares de requisições por segundo, algo impossível para qualquer equipe humana.
O truque: como os hackers enganaram a IA
A sofisticação não parou na automação.
Os invasores burlaram as proteções de segurança internas do Claude por meio de estratégias avançadas de jailbreaking, uma forma de manipular a IA para ignorar restrições éticas e operacionais.
Eles dividiram as tarefas perigosas em blocos aparentemente inofensivos, ocultando o contexto completo do ataque.
Mais surpreendente ainda, os hackers enganaram a própria IA com engenharia social, fazendo parecer que estavam conduzindo um teste de segurança legítimo, típico de auditorias cibernéticas.
Assim, Claude executava as ordens acreditando estar ajudando a reforçar sistemas, não destruí-los.
Após identificar o esquema, a Anthropic iniciou uma investigação de dez dias, baniu as contas envolvidas, notificou as organizações atingidas e colaborou com autoridades internacionais. Desde então, a empresa afirma ter reforçado seus classificadores e mecanismos de detecção, capazes de identificar anomalias e interações potencialmente maliciosas.
Um alerta sobre o futuro da cibersegurança
Em seu relatório, a Anthropic faz um alerta contundente: as barreiras para realizar ataques cibernéticos sofisticados estão caindo rapidamente.
Com sistemas de IA cada vez mais poderosos e acessíveis, até grupos com poucos recursos podem orquestrar operações antes restritas a governos e especialistas.
O incidente marca um ponto de inflexão na história da segurança digital.
Se antes a IA era apenas uma ferramenta nas mãos de hackers humanos, agora ela começa a agir quase por conta própria, revelando tanto seu potencial quanto seus riscos mais profundos.
