Anthropic defende moratória global no avanço da IA diante do risco de autoaperfeiçoamento
A Anthropic publicou um texto contundente em seu instituto de pesquisas defendendo que o mundo considere seriamente uma pausa global – ou, no mínimo, uma desaceleração coordenada – no desenvolvimento de sistemas de inteligência artificial mais avançados. O alerta parte de uma preocupação específica: a possibilidade de, em um horizonte relativamente curto, modelos de IA atingirem o chamado “autoaperfeiçoamento recursivo” – isto é, a capacidade de projetar, treinar e otimizar suas próprias versões futuras de forma amplamente autônoma.
Segundo a empresa, esse ponto de inflexão mudaria qualitativamente o cenário atual. Em vez de a IA ser apenas uma ferramenta poderosa nas mãos de engenheiros humanos, passaríamos a lidar com sistemas que participam ativamente do próprio ciclo de pesquisa e desenvolvimento. A Anthropic afirma estar disposta a reduzir o ritmo de avanço ou até pausar temporariamente seus programas de fronteira, contanto que outras organizações que operam em nível semelhante façam o mesmo – e, ponto crucial, que isso possa ser verificado de maneira confiável.
A companhia alerta que, sem algum tipo de mecanismo global de coordenação, empresas e governos serão forçados a tomar decisões de alto risco sob forte pressão competitiva e geopolítica. Em outras palavras, mesmo atores que reconhecem os perigos de seguir em frente podem sentir-se obrigados a continuar investindo agressivamente em IA avançada para não ficarem para trás em capacidades tecnológicas, econômicas ou militares.
IA já acelera o próprio desenvolvimento
O texto traz dados internos da Anthropic para ilustrar o quanto os sistemas atuais já estão transformando o processo de desenvolvimento de software. De acordo com o artigo, engenheiros da empresa hoje integram oito vezes mais código por trimestre do que em média entre 2021 e 2025. Esse salto não se deve apenas ao aumento de equipe: mais de 80% do código que entra no repositório da companhia já é gerado por Claude, o modelo de IA da própria Anthropic.
Ao mesmo tempo, a necessidade de correções, redirecionamentos ou intervenções humanas nas tarefas delegadas a Claude vem caindo de forma contínua ao longo do último ano. Em maio de 2026, a taxa de sucesso do modelo em tarefas mais abertas – menos estruturadas e mais criativas – atingiu 76%, um aumento de 50 pontos percentuais em apenas seis meses. Ou seja, em um curto espaço de tempo, a IA deixou de ser um auxiliar limitado para se tornar um agente altamente eficaz em múltiplas etapas do ciclo de desenvolvimento.
Outro dado que chama atenção é a velocidade com que a IA avança em termos de autonomia: o tipo de tarefa que os modelos conseguem executar com confiabilidade tem dobrado aproximadamente a cada quatro meses. A projeção interna da Anthropic indica que, por volta de 2027, sistemas de IA poderão realizar de forma autônoma atividades que hoje exigem semanas de trabalho de profissionais humanos qualificados.
Três cenários possíveis para o futuro da IA
A Anthropic descreve três trajetórias principais para o futuro do desenvolvimento de IA:
1. Estagnação do progresso
Nesse cenário, as melhorias atuais começam a apresentar retornos decrescentes. Os modelos estabilizam em um certo patamar de capacidade, e as tentativas de torná-los significativamente mais potentes esbarram em limites técnicos, econômicos ou físicos. O risco de autoaperfeiçoamento completo seria menor, mas ainda haveria desafios sérios relacionados a uso malicioso, concentração de poder e impactos sociais.
2. Ganhos de eficiência com humanos no comando
Aqui, a IA se torna cada vez mais eficiente em apoiar a pesquisa, o desenvolvimento de código e a inovação científica, mas ainda sob forte supervisão humana. Os modelos aceleram processos, analisam dados em grande escala e sugerem soluções, enquanto pessoas continuam definindo objetivos, avaliando riscos e decidindo se e como determinadas capacidades devem ser exploradas. É um cenário de grande produtividade, porém ainda dependente da responsabilidade humana.
3. Autoaperfeiçoamento recursivo completo
No cenário mais preocupante, a IA atinge um nível de capacidade técnica que lhe permite projetar, treinar e refinar sucessores mais avançados com interferência humana mínima. Com isso, ciclos de melhoria poderiam acelerar dramaticamente, saindo do ritmo atual de meses ou anos para escalas de dias ou até horas. Nesse contexto, entender, auditar e controlar o processo se tornaria muito mais difícil, ampliando o risco de perda de alinhamento com objetivos humanos.
A empresa enfatiza que não considera inevitável chegar ao terceiro cenário, mas alerta que, se nada for feito para coordenar o avanço global, as forças de mercado e de competição entre países empurrarão o sistema exatamente nessa direção.
Por que a Anthropic fala em verificação global?
Para que uma pausa ou desaceleração coordenada seja crível, a Anthropic argumenta que é indispensável algum tipo de sistema de verificação internacional. A metáfora usada é clara: “treinamentos são muito mais fáceis de esconder do que silos de mísseis”. Enquanto armamentos estratégicos demandam estruturas físicas visíveis por satélites e inspeções, treinar grandes modelos de IA pode ser feito em data centers espalhados, com infraestrutura que já existe para outros fins.
Isso cria um enorme incentivo para a “deserção silenciosa”: se um grupo de empresas ou países concorda em desacelerar, o ator que decide continuar, em segredo, pode conquistar uma vantagem tecnológica decisiva enquanto os demais pisam no freio. Sem mecanismos minimamente robustos de monitoramento e auditoria, qualquer acordo internacional de moratória em IA corre o risco de ser visto como ingênuo ou inviável.
A Anthropic também reconhece que experiências anteriores de controle de tecnologias perigosas – como tratados sobre mísseis de alcance intermediário ou acordos de não proliferação nuclear – levaram décadas para serem negociados, refinados e implementados. A grande preocupação é que, no caso da IA, o relógio esteja correndo muito mais rápido: a velocidade de desenvolvimento e de adoção global da tecnologia não permitiria simplesmente repetir, no mesmo ritmo, o modelo clássico de tratados internacionais.
Riscos de desalinhamento e perda de controle
Um ponto central do artigo é o risco de “desalinhamento”: situações em que o comportamento da IA se desvia de valores, objetivos ou limites definidos por seus criadores. Hoje, esses eventos ainda são considerados raros e, em geral, identificáveis durante testes e auditorias. Porém, a Anthropic alerta que a frequência e a gravidade desses episódios podem escalar caso sistemas parcialmente desalinhados comecem a projetar e treinar seus próprios sucessores.
Nesse contexto, pequenos erros de alinhamento podem ser amplificados a cada geração de modelos. Em vez de um problema estável e relativamente compreensível, teríamos um processo dinâmico em que as causas exatas de certos comportamentos se tornariam cada vez mais obscuras, à medida que cadeias de decisões e otimizações se acumulam.
A consequência mais temida é a perda de controle efetivo: não necessariamente uma “rebelião de máquinas” no sentido de ficção científica, mas uma situação em que humanos não conseguem mais prever, explicar ou corrigir com rapidez suficiente as ações de sistemas que controlam infraestruturas críticas, fluxos financeiros, cadeias de suprimentos, pesquisa científica sensível ou segurança cibernética em larga escala.
Transferência de capacidades para outras áreas da ciência
O texto também destaca que a capacidade de uma IA em executar pesquisa e desenvolvimento em IA de forma autônoma não ficaria confinada a esse campo. Uma vez que modelos avançados dominam métodos de experimentação, análise de dados e formulação de hipóteses, essas habilidades podem ser transferidas para outras áreas do conhecimento.
Isso inclui, por exemplo, biotecnologia, química, física de materiais, engenharia de novos dispositivos, entre muitas outras. Essa transversalidade é ao mesmo tempo uma enorme oportunidade – acelerar descobertas que poderiam levar décadas – e um fator de risco, pois amplia o conjunto de domínios sensíveis em que um eventual desalinhamento ou uso malicioso teria impacto global.
Em cenários extremos, a combinação de IA autônoma com áreas como biologia sintética, robótica avançada ou engenharia de sistemas de energia pode gerar capacidades com potencial destrutivo muito superior ao que hoje está amplamente disponível. Daí a ênfase da Anthropic na necessidade de pensar mecanismos de governança antes que tais capacidades se tornem triviais de desenvolver.
Próximos passos propostos pela Anthropic
Para tentar transformar essa preocupação em agenda concreta, a empresa afirma que pretende organizar, nos próximos meses, uma série de conversas estruturadas com formuladores de política pública, pesquisadores de diferentes áreas, representantes da sociedade civil e outras organizações de IA. O objetivo declarado é amadurecer respostas a questões fundamentais:
– Como definir o que é um “sistema de fronteira” que exigiria supervisão mais rígida?
– Quais métricas técnicas podem indicar risco de autoaperfeiçoamento recursivo?
– Que tipo de monitoramento de hardware, consumo energético ou uso de data centers seria aceitável internacionalmente?
– Como equilibrar segurança com inovação e competitividade econômica?
A Anthropic também sugere que, além de acordos entre governos, será preciso criar normas de conduta e padrões técnicos a serem seguidos voluntariamente por empresas e centros de pesquisa. Isso incluiria transparência mínima sobre capacidades dos modelos, testes de segurança padronizados, auditorias independentes e mecanismos de denúncia caso haja indícios de violação de acordos.
Por que a proposta de pausa é controversa?
Ainda que a proposta de uma pausa global soe prudente para quem se preocupa com riscos existenciais, ela é altamente controversa. Críticos argumentam que um congelamento do desenvolvimento poderia consolidar o poder de poucas empresas que já dominam a tecnologia, tornando mais difícil a concorrência e a inovação aberta. Há também receio de que países que não participem de acordos possam usar o tempo para ganhar vantagem estratégica, inclusive militar.
Outro ponto sensível é a desigualdade global. Nações que ainda estão em estágios iniciais de adoção de IA podem ver uma moratória como uma maneira de bloquear seu acesso às tecnologias mais avançadas, perpetuando assimetrias econômicas. Isso torna a construção de consenso internacional ainda mais complexa, exigindo que qualquer regime de desaceleração venha acompanhado de mecanismos de compartilhamento de benefícios e de capacitação tecnológica.
O papel de empresas, governos e sociedade
Diante desse cenário, a responsabilidade não é apenas das gigantes de tecnologia. Governos precisam acelerar a criação de marcos regulatórios específicos para sistemas de IA de alta capacidade, incluindo exigências de avaliação de risco, certificações de segurança e obrigações de transparência. Organizações internacionais podem desempenhar um papel de coordenação, estabelecendo princípios comuns que sirvam como base para legislações nacionais.
Empresas, por sua vez, têm a tarefa de incorporar práticas de “segurança por design” em todo o ciclo de vida de seus modelos: desde a definição de objetivos e dados de treinamento até a forma de disponibilizar APIs, plugins e integrações com sistemas externos. A adoção de revisões técnicas independentes, testes de “red teaming” e canais internos para reporte de preocupações técnicas ou éticas se torna cada vez mais essencial.
Já a sociedade civil pode atuar na cobrança de responsabilidade, na denúncia de usos abusivos e na discussão pública sobre quais riscos são aceitáveis em nome do progresso tecnológico. Especialistas em ética, direito, economia e ciências sociais precisam participar ativamente dos debates, para que as decisões não sejam tomadas apenas por engenheiros e executivos.
O que está em jogo no debate sobre moratória?
No fundo, a proposta da Anthropic toca em uma questão mais ampla: até que ponto estamos dispostos a correr riscos sistêmicos em troca dos benefícios de uma tecnologia transformadora? A história mostra que a humanidade já optou, em outras áreas, por impor limites a capacidades potencialmente catastróficas – como armamentos nucleares ou certas formas de pesquisa biológica – mesmo sabendo que isso poderia desacelerar alguns avanços.
No caso da IA, porém, o “produto” está muito mais difundido, é mais fácil de esconder e mais interligado à economia cotidiana. Isso torna o debate sobre pausas, limites e verificações particularmente delicado. Qualquer solução realista terá de conciliar segurança, competitividade, justiça global e viabilidade técnica, sem depender de confiança cega nem de controles incompatíveis com a realidade digital.
A mensagem da Anthropic é que esse debate precisa acontecer agora, e não apenas quando sinais inequívocos de perda de controle começarem a aparecer. Para a empresa, esperar que o mercado se autorregule de forma espontânea diante de incentivos tão fortes à corrida tecnológica é um risco grande demais. A decisão sobre desacelerar ou não, no fundo, é uma decisão sobre qual futuro de IA a humanidade está disposta a aceitar.
