Um guia técnico e pragmático para configurar sessões melhores, controlar custo e latência, usar adaptive thinking com critério e extrair mais resultado real do Claude Code

Recursos selecionados para complementar sua leitura

AI Developer
Engenheiro apaixonado por Inteligência Artificial aplicada a produtos reais. Conecto avanços em LLMs e modelos de linguagem com resultados práticos de negócio. Também mentoro desenvolvedores e criadores em programas ao vivo, podcasts e iniciativas de comunidade focadas em tecnologia inclusiva.
Checklist de 47 pontos para encontrar bugs, riscos de segurança e problemas de performance antes do lançamento.
Continue explorando tópicos similares

Muita gente tenta resolver tudo com um prompt melhor, quando o problema real é a escolha errada da skill. Este guia mostra o que são skills no Claude Code, por que elas importam tanto e como escolher a skill correta para obter resultados mais consistentes, seguros e úteis.

Quase todo time diz que está construindo agents, mas na prática entrega prompts longos com permissões demais. Este guia explica o que realmente define um agent, como projetar agents customizados com Claude Code e quando faz sentido evoluir para subagents, hooks, MCP, agent teams e Agent SDK.

Você está digitando as mesmas instruções que já deu centenas de vezes antes: - "Antes de fazer alterações, leia o arquivo primeiro" - "Execute os testes após cada alteração" - "Crie um commit git com mensagem descritiva" - "Certifique-se de seguir o estilo de código do projeto"
Templates testados em produção, usados por desenvolvedores. Economize semanas de setup no seu próximo projeto.
Consultorias modulares para founders e CTOs fracionados. Você recebe diagnóstico acionável e acompanhamento direto comigo.
2 vagas para consultorias no Q2
Quando a Anthropic publicou o artigo oficial "Best practices for using Claude Opus 4.7 with Claude Code" em 16 de abril de 2026, a mensagem principal era clara: Opus 4.7 ficou melhor para tarefas longas, ambíguas e agentic, mas o jeito de operá-lo no Claude Code também mudou.
Esse detalhe é o que muita gente ignora.
Toda vez que um modelo melhora em raciocínio, autonomia, uso de contexto e qualidade de código, o workflow ideal quase nunca continua igual. O erro mais comum é trocar o modelo e manter a operação antiga. A consequência vem rápido:
Então este artigo não é uma tradução do post da Anthropic. Ele é uma versão melhorada, ampliada e adaptada para desenvolvedores brasileiros, com uma preocupação que o texto original menciona, mas não explora com profundidade suficiente: trade-off operacional.
Em outras palavras, vamos falar não apenas sobre o que fazer, mas também sobre:
Claude Code.Também vou conectar o post oficial com outras documentações da Anthropic sobre:
CLAUDE.md;A tese aqui é direta:
Claude Opus 4.7 funciona melhor quando você para de tratá-lo como um copiloto que precisa de steering contínuo e começa a tratá-lo como um engenheiro forte que trabalha melhor com contexto inicial forte, autonomia condicionada e verificação explícita.
Se você entender isso, quase todo o resto passa a fazer sentido.
O artigo oficial da Anthropic destaca cinco mudanças centrais que importam para quem usa Claude Code de forma séria:
Opus 4.7 lida melhor com ambiguidade do que Opus 4.6.Claude Code passou a ser xhigh.Esses pontos parecem operacionais, mas na prática redefinem o workflow.
Antes, muita gente usava Claude Code como uma forma de pair programming extremamente assistido:
Com Opus 4.7, esse estilo continua funcionando, mas tende a ser menos eficiente. A Anthropic é explícita: em cenários interativos com muitos turns do usuário, o modelo pensa mais depois de cada turn. Isso ajuda coerência e qualidade em sessões longas, mas também aumenta consumo de tokens.
O ponto não é "não converse com o modelo". O ponto é outro:
quanto mais você fragmenta a tarefa em muitos turns humanos, mais overhead cognitivo e de tokens você injeta no processo.
Isso nos leva à primeira grande mudança de mentalidade.
No post oficial, a Anthropic recomenda tratar o Claude mais como um engenheiro competente a quem você delega um trabalho do que como um pair programmer guiado linha a linha.
Essa é uma das ideias mais importantes de todo o ecossistema de agentes hoje.
Não porque pair programming seja ruim. Mas porque pair programming com um modelo forte tende a desperdiçar justamente o que ele tem de mais valioso:
Se você faz steering demais cedo demais, você reduz o modelo a um executor de microcomandos. Isso diminui a alavanca.
Quando você dá um primeiro prompt mais completo, o modelo tende a:
Você também melhora a chance de o modelo entender algo que muita gente esquece de explicitar:
Só que existe um risco real: um primeiro turno mais completo pode virar um prompt inchado, confuso e mal priorizado.
Quando isso acontece, você troca falta de contexto por excesso de contexto irrelevante.
Então a recomendação correta não é "escreva prompts gigantes". A recomendação correta é:
escreva um primeiro turno estruturalmente completo e semanticamente enxuto.
Ou seja:
Objetivo:
Corrigir o bug de autenticação no refresh token sem regredir login normal.
Contexto:
- O problema acontece apenas em sessões expiradas.
- O fluxo passa por `src/auth/refresh.ts` e `src/middleware/session.ts`.
- Existe cobertura parcial em `tests/auth/refresh.spec.ts`.
Restrições:
- Não alterar o contrato público da API.
- Não remover testes existentes.
- Evitar criar novos arquivos, a menos que sejam realmente necessários.
Critérios de aceitação:
- Refresh inválido deve retornar 401.
- Refresh válido deve renovar a sessão corretamente.
- Testes relevantes devem passar.
Verificação:
- Leia os arquivos relevantes.
- Explique a causa raiz.
- Faça a correção.
- Rode os testes afetados.
- Resuma riscos residuais, se houver.
Isso é muito mais útil do que algo como:
Tem um bug de auth. Dá uma olhada?
O blog da Anthropic descreve um workflow implícito. Aqui está a versão operacional desse fluxo, convertida em um diagrama que serve melhor para times e uso real.
Esse fluxo é simples, mas contém quase tudo que importa:
O artigo oficial diz isso de forma direta: cada turn do usuário adiciona overhead de raciocínio.
Essa afirmação pode soar contraintuitiva para quem está acostumado a operar assistentes por refinamento sucessivo. Mas faz sentido.
Toda vez que você adiciona um novo turn, o modelo precisa:
Em modelos mais fortes, isso frequentemente melhora qualidade. Mas também custa mais.
Ela funciona especialmente bem em:
Ela funciona pior em:
Se você ainda está descobrindo o problema, interaja mais.
Se você já entendeu o problema e só precisa de execução forte, interaja menos.
No post oficial, a Anthropic recomenda auto mode quando você confia que o modelo pode executar com segurança sem check-ins frequentes. O atalho citado é Shift+Tab, que alterna modos de permissão no Claude Code.
Essa recomendação é importante, mas precisa vir com um aviso sério:
autonomia sem guardrail é uma forma elegante de criar retrabalho caro.
Auto mode não é "deixa a IA fazer tudo". Auto mode é:
Use com mais confiança em tarefas como:
Use com menos confiança em:
O verdadeiro segredo aqui é que auto mode não substitui verificação. Ele aumenta a necessidade dela.
Um detalhe aparentemente menor do post oficial é a sugestão de pedir ao Claude para tocar um som quando terminar a tarefa ou criar notificações baseadas em hooks.
Isso parece cosmético. Não é.
Em fluxos agentic longos, a fricção não vem apenas de custo ou latência. Vem também de coordenação humana.
Se você precisa ficar olhando a sessão o tempo inteiro para descobrir quando ela terminou, você perde parte do ganho de autonomia.
Use notificações como melhoria de ergonomia, não como proxy de qualidade.
Notificação significa:
"o agente acha que terminou".
Não significa:
"o trabalho está certo".
O post da Anthropic introduz um ponto operacional importante: no Claude Code, o effort padrão de Opus 4.7 agora é xhigh.
Esse detalhe importa muito porque effort não é apenas uma questão de rapidez. Ele altera a relação entre:
| Effort | Melhor uso | Principal vantagem | Principal risco |
|---|---|---|---|
low | tarefas simples e baratas | resposta rápida e econômica | subperformar em problemas difíceis |
medium | trabalho bem delimitado | bom custo-benefício | pode faltar profundidade em debugging e arquitetura |
high | equilíbrio entre custo e inteligência | bom para sessões concorrentes | pode perder qualidade frente a xhigh em tarefas ambíguas |
xhigh | trabalho agentic e coding de alta exigência | melhor default geral para Opus 4.7 | ainda pode ser caro se o prompt for ruim |
max | problemas excepcionalmente difíceis | teto maior de performance | diminishing returns e overthinking |
xhigh virou o default mais sensatoA Anthropic recomenda xhigh para a maioria do trabalho agentic de coding, especialmente para:
Isso faz sentido porque xhigh parece ocupar o espaço mais útil entre dois extremos:
max.xhighxhighhighhighxhigh.maxmaxSe você não tem motivo forte para escolher outra coisa, comece em xhigh.
Se o job é barato, repetitivo ou muito delimitado, desça.
Se você está tentado a usar max por insegurança, provavelmente ainda faltou clareza no prompt, não effort.
Outro ponto importante do artigo oficial é que Opus 4.7 não suporta Extended Thinking com orçamento fixo de thinking. No lugar disso, ele usa adaptive thinking.
Em termos práticos, isso significa que o modelo decide quando vale a pena pensar mais em cada etapa.
Essa mudança é boa por um motivo simples: tarefas reais não têm dificuldade homogênea.
Dentro de uma mesma execução, pode haver partes que precisam de:
Um orçamento fixo de thinking tende a desperdiçar recursos em etapas que não precisam dele e a limitar etapas que precisariam.
O próprio artigo da Anthropic sugere prompting direto:
Isso é útil, mas precisa ser usado com cuidado.
Se você sempre pede "pense profundamente", você cria um workflow caro por reflexo, não por necessidade.
Se você sempre pede "responda rápido", você compra velocidade com queda de precisão em etapas difíceis.
Use instruções graduais:
Pense mais nas etapas de diagnóstico e decisão arquitetural.
Se uma etapa for apenas lookup, seja direto.
Priorize profundidade apenas onde houver ambiguidade, risco de regressão ou trade-off relevante.
Isso está mais alinhado ao espírito de adaptive thinking do que forçar um mesmo comportamento do início ao fim.
A Anthropic também diz que Opus 4.7 não é tão verboso por padrão quanto Opus 4.6. Ele tende a ajustar o tamanho da resposta à complexidade da tarefa.
Essa mudança é boa, mas tem implicações.
Não peça verbosidade sempre. Peça visibilidade quando ela importa.
Exemplo:
Depois de cada bloco relevante de trabalho, faça um resumo curto com:
- o que você mudou;
- por que mudou;
- como verificou;
- quais riscos permanecem.
Isso cria observabilidade melhor do que apenas dizer "seja detalhado".
Esse é um dos pontos mais relevantes para quem opera Claude Code de forma produtiva: Opus 4.7 tende a chamar menos ferramentas e raciocinar mais.
Isso pode ser excelente.
Também pode ser ruim.
Tudo depende da tarefa.
É vantagem quando:
É desvantagem quando:
Se você quer mais uso de ferramenta, diga isso.
Exemplo:
Antes de responder, leia explicitamente os arquivos relevantes e use busca para confirmar padrões semelhantes no código. Não conclua sem abrir as fontes de evidência.
Essa instrução simples reduz o risco de respostas elegantes e mal fundamentadas.
O post oficial também observa que Opus 4.7 tende a ser mais criterioso na delegação para subagentes.
Isso é bom porque subagentes em excesso geram teatro organizacional:
Mas também existe o lado oposto: algumas tarefas melhoram muito quando você explicita fan-out.
Se a tarefa se divide em trilhas independentes, explicite isso.
Se não se divide, não delegue só porque a infraestrutura permite.
O erro mais caro no uso de Opus 4.7 com Claude Code não é escolher o effort errado.
Também não é usar Auto Mode cedo demais.
O erro mais caro é:
misturar tarefa mal definida com autonomia alta e verificação fraca.
Isso cria o pior cenário possível:
É por isso que a documentação complementar da Anthropic insiste tanto em:
CLAUDE.md enxuto e útil;Se você quer aplicar as recomendações do artigo oficial de forma consistente, precisa entender onde CLAUDE.md entra.
A documentação da Anthropic é bastante clara: CLAUDE.md é memória carregada no início das sessões. Ou seja, ele deveria conter apenas o que é:
Isso quer dizer que CLAUDE.md não deveria ser:
Como o repositório deste projeto reserva o CLAUDE.md da raiz apenas como redirect de compatibilidade, criei um CLAUDE.md de exemplo dentro da pasta do artigo. A ideia é mostrar como um arquivo desses pode incorporar as melhores práticas discutidas aqui sem virar um peso morto no contexto.
A lógica por trás desse exemplo é simples:
xhigh é o default sensato para trabalho difícil, mas não o único.Aqui está a visão resumida mais útil para operação.
| Estratégia | Quando usar | Maior vantagem | Maior desvantagem |
|---|---|---|---|
| Especificar tudo no primeiro turno | trabalho bem definido | reduz desalinhamento e rework | pode virar prompt inchado |
| Reduzir turns do usuário | execução agentic | menos overhead de reasoning | menos checkpoints humanos |
| Auto Mode | tarefas seguras e verificáveis | acelera muito o ciclo | amplia dano de prompt ruim |
xhigh como default | coding difícil e ambíguo | melhor equilíbrio geral | custo desnecessário em tarefas pequenas |
| Adaptive thinking guiado | tarefas heterogêneas | aloca raciocínio melhor | menor previsibilidade explícita |
| Pedir mais tool use | investigação, auditoria, revisão | respostas mais fundamentadas | mais leituras, latência e custo |
| Pedir mais subagentes | fan-out independente | paralelismo com isolamento | coordenação extra |
Se você quer usar Claude Code com Opus 4.7 em time, a recomendação madura não é apenas mudar prompts individuais. É padronizar a operação.
Um workflow realista para equipes costuma ter esta forma:
Esse diagrama deixa visível um ponto crucial:
CLAUDE.md, subagentes, effort e Auto Mode não são features isoladas. Eles são peças de um mesmo sistema operacional de trabalho.
Mesmo com recomendações oficiais disponíveis, alguns erros continuam muito comuns.
max como sinal de seriedadeMuita gente acha que usar o maior effort sempre é a forma "profissional" de trabalhar. Não é.
Em vários casos, max é só uma forma cara de esconder um prompt ruim.
Se você dá dez microinstruções sequenciais para uma tarefa que poderia ter sido bem delegada no primeiro turno, você está pagando por coordenação desnecessária.
Autonomia é multiplicador. Ela multiplica tanto workflows bons quanto workflows ruins.
CLAUDE.mdA documentação da Anthropic alerta indiretamente para isso: contexto permanente demais vira ruído permanente.
Se a tarefa depende de evidência, pedir apenas "analise isso" pode não bastar. Diga para abrir arquivos, buscar padrões e verificar.
Subagente não é efeito especial. Se não existe ganho claro de isolamento ou paralelismo, ele só adiciona coordenação.
Use:
xhigh ou high, dependendo do risco;Evite:
max por ansiedade;Use:
xhigh se o diff for grande ou delicado;Evite:
Use:
xhigh como ponto de partida;Evite:
Use:
high ou xhigh;Evite:
max por padrão;O artigo oficial sugere ajustes. A documentação de prompting da Anthropic reforça a mesma direção. A forma mais útil de resumir isso é:
Esta e uma tarefa longa. Trabalhe de forma sistematica.
Antes de implementar:
- leia os arquivos relevantes;
- identifique a causa raiz ou o design existente;
- confirme as restricoes.
Durante a execucao:
- priorize mudancas pequenas e coerentes;
- nao remova testes;
- nao invente comportamento sem evidência no codigo.
Verificacao:
- rode os checks mais relevantes;
- se nao puder verificar algo, diga explicitamente.
Comunicacao:
- use respostas concisas;
- depois de etapas importantes, resuma o que mudou e o que ainda falta.
Esse tipo de prompt conversa muito melhor com o comportamento do Opus 4.7 do que prompts ansiosos e fragmentados.
Na maior parte dos cenários profissionais sérios, sim.
Especialmente se você trabalha com:
Mas vale a pena com uma condição:
você precisa aceitar que a operação ideal mudou.
Se a sua expectativa é usar Opus 4.7 exatamente como usava Opus 4.6, você provavelmente verá parte dos ganhos evaporar em custo e atrito.
Se eu tivesse que resumir tudo em um playbook curto, seria este:
xhigh para trabalho difícil.CLAUDE.md curto, estável e realmente útil.O texto da Anthropic sobre Claude Opus 4.7 com Claude Code é curto, mas importante. A leitura correta dele não é "use xhigh e pronto". A leitura correta é mais madura:
Opus 4.7 empurra o usuário para um workflow mais agentic, mais explícito e mais orientado por contexto inicial forte.
Isso traz vantagens reais:
Mas também traz exigências:
O ganho real não vem apenas do modelo novo. Vem do casamento entre:
É assim que Claude Code deixa de ser só um assistente impressionante e começa a funcionar como uma camada operacional real para trabalho de engenharia.