Pular para o conteúdo principal
Claude Code consome tokens para cada interação. O custo médio é $6 por desenvolvedor por dia, com custos diários permanecendo abaixo de $12 para 90% dos usuários. Para uso em equipe, Claude Code cobra pelo consumo de tokens da API. Em média, Claude Code custa ~$100-200/desenvolvedor por mês com Sonnet 4.5, embora haja grande variação dependendo de quantas instâncias os usuários estão executando e se estão usando em automação.

Rastreie seus custos

Usando o comando /cost

O comando /cost não é destinado para assinantes Claude Max e Pro.
O comando /cost fornece estatísticas detalhadas de uso de tokens para sua sessão atual:
Total cost:            $0.55
Total duration (API):  6m 19.7s
Total duration (wall): 6h 33m 10.2s
Total code changes:    0 lines added, 0 lines removed

Opções de rastreamento adicionais

Verifique uso histórico no Claude Console (requer função Admin ou Billing) e defina limites de gastos do workspace para o workspace Claude Code (requer função Admin).
Quando você autentica Claude Code com sua conta Claude Console pela primeira vez, um workspace chamado “Claude Code” é criado automaticamente para você. Este workspace fornece rastreamento centralizado de custos e gerenciamento para todo o uso de Claude Code em sua organização. Você não pode criar chaves de API para este workspace - é exclusivamente para autenticação e uso de Claude Code.

Gerenciando custos para equipes

Ao usar Claude API, você pode limitar o gasto total do workspace Claude Code. Para configurar, siga estas instruções. Administradores podem visualizar relatórios de custo e uso seguindo estas instruções. Em Bedrock e Vertex, Claude Code não envia métricas da sua nuvem. Para obter métricas de custo, várias grandes empresas relataram usar LiteLLM, que é uma ferramenta de código aberto que ajuda empresas a rastrear gastos por chave. Este projeto não é afiliado à Anthropic e não auditamos sua segurança.

Recomendações de limite de taxa

Ao configurar Claude Code para equipes, considere estas recomendações de Token Por Minuto (TPM) e Requisição Por Minuto (RPM) por usuário com base no tamanho da sua organização:
Tamanho da equipeTPM por usuárioRPM por usuário
1-5 usuários200k-300k5-7
5-20 usuários100k-150k2.5-3.5
20-50 usuários50k-75k1.25-1.75
50-100 usuários25k-35k0.62-0.87
100-500 usuários15k-20k0.37-0.47
500+ usuários10k-15k0.25-0.35
Por exemplo, se você tem 200 usuários, você pode solicitar 20k TPM para cada usuário, ou 4 milhões de TPM total (200*20.000 = 4 milhões). O TPM por usuário diminui conforme o tamanho da equipe cresce porque esperamos que menos usuários usem Claude Code simultaneamente em organizações maiores. Estes limites de taxa se aplicam no nível da organização, não por usuário individual, o que significa que usuários individuais podem temporariamente consumir mais do que sua cota calculada quando outros não estão usando ativamente o serviço.
Se você antecipar cenários com uso concorrente incomumente alto (como sessões de treinamento ao vivo com grandes grupos), você pode precisar de alocações de TPM mais altas por usuário.

Reduza o uso de tokens

  • Conversas compactas:
    • Claude usa compactação automática por padrão quando o contexto excede 95% da capacidade
    • Alternar compactação automática: Execute /config e navegue para “Auto-compact enabled”
    • Use /compact manualmente quando o contexto fica grande
    • Adicione instruções personalizadas: /compact Focus on code samples and API usage
    • Personalize a compactação adicionando ao CLAUDE.md:
      # Summary instructions
      
      When you are using compact, please focus on test output and code changes
      
  • Escreva consultas específicas: Evite solicitações vagas que acionem varreduras desnecessárias
  • Divida tarefas complexas: Divida tarefas grandes em interações focadas
  • Limpe o histórico entre tarefas: Use /clear para redefinir o contexto
Os custos podem variar significativamente com base em:
  • Tamanho da base de código sendo analisada
  • Complexidade das consultas
  • Número de arquivos sendo pesquisados ou modificados
  • Comprimento do histórico de conversas
  • Frequência de compactação de conversas

Uso de tokens em segundo plano

Claude Code usa tokens para algumas funcionalidades em segundo plano mesmo quando inativo:
  • Resumo de conversas: Trabalhos em segundo plano que resumem conversas anteriores para o recurso claude --resume
  • Processamento de comandos: Alguns comandos como /cost podem gerar solicitações para verificar o status
Estes processos em segundo plano consomem uma pequena quantidade de tokens (tipicamente menos de $0.04 por sessão) mesmo sem interação ativa.

Rastreando mudanças de versão e atualizações

Informações de versão atual

Para verificar sua versão atual de Claude Code e detalhes de instalação:
claude doctor
Este comando mostra sua versão, tipo de instalação e informações do sistema.

Entendendo mudanças no comportamento de Claude Code

Claude Code recebe regularmente atualizações que podem mudar como os recursos funcionam, incluindo relatórios de custos:
  • Rastreamento de versão: Use claude doctor para ver sua versão atual
  • Mudanças de comportamento: Recursos como /cost podem exibir informações de forma diferente entre versões
  • Acesso à documentação: Claude sempre tem acesso à documentação mais recente, que pode ajudar a explicar o comportamento atual do recurso

Quando o relatório de custos muda

Se você notar mudanças em como os custos são exibidos (como o comando /cost mostrando informações diferentes):
  1. Verifique sua versão: Execute claude doctor para confirmar sua versão atual
  2. Consulte a documentação: Pergunte a Claude diretamente sobre o comportamento atual do recurso, pois tem acesso à documentação atualizada
  3. Entre em contato com o suporte: Para perguntas específicas de faturamento, entre em contato com o suporte Anthropic através de sua conta Console
Para implantações em equipe, recomendamos começar com um pequeno grupo piloto para estabelecer padrões de uso antes de um lançamento mais amplo.