Saltar al contenido principal
Claude Code consume tokens en cada interacción. El costo promedio es de $6 por desarrollador por día, con costos diarios que se mantienen por debajo de $12 para el 90% de los usuarios. Para uso en equipo, Claude Code cobra por consumo de tokens de API. En promedio, Claude Code cuesta ~$100-200/desarrollador por mes con Sonnet 4.5, aunque hay una gran variación dependiendo de cuántas instancias están ejecutando los usuarios y si la están usando en automatización.

Rastrear tus costos

Usando el comando /cost

El comando /cost no está destinado para suscriptores de Claude Max y Pro.
El comando /cost proporciona estadísticas detalladas de uso de tokens para tu sesión actual:
Total cost:            $0.55
Total duration (API):  6m 19.7s
Total duration (wall): 6h 33m 10.2s
Total code changes:    0 lines added, 0 lines removed

Opciones de rastreo adicionales

Consulta el uso histórico en la Consola de Claude (requiere rol de Admin o Billing) y establece límites de gasto del espacio de trabajo para el espacio de trabajo de Claude Code (requiere rol de Admin).
Cuando autentiques por primera vez Claude Code con tu cuenta de Claude Console, se crea automáticamente un espacio de trabajo llamado “Claude Code” para ti. Este espacio de trabajo proporciona rastreo y gestión centralizada de costos para todo el uso de Claude Code en tu organización. No puedes crear claves de API para este espacio de trabajo - es exclusivamente para autenticación y uso de Claude Code.

Gestionar costos para equipos

Cuando uses Claude API, puedes limitar el gasto total del espacio de trabajo de Claude Code. Para configurar, sigue estas instrucciones. Los administradores pueden ver informes de costos y uso siguiendo estas instrucciones. En Bedrock y Vertex, Claude Code no envía métricas desde tu nube. Para obtener métricas de costos, varias grandes empresas reportaron usar LiteLLM, que es una herramienta de código abierto que ayuda a las empresas a rastrear gastos por clave. Este proyecto no está afiliado con Anthropic y no hemos auditado su seguridad.

Recomendaciones de límite de velocidad

Al configurar Claude Code para equipos, considera estas recomendaciones de Tokens Por Minuto (TPM) y Solicitudes Por Minuto (RPM) por usuario basadas en el tamaño de tu organización:
Tamaño del equipoTPM por usuarioRPM por usuario
1-5 usuarios200k-300k5-7
5-20 usuarios100k-150k2.5-3.5
20-50 usuarios50k-75k1.25-1.75
50-100 usuarios25k-35k0.62-0.87
100-500 usuarios15k-20k0.37-0.47
500+ usuarios10k-15k0.25-0.35
Por ejemplo, si tienes 200 usuarios, podrías solicitar 20k TPM para cada usuario, o 4 millones de TPM totales (200*20,000 = 4 millones). El TPM por usuario disminuye a medida que crece el tamaño del equipo porque esperamos que menos usuarios usen Claude Code concurrentemente en organizaciones más grandes. Estos límites de velocidad se aplican a nivel de organización, no por usuario individual, lo que significa que los usuarios individuales pueden consumir temporalmente más que su parte calculada cuando otros no están usando activamente el servicio.
Si anticipas escenarios con uso concurrente inusualmente alto (como sesiones de capacitación en vivo con grupos grandes), es posible que necesites asignaciones de TPM más altas por usuario.

Reducir el uso de tokens

  • Conversaciones compactas:
    • Claude usa compactación automática por defecto cuando el contexto excede el 95% de capacidad
    • Alternar compactación automática: Ejecuta /config y navega a “Auto-compact enabled”
    • Usa /compact manualmente cuando el contexto se vuelve grande
    • Añade instrucciones personalizadas: /compact Focus on code samples and API usage
    • Personaliza la compactación añadiendo a CLAUDE.md:
      # Summary instructions
      
      When you are using compact, please focus on test output and code changes
      
  • Escribe consultas específicas: Evita solicitudes vagas que desencadenen escaneos innecesarios
  • Divide tareas complejas: Divide tareas grandes en interacciones enfocadas
  • Borra el historial entre tareas: Usa /clear para restablecer el contexto
Los costos pueden variar significativamente según:
  • Tamaño de la base de código siendo analizada
  • Complejidad de las consultas
  • Número de archivos siendo buscados o modificados
  • Longitud del historial de conversación
  • Frecuencia de compactación de conversaciones

Uso de tokens en segundo plano

Claude Code usa tokens para algunas funcionalidades en segundo plano incluso cuando está inactivo:
  • Resumen de conversación: Trabajos en segundo plano que resumen conversaciones anteriores para la función claude --resume
  • Procesamiento de comandos: Algunos comandos como /cost pueden generar solicitudes para verificar el estado
Estos procesos en segundo plano consumen una pequeña cantidad de tokens (típicamente menos de $0.04 por sesión) incluso sin interacción activa.

Rastrear cambios de versión y actualizaciones

Información de versión actual

Para verificar tu versión actual de Claude Code y detalles de instalación:
claude doctor
Este comando muestra tu versión, tipo de instalación e información del sistema.

Entender cambios en el comportamiento de Claude Code

Claude Code recibe regularmente actualizaciones que pueden cambiar cómo funcionan las características, incluido el reporte de costos:
  • Rastreo de versión: Usa claude doctor para ver tu versión actual
  • Cambios de comportamiento: Características como /cost pueden mostrar información de manera diferente en diferentes versiones
  • Acceso a documentación: Claude siempre tiene acceso a la documentación más reciente, que puede ayudar a explicar el comportamiento actual de las características

Cuando cambia el reporte de costos

Si notas cambios en cómo se muestran los costos (como el comando /cost mostrando información diferente):
  1. Verifica tu versión: Ejecuta claude doctor para confirmar tu versión actual
  2. Consulta la documentación: Pregunta a Claude directamente sobre el comportamiento actual de las características, ya que tiene acceso a documentación actualizada
  3. Contacta soporte: Para preguntas específicas de facturación, contacta al soporte de Anthropic a través de tu cuenta de Console
Para implementaciones en equipo, recomendamos comenzar con un pequeño grupo piloto para establecer patrones de uso antes de un despliegue más amplio.