El modo rápido está en vista previa de investigación. La función, los precios y la disponibilidad pueden cambiar según los comentarios.
/fast cuando necesites velocidad para trabajo interactivo como iteración rápida o depuración en vivo, y desactívalo cuando el costo sea más importante que la latencia.
El modo rápido no es un modelo diferente. Utiliza Claude Opus con una configuración de API diferente que prioriza la velocidad sobre la eficiencia de costos. Obtienes la misma calidad y capacidades con respuestas más rápidas. El modo rápido es compatible con Opus 4.8, Opus 4.7 y Opus 4.6. No está disponible en Sonnet, Haiku u otros modelos.
El modo rápido requiere Claude Code v2.1.36 o posterior. Verifica tu versión con
claude --version.- Usa
/fastpara activar o desactivar el modo rápido en Claude Code CLI. El modo rápido no es compatible con la extensión VS Code. - Los precios del modo rápido son $10/$50 MTok en Opus 4.8 y $30/$150 MTok en Opus 4.7 y Opus 4.6.
- Disponible para todos los usuarios de Claude Code en planes de suscripción (Pro/Max/Team/Enterprise) y Claude Console.
- Para los usuarios de Claude Code en planes de suscripción (Pro/Max/Team/Enterprise), el modo rápido está disponible solo a través de créditos de uso y no está incluido en los límites de velocidad de la suscripción.
Activar el modo rápido
Activa el modo rápido de cualquiera de estas formas:- Escribe
/fasty presiona Tab para activar o desactivar - Establece
"fastMode": trueen tu archivo de configuración de usuario
- Si estás en un modelo diferente, Claude Code cambia automáticamente a Opus
- Verás un mensaje de confirmación: “Fast mode ON”
- Un pequeño icono
↯aparece junto al prompt mientras el modo rápido está activo - Ejecuta
/fastnuevamente en cualquier momento para verificar si el modo rápido está activado o desactivado
/fast nuevamente, permaneces en Opus. El modelo no revierte a tu modelo anterior. Para cambiar a un modelo diferente, usa /model.
Opus 4.8 es el valor predeterminado del modo rápido en Claude Code v2.1.154 y posterior. En v2.1.142 a v2.1.153, el modo rápido utiliza Opus 4.7 de forma predeterminada.
Comprender la compensación de costos
El modo rápido tiene precios por token más altos que el Opus estándar, con el multiplicador variando según el modelo:| Modelo | Entrada (MTok) | Salida (MTok) |
|---|---|---|
| Opus 4.8 | $10 | $50 |
| Opus 4.7 y Opus 4.6 | $30 | $150 |
Decidir cuándo usar el modo rápido
El modo rápido es mejor para trabajo interactivo donde la latencia de respuesta es más importante que el costo:- Iteración rápida en cambios de código
- Sesiones de depuración en vivo
- Trabajo sensible al tiempo con plazos ajustados
- Tareas autónomas largas donde la velocidad importa menos
- Procesamiento por lotes o canalizaciones CI/CD
- Cargas de trabajo sensibles al costo
Modo rápido versus nivel de esfuerzo
El modo rápido y el nivel de esfuerzo afectan la velocidad de respuesta, pero de manera diferente:| Configuración | Efecto |
|---|---|
| Modo rápido | Misma calidad de modelo, latencia más baja, costo más alto |
| Nivel de esfuerzo más bajo | Menos tiempo de pensamiento, respuestas más rápidas, calidad potencialmente más baja en tareas complejas |
Requisitos
El modo rápido requiere todos los siguientes:- Solo API de Anthropic o suscripción: el modo rápido está disponible a través de la API de Anthropic Console y para planes de suscripción de Claude usando créditos de uso. No está disponible en Amazon Bedrock, Google Vertex AI, Microsoft Azure Foundry o Claude Platform en AWS.
- Créditos de uso activados: su cuenta debe tener los créditos de uso activados, lo que permite facturación más allá del uso incluido en su plan. Para cuentas individuales, active esto en su configuración de facturación de Console. Para Team y Enterprise, un administrador debe activar los créditos de uso para la organización.
El uso del modo rápido se extrae directamente de los créditos de uso, incluso si tiene uso restante en su plan. Esto significa que los tokens del modo rápido no cuentan contra el uso incluido en su plan y se cobran a la tarifa del modo rápido desde el primer token.
- Habilitación del administrador para Team y Enterprise: el modo rápido está deshabilitado de forma predeterminada para organizaciones Team y Enterprise. Un administrador debe habilitar explícitamente el modo rápido antes de que los usuarios puedan acceder a él.
Si su administrador no ha habilitado el modo rápido para su organización, el comando
/fast mostrará “Fast mode has been disabled by your organization.”Habilitar el modo rápido para su organización
Los administradores pueden habilitar el modo rápido en:- Console (clientes de API): Preferencias de Claude Code
- Claude AI (Team y Enterprise): Admin Settings > Claude Code
CLAUDE_CODE_DISABLE_FAST_MODE=1. Consulte Variables de entorno.
Requerir opción de participación por sesión
De forma predeterminada, el modo rápido persiste entre sesiones: si un usuario habilita el modo rápido, permanece activado en futuras sesiones. Los administradores en planes Team o Enterprise pueden evitar esto estableciendofastModePerSessionOptIn en true en configuración administrada o configuración administrada por servidor. Esto hace que cada sesión comience con el modo rápido desactivado, requiriendo que los usuarios lo habiliten explícitamente con /fast.
/fast cuando necesiten velocidad, pero se reinicia al inicio de cada nueva sesión. La preferencia del modo rápido del usuario aún se guarda, por lo que eliminar esta configuración restaura el comportamiento persistente predeterminado.
Manejar límites de velocidad
El modo rápido tiene límites de velocidad separados del Opus estándar. El modo rápido en Opus 4.8, Opus 4.7 y Opus 4.6 comparten el mismo grupo de límite de velocidad: el uso en cualquiera de ellos se extrae de los mismos límites. Cuando alcanzas el límite de velocidad del modo rápido o se agotan tus créditos de uso:- El modo rápido automáticamente vuelve a velocidad estándar
- El icono
↯se vuelve gris para indicar enfriamiento - Continúas trabajando a velocidad y precios estándar
- Cuando expira el enfriamiento, el modo rápido se vuelve a habilitar automáticamente
/fast nuevamente.
Vista previa de investigación
El modo rápido es una función de vista previa de investigación. Esto significa:- La función puede cambiar según los comentarios
- La disponibilidad y los precios están sujetos a cambios
- La configuración de API subyacente puede evolucionar
Ver también
- Configuración de modelo: cambiar modelos y ajustar niveles de esfuerzo
- Gestionar costos de manera efectiva: rastrear el uso de tokens y reducir costos
- Configuración de línea de estado: mostrar información de modelo y contexto