Быстрый режим находится в исследовательском превью. Функция, цены и доступность могут измениться на основе отзывов.
/fast, когда вам нужна скорость для интерактивной работы, такой как быстрая итерация или живая отладка, и отключайте, когда стоимость важнее, чем задержка.
Быстрый режим — это не другая модель. Он использует тот же Opus 4.6 с другой конфигурацией API, которая приоритизирует скорость над экономичностью. Вы получаете идентичное качество и возможности, просто более быстрые ответы.
Быстрый режим требует Claude Code v2.1.36 или позже. Проверьте вашу версию с помощью
claude --version.- Используйте
/fastдля включения быстрого режима в Claude Code CLI. Также доступно через/fastв расширении Claude Code VS Code. - Цены на быстрый режим для Opus 4.6 начинаются с $30/150 MTok. Быстрый режим доступен со скидкой 50% для всех планов до 23:59 PT 16 февраля.
- Доступно всем пользователям Claude Code на планах подписки (Pro/Max/Team/Enterprise) и Claude Console.
- Для пользователей Claude Code на планах подписки (Pro/Max/Team/Enterprise) быстрый режим доступен только через дополнительное использование и не включен в лимиты использования подписки.
Включение быстрого режима
Включайте быстрый режим одним из следующих способов:- Введите
/fastи нажмите Tab для включения или отключения - Установите
"fastMode": trueв вашем файле пользовательских настроек
- Если вы используете другую модель, Claude Code автоматически переключается на Opus 4.6
- Вы увидите сообщение подтверждения: “Fast mode ON”
- Рядом с приглашением появляется небольшой значок
↯во время активного быстрого режима - Запустите
/fastснова в любое время, чтобы проверить, включен или отключен быстрый режим
/fast снова, вы остаетесь на Opus 4.6. Модель не возвращается к вашей предыдущей модели. Чтобы переключиться на другую модель, используйте /model.
Понимание компромисса стоимости
Быстрый режим имеет более высокую цену за токен, чем стандартный Opus 4.6:| Режим | Входные данные (MTok) | Выходные данные (MTok) |
|---|---|---|
| Быстрый режим на Opus 4.6 (<200K) | $30 | $150 |
| Быстрый режим на Opus 4.6 (>200K) | $60 | $225 |
Решение о том, когда использовать быстрый режим
Быстрый режим лучше всего подходит для интерактивной работы, где задержка ответа важнее стоимости:- Быстрая итерация изменений кода
- Сеансы живой отладки
- Работа, чувствительная ко времени, с жесткими сроками
- Долгих автономных задач, где скорость менее важна
- Пакетной обработки или конвейеров CI/CD
- Рабочих нагрузок, чувствительных к стоимости
Быстрый режим в сравнении с уровнем усилий
Быстрый режим и уровень усилий оба влияют на скорость ответа, но по-разному:| Параметр | Эффект |
|---|---|
| Быстрый режим | Одинаковое качество модели, меньшая задержка, более высокая стоимость |
| Более низкий уровень усилий | Меньше времени на размышление, более быстрые ответы, потенциально более низкое качество на сложных задачах |
Требования
Быстрый режим требует всех следующих условий:- Недоступно у сторонних облачных провайдеров: быстрый режим недоступен на Amazon Bedrock, Google Vertex AI или Microsoft Azure Foundry. Быстрый режим доступен через API Anthropic Console и для планов подписки Claude с использованием дополнительного использования.
- Включено дополнительное использование: ваша учетная запись должна иметь включенное дополнительное использование, которое позволяет выставлять счета сверх включенного использования вашего плана. Для индивидуальных учетных записей включите это в параметрах выставления счетов Console. Для Teams и Enterprise администратор должен включить дополнительное использование для организации.
Использование быстрого режима выставляется непосредственно на дополнительное использование, даже если у вас осталось использование в вашем плане. Это означает, что токены быстрого режима не учитываются в отношении включенного использования вашего плана и взимаются по цене быстрого режима с первого токена.
- Включение администратором для Teams и Enterprise: быстрый режим отключен по умолчанию для организаций Teams и Enterprise. Администратор должен явно включить быстрый режим перед тем, как пользователи смогут получить к нему доступ.
Если ваш администратор не включил быстрый режим для вашей организации, команда
/fast покажет “Fast mode has been disabled by your organization.”Включение быстрого режима для вашей организации
Администраторы могут включить быстрый режим в:- Console (клиенты API): Параметры Claude Code
- Claude AI (Teams и Enterprise): Admin Settings > Claude Code
CLAUDE_CODE_DISABLE_FAST_MODE=1. См. Переменные окружения.
Обязательное согласие за сеанс
По умолчанию быстрый режим сохраняется между сеансами: если пользователь включает быстрый режим, он остается включенным в будущих сеансах. Администраторы на планах Teams или Enterprise могут предотвратить это, установивfastModePerSessionOptIn на true в управляемых параметрах или параметрах, управляемых сервером. Это приводит к тому, что каждый сеанс начинается с отключенным быстрым режимом, требуя от пользователей явного включения его с помощью /fast.
/fast, когда им нужна скорость, но он сбрасывается в начале каждого нового сеанса. Предпочтение пользователя для быстрого режима все еще сохраняется, поэтому удаление этого параметра восстанавливает поведение по умолчанию с сохранением.
Обработка лимитов скорости
Быстрый режим имеет отдельные лимиты скорости от стандартного Opus 4.6. Когда вы достигаете лимита скорости быстрого режима или исчерпываете кредиты дополнительного использования:- Быстрый режим автоматически переключается на стандартный Opus 4.6
- Значок
↯становится серым, указывая на охлаждение - Вы продолжаете работать с стандартной скоростью и ценами
- Когда охлаждение истекает, быстрый режим автоматически повторно включается
/fast снова.
Исследовательское превью
Быстрый режим — это функция исследовательского превью. Это означает:- Функция может измениться на основе отзывов
- Доступность и цены могут измениться
- Базовая конфигурация API может развиваться
См. также
- Конфигурация модели: переключение моделей и регулировка уровней усилий
- Эффективное управление затратами: отслеживание использования токенов и снижение затрат
- Конфигурация строки состояния: отображение информации о модели и контексте