> ## Documentation Index
> Fetch the complete documentation index at: https://code.claude.com/docs/llms.txt
> Use this file to discover all available pages before exploring further.

# Эффективное управление затратами

> Отслеживайте использование токенов, устанавливайте лимиты расходов команды и снижайте затраты Claude Code с помощью управления контекстом, выбора модели, настроек расширенного мышления и предварительной обработки hooks.

Claude Code взимает плату в зависимости от потребления API токенов. Для информации о ценах плана подписки (Pro, Max, Team, Enterprise) см. [claude.com/pricing](https://claude.com/pricing). Затраты на разработчика сильно варьируются в зависимости от выбора модели, размера кодовой базы и паттернов использования, таких как запуск нескольких экземпляров или автоматизация.

В масштабах корпоративных развёртываний средняя стоимость составляет около \$13 на разработчика в активный день и \$150-250 на разработчика в месяц, при этом затраты остаются ниже \$30 в активный день для 90% пользователей. Чтобы оценить расходы для вашей команды, начните с небольшой пилотной группы и используйте инструменты отслеживания ниже для установления базовой линии перед более широким развёртыванием.

На этой странице рассматривается, как [отслеживать ваши затраты](#track-your-costs), [управлять затратами для команд](#managing-costs-for-teams) и [снижать использование токенов](#reduce-token-usage).

<h2 id="track-your-costs">
  Отслеживание ваших затрат
</h2>

<h3 id="using-the-/usage-command">
  Использование команды `/usage`
</h3>

<Note>
  Блок Session в `/usage` показывает использование API токенов и предназначен для пользователей API. Подписчики Claude Max и Pro имеют использование, включённое в их подписку, поэтому цифра стоимости сессии не имеет отношения к целям выставления счётов. Подписчики видят полосы использования плана, статистику активности и разбивку использования на том же экране.
</Note>

Блок Session в верхней части `/usage` показывает подробную статистику использования токенов для вашей текущей сессии. Цифра в долларах — это оценка, вычисленная локально на основе количества токенов и может отличаться от вашего фактического счёта. Для авторитетного выставления счётов см. страницу Usage в [Claude Console](https://platform.claude.com/usage).

```text theme={null}
Total cost:            $0.55
Total duration (API):  6m 19.7s
Total duration (wall): 6h 33m 10.2s
Total code changes:    0 lines added, 0 lines removed
```

На плане Pro, Max, Team или Enterprise команда `/usage` также показывает разбивку того, что учитывается в пределах вашего плана. Она относит недавнее использование к skills, subagents, plugins и отдельным MCP серверам, каждый из которых показан в процентах от общего объёма. Нажмите `d` или `w` для переключения между последними 24 часами и последними 7 днями. Цифры являются приблизительными и вычисляются из локальной истории сессии на этом устройстве, поэтому использование с других устройств или claude.ai не включено.

В [расширении VS Code](/ru/vs-code#check-account-and-usage) та же разбивка появляется в диалоговом окне Account & usage с переключателем Day и Week. Требуется Claude Code v2.1.174 или более поздняя версия.

<h2 id="managing-costs-for-teams">
  Управление затратами для команд
</h2>

При использовании Claude API вы можете [установить лимиты расходов рабочего пространства](https://platform.claude.com/docs/ru/build-with-claude/workspaces#workspace-limits) на общие расходы Claude Code рабочего пространства. Администраторы могут [просматривать отчёты о затратах и использовании](https://platform.claude.com/docs/ru/build-with-claude/workspaces#usage-and-cost-tracking) в Console.

На планах Pro и Max вы можете установить ежемесячный лимит расходов на кредиты использования с помощью команды `/usage-credits`. Если вы достигнете этого лимита, пока у вас всё ещё есть доступные кредиты использования, Claude Code предложит вам увеличить или удалить лимит, чтобы вы могли продолжить работу без выхода из CLI. Изменение лимита требует доступа к биллингу на счёте.

<Note>
  Когда вы впервые аутентифицируете Claude Code с помощью своей учётной записи Claude Console, автоматически создаётся рабочее пространство под названием "Claude Code". Это рабочее пространство обеспечивает централизованное отслеживание и управление затратами для всего использования Claude Code в вашей организации. Вы не можете создавать API ключи для этого рабочего пространства; оно предназначено исключительно для аутентификации и использования Claude Code.

  Для организаций с пользовательскими ограничениями скорости трафик Claude Code в этом рабочем пространстве учитывается в общих ограничениях скорости API вашей организации. Вы можете установить [ограничение скорости рабочего пространства](https://platform.claude.com/docs/ru/api/rate-limits#setting-lower-limits-for-workspaces) на странице Limits этого рабочего пространства в Claude Console, чтобы ограничить долю Claude Code и защитить другие производственные рабочие нагрузки.
</Note>

На Bedrock, Vertex и Foundry Claude Code не отправляет метрики из вашего облака. Самостоятельно размещённый [Claude apps gateway](/ru/claude-apps-gateway) обеспечивает атрибуцию использования для каждого пользователя, метрики OTLP с подсчётом токенов и [лимиты расходов для каждого пользователя](/ru/claude-apps-gateway-spend-limits) на этих поставщиках. Организации, которые маршрутизируют Claude Code через другой [LLM gateway](/ru/llm-gateway), могут отслеживать расходы на шлюзе вместо этого, поскольку он видит каждый запрос.

<h3 id="rate-limit-recommendations">
  Рекомендации по ограничению скорости
</h3>

При настройке Claude Code для команд учитывайте эти рекомендации по Token Per Minute (TPM) и Request Per Minute (RPM) на пользователя в зависимости от размера вашей организации:

| Размер команды        | TPM на пользователя | RPM на пользователя |
| --------------------- | ------------------- | ------------------- |
| 1-5 пользователей     | 200k-300k           | 5-7                 |
| 5-20 пользователей    | 100k-150k           | 2.5-3.5             |
| 20-50 пользователей   | 50k-75k             | 1.25-1.75           |
| 50-100 пользователей  | 25k-35k             | 0.62-0.87           |
| 100-500 пользователей | 15k-20k             | 0.37-0.47           |
| 500+ пользователей    | 10k-15k             | 0.25-0.35           |

Например, если у вас есть 200 пользователей, вы можете запросить 20k TPM для каждого пользователя, или 4 миллиона общего TPM (200\*20,000 = 4 миллиона).

TPM на пользователя уменьшается по мере роста размера команды, потому что в более крупных организациях меньше пользователей, как правило, используют Claude Code одновременно. Эти ограничения скорости применяются на уровне организации, а не для отдельного пользователя, что означает, что отдельные пользователи могут временно потреблять больше, чем их рассчитанная доля, когда другие не активно используют сервис.

<Note>
  Если вы предполагаете сценарии с необычно высоким одновременным использованием (такие как живые сеансы обучения с большими группами), вам может потребоваться более высокое распределение TPM на пользователя.
</Note>

<h3 id="agent-team-token-costs">
  Затраты на токены команды агентов
</h3>

[Команды агентов](/ru/agent-teams) запускают несколько экземпляров Claude Code, каждый со своим собственным контекстным окном. Использование токенов масштабируется в зависимости от количества активных товарищей по команде и того, как долго каждый из них работает.

Чтобы сохранить затраты команды агентов управляемыми:

* Используйте Sonnet для товарищей по команде. Он обеспечивает баланс между возможностями и стоимостью для задач координации.
* Держите команды небольшими. Каждый товарищ по команде запускает своё собственное контекстное окно, поэтому использование токенов примерно пропорционально размеру команды.
* Держите spawn prompts сфокусированными. Товарищи по команде автоматически загружают CLAUDE.md, MCP servers и skills, но всё в spawn prompt добавляется к их контексту с самого начала.
* Очищайте команды после завершения работы. Активные товарищи по команде продолжают потреблять токены до тех пор, пока они не выйдут или сеанс не завершится.
* Команды агентов отключены по умолчанию. Установите `CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1` в вашем [settings.json](/ru/settings) или переменной окружения, чтобы включить их. См. [включение команд агентов](/ru/agent-teams#enable-agent-teams).

<h2 id="reduce-token-usage">
  Снижение использования токенов
</h2>

Затраты на токены масштабируются с размером контекста: чем больше контекста обрабатывает Claude, тем больше токенов вы используете. Claude Code автоматически оптимизирует затраты через [prompt caching](/ru/prompt-caching), что снижает затраты на повторяющееся содержимое, такое как системные prompts, и auto-compact, что суммирует историю разговора при приближении к лимитам контекста.

Следующие стратегии помогают вам сохранять контекст небольшим и снижать затраты на сообщение.

<h3 id="manage-context-proactively">
  Управление контекстом проактивно
</h3>

Используйте `/usage` для проверки текущего использования токенов или [настройте вашу строку состояния](/ru/statusline#context-window-usage) для непрерывного отображения.

* **Очищайте между задачами**: Используйте `/clear` для начала с чистого листа при переходе на несвязанную работу. Устаревший контекст тратит токены на каждое последующее сообщение. Используйте `/rename` перед очисткой, чтобы вы могли легко найти сессию позже, затем `/resume` для возврата к ней.
* **Добавляйте пользовательские инструкции компактирования**: `/compact Focus on code samples and API usage` говорит Claude, что сохранять во время суммирования.

Вы также можете настроить поведение компактирования в вашем CLAUDE.md:

```markdown theme={null}
# Compact instructions

When you are using compact, please focus on test output and code changes
```

<h3 id="choose-the-right-model">
  Выберите правильную модель
</h3>

Sonnet хорошо справляется с большинством задач кодирования и стоит дешевле, чем Opus. Зарезервируйте Opus для сложных архитектурных решений или многошаговых рассуждений. Используйте `/model` для переключения моделей в середине сессии или установите значение по умолчанию в `/config`. Для простых задач subagent укажите `model: haiku` в вашей [конфигурации subagent](/ru/sub-agents#choose-a-model).

<h3 id="reduce-mcp-server-overhead">
  Снижение накладных расходов MCP server
</h3>

Определения инструментов MCP [отложены по умолчанию](/ru/mcp#scale-with-mcp-tool-search), поэтому только имена инструментов входят в контекст до тех пор, пока Claude не использует конкретный инструмент. Запустите `/context` для просмотра того, что потребляет пространство.

* **Предпочитайте CLI инструменты, когда доступны**: Инструменты, такие как `gh`, `aws`, `gcloud` и `sentry-cli`, более эффективны по контексту, чем MCP servers, потому что они не добавляют никакой список инструментов. Claude может запускать CLI команды напрямую.
* **Отключайте неиспользуемые servers**: Запустите `/mcp` для просмотра настроенных servers и отключите любые, которые вы не активно используете.

<h3 id="install-code-intelligence-plugins-for-typed-languages">
  Установите плагины code intelligence для типизированных языков
</h3>

[Плагины code intelligence](/ru/discover-plugins#code-intelligence) дают Claude точную навигацию по символам вместо поиска на основе текста, снижая ненужные чтения файлов при изучении незнакомого кода. Один вызов "go to definition" заменяет то, что в противном случае могло бы быть grep, за которым следует чтение нескольких файлов-кандидатов. Установленные языковые серверы также автоматически сообщают об ошибках типов после редактирования, поэтому Claude ловит ошибки без запуска компилятора.

<h3 id="offload-processing-to-hooks-and-skills">
  Делегируйте обработку hooks и skills
</h3>

Пользовательские [hooks](/ru/hooks) могут предварительно обрабатывать данные перед тем, как Claude их увидит. Вместо того, чтобы Claude читал файл логов из 10,000 строк для поиска ошибок, hook может выполнить grep для `ERROR` и вернуть только совпадающие строки, снижая контекст с десятков тысяч токенов до сотен.

[Skill](/ru/skills) может дать Claude знание предметной области, чтобы ему не пришлось исследовать. Например, skill "codebase-overview" может описать архитектуру вашего проекта, ключевые директории и соглашения об именовании. Когда Claude вызывает skill, он получает этот контекст немедленно вместо того, чтобы тратить токены на чтение нескольких файлов для понимания структуры.

Например, этот hook PreToolUse фильтрует вывод тестов для отображения только сбоев:

<Tabs>
  <Tab title="settings.json">
    Добавьте это в ваш [settings.json](/ru/settings#settings-files) для запуска hook перед каждой командой Bash:

    ```json theme={null}
    {
      "hooks": {
        "PreToolUse": [
          {
            "matcher": "Bash",
            "hooks": [
              {
                "type": "command",
                "command": "~/.claude/hooks/filter-test-output.sh"
              }
            ]
          }
        ]
      }
    }
    ```
  </Tab>

  <Tab title="filter-test-output.sh">
    Hook вызывает этот скрипт, который проверяет, является ли команда тестовым бегуном, и изменяет её для отображения только сбоев:

    ```bash theme={null}
    #!/bin/bash
    input=$(cat)
    cmd=$(echo "$input" | jq -r '.tool_input.command')

    # If running tests, filter to show only failures
    if [[ "$cmd" =~ ^(npm test|pytest|go test) ]]; then
      filtered_cmd="$cmd 2>&1 | grep -A 5 -E '(FAIL|ERROR|error:)' | head -100"
      echo "{\"hookSpecificOutput\":{\"hookEventName\":\"PreToolUse\",\"permissionDecision\":\"allow\",\"updatedInput\":{\"command\":\"$filtered_cmd\"}}}"
    else
      echo "{}"
    fi
    ```
  </Tab>
</Tabs>

<h3 id="move-instructions-from-claude-md-to-skills">
  Переместите инструкции из CLAUDE.md в skills
</h3>

Ваш файл [CLAUDE.md](/ru/memory) загружается в контекст при запуске сессии. Если он содержит подробные инструкции для конкретных рабочих процессов (такие как PR reviews или миграции баз данных), эти токены присутствуют даже когда вы выполняете несвязанную работу. [Skills](/ru/skills) загружаются по требованию только при вызове, поэтому перемещение специализированных инструкций в skills сохраняет ваш базовый контекст меньшим. Стремитесь сохранять CLAUDE.md под 200 строк, включая только необходимое.

<h3 id="adjust-extended-thinking">
  Отрегулируйте расширенное мышление
</h3>

Расширенное мышление включено по умолчанию, потому что оно значительно улучшает производительность на сложных задачах планирования и рассуждения. Токены мышления выставляются как выходные токены, и бюджет по умолчанию может быть десятки тысяч токенов на запрос в зависимости от модели. Для более простых задач, где глубокое рассуждение не требуется, вы можете снизить затраты, понизив [уровень усилий](/ru/model-config#adjust-effort-level) с помощью `/effort` или в `/model`, отключив мышление в `/config`, или, на моделях с [фиксированным бюджетом мышления](/ru/model-config#adaptive-reasoning-and-fixed-thinking-budgets), понизив бюджет с помощью `MAX_THINKING_TOKENS=8000`. Модели адаптивного рассуждения игнорируют ненулевые бюджеты, поэтому используйте вместо этого уровни усилий. Отключение мышления недоступно на Fable 5, которая всегда использует расширенное мышление.

<h3 id="delegate-verbose-operations-to-subagents">
  Делегируйте многословные операции subagents
</h3>

Запуск тестов, получение документации или обработка файлов логов может потребить значительный контекст. Делегируйте эти [subagents](/ru/sub-agents#isolate-high-volume-operations), чтобы многословный вывод оставался в контексте subagent, в то время как только резюме возвращается в вашу основную беседу.

<h3 id="manage-agent-team-costs">
  Управление затратами команды агентов
</h3>

Команды агентов используют примерно в 7 раз больше токенов, чем стандартные сессии, когда товарищи по команде работают в plan mode, потому что каждый товарищ по команде поддерживает своё собственное контекстное окно и работает как отдельный экземпляр Claude. Держите задачи команды небольшими и самостоятельными, чтобы ограничить использование токенов на товарища по команде. См. [команды агентов](/ru/agent-teams) для деталей.

<h3 id="write-specific-prompts">
  Пишите конкретные prompts
</h3>

Расплывчатые запросы, такие как "улучшить эту кодовую базу", запускают широкое сканирование. Конкретные запросы, такие как "добавить проверку входных данных в функцию входа в auth.ts", позволяют Claude работать эффективно с минимальными чтениями файлов.

<h3 id="work-efficiently-on-complex-tasks">
  Работайте эффективно над сложными задачами
</h3>

Для более длительной или сложной работы эти привычки помогают избежать потраченных впустую токенов от неправильного направления:

* **Используйте plan mode для сложных задач**: Нажмите Shift+Tab для входа в [plan mode](/ru/permission-modes#analyze-before-you-edit-with-plan-mode) перед реализацией. Claude исследует кодовую базу и предлагает подход для вашего одобрения, предотвращая дорогостоящую переделку, когда первоначальное направление неправильно.
* **Корректируйте курс рано**: Если Claude начинает идти в неправильном направлении, нажмите Escape для немедленной остановки. Используйте `/rewind` или двойное нажатие Escape для восстановления разговора и кода к предыдущей контрольной точке.
* **Дайте цели проверки**: Включите тестовые случаи, вставьте скриншоты или определите ожидаемый вывод в вашем prompt. Когда Claude может проверить свою собственную работу, он ловит проблемы перед тем, как вам нужно запросить исправления.
* **Тестируйте постепенно**: Напишите один файл, протестируйте его, затем продолжайте. Это ловит проблемы рано, когда они дешевы в исправлении.

<h2 id="background-token-usage">
  Использование токенов в фоновом режиме
</h2>

Claude Code использует токены для некоторой фоновой функциональности даже когда неактивен:

* **Суммирование разговора**: Фоновые задания, которые суммируют предыдущие разговоры для функции `claude --resume`
* **Обработка команд**: Некоторые команды, такие как `/usage`, могут генерировать запросы для проверки статуса

Эти фоновые процессы потребляют небольшое количество токенов (обычно менее \$0.04 за сессию) даже без активного взаимодействия.

<h2 id="understanding-changes-in-claude-code-behavior">
  Понимание изменений в поведении Claude Code
</h2>

Claude Code регулярно получает обновления, которые могут изменить способ работы функций, включая отчётность о затратах. Запустите `claude --version` для проверки вашей текущей версии. Для конкретных вопросов выставления счётов свяжитесь с поддержкой Anthropic через вашу [учётную запись Console](https://platform.claude.com/login).