- Централизованная аутентификация - Единая точка управления ключами API
- Отслеживание использования - Мониторинг использования в командах и проектах
- Контроль затрат - Реализация бюджетов и ограничений скорости
- Логирование аудита - Отслеживание всех взаимодействий с моделью для соответствия требованиям
- Маршрутизация моделей - Переключение между поставщиками без изменения кода
Требования к шлюзу
Чтобы LLM gateway работал с Claude Code, он должен соответствовать следующим требованиям: Формат API Шлюз должен предоставлять клиентам по крайней мере один из следующих форматов API:-
Anthropic Messages:
/v1/messages,/v1/messages/count_tokens- Должен перенаправлять заголовки запроса:
anthropic-beta,anthropic-version
- Должен перенаправлять заголовки запроса:
-
Bedrock InvokeModel:
/invoke,/invoke-with-response-stream- Должен сохранять поля тела запроса:
anthropic_beta,anthropic_version
- Должен сохранять поля тела запроса:
-
Vertex rawPredict:
:rawPredict,:streamRawPredict,/count-tokens:rawPredict- Должен перенаправлять заголовки запроса:
anthropic-beta,anthropic-version
- Должен перенаправлять заголовки запроса:
Claude Code определяет, какие функции включить, на основе формата API. При использовании формата Anthropic Messages с Bedrock или Vertex может потребоваться установить переменную окружения
CLAUDE_CODE_DISABLE_EXPERIMENTAL_BETAS=1.Конфигурация
Выбор модели
По умолчанию Claude Code будет использовать стандартные имена моделей для выбранного формата API. Если вы настроили пользовательские имена моделей в вашем шлюзе, используйте переменные окружения, описанные в Конфигурация модели, чтобы соответствовать вашим пользовательским именам.Конфигурация LiteLLM
LiteLLM - это сторонний прокси-сервис. Anthropic не одобряет, не поддерживает и не проверяет безопасность или функциональность LiteLLM. Это руководство предоставляется в информационных целях и может устаревать. Используйте на свой риск.
Предварительные требования
- Claude Code обновлен до последней версии
- LiteLLM Proxy Server развернут и доступен
- Доступ к моделям Claude через выбранного поставщика
Базовая настройка LiteLLM
Конфигурация Claude Code:Методы аутентификации
Статический ключ API
Самый простой метод с использованием фиксированного ключа API:Authorization.
Динамический ключ API с помощником
Для ротации ключей или аутентификации для каждого пользователя:- Создайте скрипт помощника ключа API:
- Настройте параметры Claude Code для использования помощника:
- Установите интервал обновления токена:
Authorization и X-Api-Key. apiKeyHelper имеет более низкий приоритет, чем ANTHROPIC_AUTH_TOKEN или ANTHROPIC_API_KEY.
Унифицированная конечная точка (рекомендуется)
Использование конечной точки формата Anthropic LiteLLM:- Балансировка нагрузки
- Резервные варианты
- Последовательная поддержка отслеживания затрат и отслеживания конечного пользователя