gateway.yaml que o gateway lê na inicialização, consulte a Referência de configuração.
Uma implantação em produção segue quatro etapas em ordem, e as seções abaixo as correspondem. As duas primeiras são onde você faz escolhas; as duas últimas são material de referência para consultar quando estiver em execução.
- Configure seu provedor de identidade: registre o cliente OAuth e verifique as notas específicas do IdP para Okta, Entra e Google
- Implante o gateway: crie uma imagem de contêiner fixada e execute-a no Kubernetes, Cloud Run ou sua própria plataforma. Esta seção também cobre decisões de custo, bypass, múltiplos gateways e serverless
- Configure operações: logs, sondas de integridade, comportamento de interrupção, rotação de segredos e atualizações. Referência para quando você estiver conectando monitoramento e runbooks
- Revise a postura de segurança: para onde os dados fluem, o modelo de ameaça e respostas de conformidade. Referência para uma revisão de segurança
Implante em sua rede privada. Claude Code apenas se conecta a um gateway cujo endereço é privado. Esta é uma proteção de segurança, porque um gateway confiável pode enviar configurações que executam comandos em máquinas de desenvolvedor. Coloque o gateway atrás de um balanceador de carga interno ou VPN e dê a ele um nome de host que seja resolvido apenas para IPs privados.
Configuração do provedor de identidade
Registre um aplicativo web OAuth/OpenID Connect (OIDC) confidencial com um único URI de redirecionamento,https://<gateway>/oauth/callback, e atribua-o aos usuários ou grupos que devem ter acesso ao gateway.
Qualquer IdP compatível com OIDC funciona: Okta, Microsoft Entra ID, Google Workspace, Keycloak, Dex, PingFederate e outros. O IdP deve atender a três requisitos:
- Serve
/.well-known/openid-configuration, sobre HTTPS em produção; o gateway aceita um emissorhttp://, e um emissor de loopback adicionalmente requerCLAUDE_GATEWAY_ALLOW_LOOPBACK=1 - Suporta o fluxo de código de autorização. PKCE (Proof Key for Code Exchange) está ativado por padrão; desative-o com
oidc.use_pkce: falsepara IdPs que não o suportam - Retorna
emaile opcionalmentegroupsno id_token, ou os serve do endpoint userinfo comoidc.userinfo_fallback: true
oidc.ca_cert_pem.
Alguns provedores lidam com email e reivindicações de grupo de forma diferente:
- Okta: o servidor de autorização da organização em
https://example.okta.comretorna um id_token fino que omiteemailegroups, então definaoidc.userinfo_fallback: truesempre que o usar comoissuer. Um servidor de autorização personalizado comohttps://example.okta.com/oauth2/defaultque incluiemaile opcionalmentegroupsno id_token os emite diretamente e não precisa de fallback. Okta emitegroupsapenas quando o escopogroupsé solicitado emoidc.scopese o filtro de reivindicação de grupos do aplicativo o permite;userinfo_fallbacknão pode preencher uma reivindicação que o IdP não foi solicitado. - Microsoft Entra ID:
issuer=https://login.microsoftonline.com/<tenant-id>/v2.0. Entra emite Object IDs de grupo em vez de nomes, então use os GUIDs emmanaged.policies.match.groups, ou use App Roles para nomes legíveis por humanos. Se seu locatário emite funções sobrolesem vez degroups, definaoidc.groups_claim: roles. - Google Workspace:
issuer=https://accounts.google.com. O id_token do Google não carrega grupos. Para usarallowed_groupsbaseado em grupo oumanaged.policiescom Google como IdP, configureoidc.google_groups, que procura os grupos de cada usuário através da API do Directory do Admin SDK usando uma conta de serviço com delegação em todo o domínio. Sem isso, useoidc.allowed_email_domainspara gating de associação emanaged.policies.match.email_domainpara atribuição de política. Google também ignora o escopo padrãooffline_access. Para tokens de atualização, definaoidc.scopes: [openid, profile, email]eoidc.extra_auth_params: { access_type: offline, prompt: consent }.
Implantação
O gateway é um único binário Linux. Ele escala horizontalmente porque as réplicas são sem estado e o Postgres é a camada de coordenação compartilhada. Execute-o como você executa serviços sem estado em seu ambiente. O resto desta seção descreve o que a imagem precisa, com notas breves para Kubernetes e Cloud Run. O gateway foi projetado para ser executado dentro de sua rede, porque mantém sua credencial upstream e atua como o único ponto de saída para inferência. Pode ser executado em qualquer lugar que seus desenvolvedores e seu IdP possam alcançar via HTTPS; trate-o como qualquer outro serviço que mantém uma credencial de produção. Algumas decisões moldam a implantação além de onde ela é executada:- Custo: não há licença separada ou taxa por assento para o gateway; é parte do binário
claude. Você paga pela inferência através de seu compromisso de nuvem ou Anthropic existente, mais a computação para o contêiner e seu coletor de telemetria. - Bypass: o gateway não impõe que a única rota para um modelo passe por ele. Um desenvolvedor com sua própria credencial ainda pode chamar o provedor diretamente, então fechar esse caminho é uma decisão de política de rede, por exemplo, bloqueando a saída para
api.anthropic.comexceto do gateway. Bloquear essa saída também quebra a verificação de segurança de domínio WebFetch, que chamaapi.anthropic.comde cada máquina do desenvolvedor; definaskipWebFetchPreflight: truena política gerenciada para desativá-lo. - Múltiplos gateways: cada gateway é uma implantação separada com sua própria configuração. O CLI armazena sua impressão digital de confiança e credenciais por nome de host do gateway, então diferentes equipes podem se conectar a diferentes gateways sem conflito. Para servir múltiplos emissores OIDC, execute instâncias separadas.
- Serverless: Cloud Run funciona; defina
min-instances: 1para evitar descoberta OIDC fria. Lambda e Cloud Functions não funcionam, porque o gateway é um servidor HTTP de longa duração.
listen.trusted_proxies para os intervalos de origem do proxy para que o gateway leia IPs de cliente de X-Forwarded-For. O gateway honra o cabeçalho apenas quando o par TCP é confiável; o exemplo trabalhado do Google Cloud tem valores concretos por topologia. Sem proxies confiáveis, cada solicitação parece vir do IP do proxy, o que colapsa limites de taxa por IP em um balde compartilhado e registra o IP do proxy em eventos de auditoria.
Imagem de contêiner
Construa sua própria imagem em torno do binário nativoclaude da versão padrão do Claude Code:
- Baixe a compilação Linux para a arquitetura de sua imagem de uma versão fixada; consulte Instalar uma versão específica para a URL de download.
- Verifique-a contra o
manifest.jsonassinado por GPG da versão conforme descrito em Integridade binária e assinatura de código. - Copie-a para o contexto de compilação.
- Uma imagem baseada em glibc: a compilação glibc tem apenas dependências dinâmicas de bibliotecas glibc. Imagens baseadas em Musl precisam da compilação
linux-x64-musloulinux-arm64-muslmais pacotes adicionais; consulte Configuração do Alpine Linux. - Um diretório de estado gravável: o gateway é executado como qualquer usuário, mas imagens mínimas não têm home gravável. Defina
CLAUDE_CONFIG_DIRpara um caminho gravável como/tmp/.claude. - O comando do contêiner:
claude gateway --config /etc/claude/gateway.yaml, com o arquivo de configuração montado como somente leitura e segredos fornecidos como variáveis de ambiente; o gateway escuta emlisten.port, padrão8080.
Kubernetes
Execute o gateway como uma Deployment, como qualquer serviço sem estado:- Monte a configuração de um ConfigMap e segredos de um Secret; referencie segredos no YAML via
${file:/path/to/secret}ou como variáveis de ambiente - Termine TLS no Ingress e defina
listen.public_urlpara o nome de host do Ingress - Aponte a sonda de prontidão para
GET /readyze a sonda de vivacidade paraGET /healthz
Identidade de carga de trabalhoPrefira a identidade de carga de trabalho da plataforma em relação a chaves estáticas: IRSA no EKS para Bedrock, Workload Identity no GKE para Agent Platform e identidade de carga de trabalho no AKS para Foundry. Defina
auth: {} no bloco upstream, ou use_azure_ad: true para Foundry, e o gateway pega a identidade do pod através da cadeia de credencial padrão desse provedor. Para um emparelhamento entre nuvens, como um upstream Bedrock no GKE, defina credenciais explícitas no bloco auth do upstream. A referência upstreams tem detalhes de configuração por plataforma.Cloud Run
Configure o serviço da seguinte forma:- Deixe
listen.portem seu padrão de8080, que corresponde aoPORTpadrão do Cloud Run, ou definaport: ${PORT} - Defina
public_urlpara a origem externamente alcançável. Para produção, isso normalmente é o nome de host de um balanceador de carga interno, porque/loginrejeita endereços públicos e a URL*.run.appse resolve para um, então a URL do Cloud Run sozinha funciona apenas para um teste de fumaçacurlou navegador. A exceção é uma rede onde*.run.appse resolve privadamente através do Private Service Connect e uma zona privada do Cloud DNS; nessa topologia a URL do Cloud Run é umpublic_urlválido. O exemplo trabalhado do Google Cloud cobre ambos. - Monte a configuração como um volume secreto
- Defina
min-instances: 1para evitar descoberta OIDC fria na primeira solicitação
Para um exemplo trabalhado completo no Google Cloud, cobrindo Cloud Run ou GKE, Cloud SQL e Secret Manager, consulte Implantar no Google Cloud.
Envie a URL do gateway para máquinas de desenvolvedores
Assim que o gateway estiver servindo, envieforceLoginMethod e forceLoginGatewayUrl para a máquina de cada desenvolvedor através de configurações gerenciadas, via MDM ou escrevendo o managed-settings.json por SO diretamente. Sem isso, /login mostra o seletor de conta padrão sem opção de gateway. Consulte Configurações gerenciadas do lado do cliente para os caminhos de arquivo.
Operações
Assim que o gateway estiver servindo tráfego, a operação do dia a dia é ler seus logs, sondar sua saúde e girar seus segredos em seu cronograma. As subseções cobrem cada uma, mais o que o Postgres mantém e como atualizações e reversões se comportam.Logs
O gateway escreve dois fluxos para stderr, ambos amigáveis a JSON:- Eventos de auditoria: JSON de linha única por evento relevante para segurança. Canalize stderr para seu agregador de logs. Os eventos emitidos incluem
config.load,session.mint,session.refresh,device.authorize,device.verify,auth.denied,access.denied,inference,managed.serve,spend.blockedeadmin.denied. Os campos variam por evento:- Eventos de mint e refresh bem-sucedidos carregam
sub,email,client_ipe o resultado - Eventos de negação carregam o motivo, caminho e IP do cliente, já que nenhuma identidade existe na negação
inferenceregistra qual upstream serviu a solicitação e o status da respostaadmin.deniedregistra uma tentativa de autenticação de API de administrador rejeitada com o motivo (invalid_keyouno_credentials), IP do cliente, método e caminho, sem o material de chave apresentado
- Eventos de mint e refresh bem-sucedidos carregam
- Logs operacionais: linhas legíveis por humanos com prefixo
[gateway]para inicialização, avisos e erros upstream. A variável de ambienteCLAUDE_GATEWAY_LOG_LEVELcontrola a verbosidade e aceitainfo,warnouerror, cominfocomo padrão. Não afeta eventos de auditoria, que são sempre emitidos.
Saúde
O gateway serveGET /healthz como uma sonda de vivacidade e GET /readyz como uma sonda de prontidão; /readyz verifica se o armazenamento é alcançável. Ambos estão isentos de access_control.allow_cidrs, então as sondas continuam funcionando em um listener bloqueado.
O documento de descoberta OAuth em /.well-known/oauth-authorization-server também retorna 200 apenas após carregamento de configuração, descoberta OIDC, construção de cliente upstream e migração do Postgres, então funciona como uma verificação de inicialização de ponta a ponta.
Um gateway em execução também serve uma descrição dos caminhos e formas de solicitação que aceita em <public_url>/protocol, correspondida à versão que você está executando. O conteúdo não é estável entre versões.
Comportamento de interrupção
Se o Postgres cair, o gateway em si continua servindo desenvolvedores conectados e novas entradas falham. Se os desenvolvedores realmente continuam funcionando depende de como seu orquestrador lida com prontidão:- Sessões existentes: tokens portadores validam localmente com o segredo JWT, atualizações de sessão não tocam o armazenamento e o processo do gateway ainda pode servir inferência
- Novas entradas: falham até que o Postgres se recupere, porque o fluxo de dispositivo e seus contadores de limite de taxa vivem no Postgres
- Aplicação de limite de gastos: falha aberta por padrão durante a interrupção, então a inferência ainda flui; inverta para falha fechada se preferir bloquear do que executar sem medição
- Prontidão:
/readyzrelata não-pronto durante a interrupção, então orquestradores que controlam tráfego na prontidão removem cada réplica da rotação de uma vez. Nessa topologia todo tráfego, incluindo inferência que o gateway ainda poderia servir, falha no balanceador de carga até que o Postgres se recupere. A sonda de vivacidade em/healthzcontinua passando, então as réplicas não são reiniciadas. Aponte a sonda de prontidão para/healthzem vez disso se preferir que desenvolvedores conectados continuem funcionando através de uma interrupção de armazenamento; o custo é que novas entradas falham contra uma réplica que ainda relata pronto.
ttl_hours, e novas entradas e atualizações falham. Defina um ttl_hours mais longo se seu IdP tiver janelas de manutenção frequentes.
Rotação de segredo JWT
Gire o segredo de assinatura em três etapas para que as sessões existentes permaneçam válidas:- Gere um novo segredo. Coloque-o no início da matriz
session.jwt_secret. - Implante a implantação. Novos tokens assinam com o novo segredo; tokens antigos ainda verificam.
- Após
ttl_hoursmais uma margem, remova o segredo antigo e implante novamente.
ttl_hours.
Postgres
O gateway mantém cinco tabelas, todas criadas por suas migrações de tempo de inicialização:| Tabela | Conteúdo | Retenção |
|---|---|---|
kv | Concessões de dispositivo (TTL de 10 minutos) e contadores de limite de taxa | TTL por linha |
spend | Contadores de gastos período-até-data por principal, em centavos | admin.spend_retention_months, padrão 13 |
spend_limits | Limites de gastos configurados | Até deletado via API |
admin_audit | Trilha de mutação de API de administrador | admin.audit_retention_days, padrão 365 |
principal_emails | Email, nome de exibição e grupos de IdP de cada principal vistos pela última vez. Contém PII. | admin.identity_retention_days desde última atividade, padrão 90 |
kv após seu TTL, e uma varredura horária impõe as janelas de retenção nas tabelas de gastos, então nada cresce sem limite. Sem limites de gastos configurados, apenas kv é escrito. Se sua política de segurança proíbe DDL da função de aplicativo, pré-crie essas tabelas e _migrations com uma função de administrador e conceda à função de aplicativo SELECT, INSERT, UPDATE, DELETE em cada uma.
Com limites de gastos em uso, um banco de dados perdido significa rastreamento de gastos e limites perdidos, não apenas re-entradas de desenvolvedores, então execute backups regulares. Para apagar um desenvolvedor que partiu imediatamente em vez de esperar pela retenção, execute DELETE FROM principal_emails WHERE principal = '<sub>' diretamente; isso remove a única tabela que mantém seu email, nome e grupos. Linhas spend e admin_audit referenciam apenas o sub OIDC pseudônimo.
Atualizações
As réplicas são sem estado, então uma reinicialização contínua é segura a qualquer momento. O gateway executa migrações de esquema na inicialização, o que significa que implantar o novo binário auto-migra o banco de dados. Se a função de banco de dados não conseguir executar DDL, pré-crie o esquema, incluindo a tabela_migrations semeada para a versão atual; caso contrário, a inicialização falha ao tentar CREATE TABLE.
As migrações são apenas anexadas, então reverter para um binário anterior que conhece menos migrações é seguro; ele ignora as linhas extras. A reversão também re-valida o YAML contra o esquema do binário mais antigo, então uma configuração que adotou uma chave introduzida pela versão mais nova falha na inicialização no mais antigo. Remova a nova chave antes de reverter.
Como você fixa a versão do gateway em sua própria imagem, correções em novas versões do Claude Code, incluindo correções de segurança, chegam à sua implantação apenas quando você atualiza o pino e reimplanta. Inclua o gateway no mesmo ciclo de patch que você usa para outros serviços que mantêm credenciais de produção.
Segurança
Esta seção responde às perguntas que uma revisão de segurança faz: quais dados fluem através do gateway e para onde vão, quais ataques o design se defende e quais respostas pertencem a um questionário de conformidade.Fluxo de dados
| Dados | Caminho | Enviado para Anthropic pelo gateway |
|---|---|---|
| Inferência (prompts, conclusões) | CLI → gateway → seu upstream | Apenas se a API Anthropic for um upstream configurado |
| Telemetria (métricas OTLP, mais logs e rastreamentos opcionais) | CLI → gateway → seu coletor | Nunca |
| Identidade (email, grupos, sub) | IdP → gateway → JWT → CLI; o CLI o carimba em exportações OTLP | Nunca |
| Configurações gerenciadas | Seu YAML de gateway → CLI | Nunca |
| Log de auditoria | Gateway stderr → seu agregador | Nunca |
Resumo do modelo de ameaça
O gateway fica dentro do perímetro de rede, mas laptops de desenvolvedores individuais não são tratados como confiáveis. O design leva isso em conta de três maneiras:- Os desenvolvedores mantêm JWTs de curta duração em vez de chaves upstream brutas. A perna CLI-para-gateway usa a concessão de dispositivo RFC 8628, e a troca de código de autorização do gateway com o IdP executa PKCE na configuração padrão, então um código de autorização IdP interceptado é inútil.
- A página de verificação de dispositivo impõe POST de mesma origem e um limite de taxa por IP por RFC 8628 §5.1. Consulte Resistência de força bruta de código de usuário.
- Solicitações de saída passam por uma proteção de falsificação de solicitação do lado do servidor (SSRF) que resolve DNS, bloqueia endereços link-local e metadados de nuvem mais loopback por padrão e fixa a conexão ao IP resolvido, então URLs influenciadas pelo operador como o IdP e destinos OTLP não podem ser redirecionados para endpoints de metadados de nuvem. Intervalos privados RFC 1918 são deliberadamente permitidos, porque IdPs e coletores OTLP comumente vivem em IPs privados. Para desenvolvimento local contra um IdP de loopback ou coletor, defina
CLAUDE_GATEWAY_ALLOW_LOOPBACK=1no ambiente do gateway; deixe desconfigurado em produção.
- Um host de gateway comprometido: o host mantém a credencial upstream e distribui configurações gerenciadas para cada desenvolvedor conectado, então o controle sobre a configuração do gateway é comparável ao controle sobre seu MDM. O diálogo de aprovação única do CLI para configurações capazes de shell limita mudanças silenciosas, mas não substitui a segurança do host.
- Um provedor OIDC malicioso: o provedor assina os id_tokens que o gateway confia, então pode afirmar qualquer identidade. Verificar e proteger seu IdP é sua responsabilidade.
Resistência de força bruta de código de usuário
Ouser_code que um desenvolvedor digita na página de verificação /device tem 8 caracteres extraídos de um alfabeto de 20 caracteres, o que produz 20⁸ ou cerca de 2,56×10¹⁰ combinações, e expira após 10 minutos.
O gateway aplica limites de taxa por IP nos endpoints de concessão de dispositivo, configuráveis via rate_limits. Aumente os limites se muitos desenvolvedores entrarem de um único endereço NAT corporativo compartilhado. Os limites se aplicam apenas ao fluxo de entrada, não à inferência.
Postura de conformidade
- Residência de dados: o plano de dados do próprio gateway não envia nada para Anthropic a menos que a API Anthropic seja um upstream configurado; quando é, seu acordo de tratamento de dados existente se aplica ao caminho de inferência. Telemetria, auditoria, identidade e configurações vão apenas para os destinos que você configura.
- Tráfego de processo de host: o processo de host é o CLI do Claude Code, que pode enviar análises de inicialização e verificações de atualização para Anthropic. Para implantações de saída estrita, defina
CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC=1no ambiente do contêiner do gateway. - Análises do cliente: o CLI desativa sua própria análise de uso enquanto conectado a um gateway, e o relatório de erros está desativado por padrão em superfícies de API de terceiros.
- Máquinas do cliente: CLIs de desenvolvedores ainda enviam verificações de nome de host WebFetch e verificações de versão para Anthropic a menos que
CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC=1eskipWebFetchPreflight: truesejam definidos. Consulte uso de dados. - Classificações de pesquisa: a credencial do gateway desativa o coletor vinculado a Anthropic, então as classificações não são enviadas para Anthropic.
- Compartilhamento de transcrição: escolher Sim em um prompt de compartilhamento de transcrição de pesquisa escreve um arquivo local em
~/.claude/feedback-bundles/em vez de fazer upload para Anthropic. - Atualizações do cliente: verificações de atualização são separadas do tráfego do gateway. Fixe versões através de sua própria distribuição e defina
DISABLE_UPDATESse laptops não devem buscar versões.DISABLE_AUTOUPDATERpara apenas atualizações de fundo enquantoclaude updateainda funciona. - TLS: sirva
public_urlsobre HTTPS em produção, seja do próprio listener do gateway vialisten.tlsou de um ingress que termina TLS na frente de réplicas HTTP simples comlisten.public_urldefinido. O gateway não recusa HTTP simples. O IdP deve servir HTTPS em produção, e o Postgres suporta?sslmode=require. DefinaStrict-Transport-Securityem seu ingress. - Divulgação de vulnerabilidade: siga Relatando problemas de segurança
Troubleshooting
Para perguntas e feedback, use Suporte do Claude Code, ou abra um problema no repositório GitHub do Claude Code. Ao relatar um problema, inclua:- Problema do gateway: o stderr do gateway para a janela relevante, seu
gateway.yamlcom segredos redigidos, a versão do gateway, mostrada na página de destino em/e no cabeçalho de respostax-cc-gateway-versionem/managed/settings, e o que mudou recentemente - Problema de entrada: o desenvolvedor executa
claude --debug-file ./claude-debug.txt, reproduz e envia esse arquivo mais o log de auditoria do gateway para a mesma janela - Problema de inferência: o modelo solicitado, os upstreams configurados e o log de auditoria do gateway para a solicitação, que registra qual upstream o serviu e o status da resposta
| Sintoma | Causa | Correção |
|---|---|---|
A /login de um desenvolvedor mostra o seletor de conta padrão em vez da tela Cloud gateway | forceLoginMethod ou forceLoginGatewayUrl não está definido em configurações gerenciadas nessa máquina | Implante o arquivo de configurações gerenciadas no dispositivo; /login lê a URL do gateway de lá |
A inicialização mostra Gateway login is configured in managed settings, but this Claude Code build does not include Cloud gateway support. | A compilação do Claude Code instalada é anterior ao suporte do gateway | Peça ao desenvolvedor para atualizar o Claude Code para uma versão que inclua suporte do Cloud gateway |
CLI /login: Gateway hosts must be on your organization's private network; <host> resolves to the public (or unrecognized) address <ip> | O nome de host do gateway se resolve para pelo menos um endereço IP público. Claude Code verifica cada endereço resolvido e requer que cada um seja privado. Uma causa comum é um nome de pilha dupla onde uma família se resolve para um endereço público, incluindo balanceadores de carga de pilha dupla internos da AWS, que retornam endereços AAAA de intervalo público | Faça o nome do gateway se resolver apenas para endereços privados em máquinas de desenvolvedores. Para um nome de pilha dupla, solte o registro de intervalo público ou sirva um nome DNS apenas interno separado. Consulte o pré-requisito de rede privada. |
CLI /login: Gateway login requires a direct connection and does not support connecting through an HTTP proxy | Um HTTPS_PROXY ou HTTP_PROXY se aplica ao host do gateway e o nome de host do proxy se resolve para um endereço público. Um proxy cujo host se resolve apenas para endereços privados é permitido e não dispara esse erro | Adicione o host do gateway a NO_PROXY na máquina do desenvolvedor para que a conexão seja direta, ou use um proxy cujo nome de host se resolve para endereços privados |
CLI /login: Could not resolve gateway host <host> | A máquina não consegue resolver o nome DNS interno do gateway, normalmente porque não está na rede corporativa | Peça ao desenvolvedor para se conectar à sua rede ou VPN e tente /login novamente |
A inicialização sai com um erro de validação de configuração nomeando store.postgres_url | Nenhum Postgres configurado; o gateway requer Postgres | Defina store.postgres_url. Para desenvolvimento local, use um contêiner descartável: docker run --rm -p 5432:5432 -e POSTGRES_HOST_AUTH_METHOD=trust postgres. |
A inicialização sai: requires the native binary | Executando sob Node em vez do binário nativo | Instale o Claude Code com um dos métodos de instalação autônoma |
A inicialização sai com um erro de descoberta OIDC após config.load | oidc.issuer inacessível, ou cadeia TLS não confiável | Verifique se o emissor é alcançável do pod e serve /.well-known/openid-configuration. Defina ca_cert_pem para PKI privada. |
| A inicialização sai com um erro de permissão do Postgres | A função de aplicativo carece de CREATE TABLE | Pré-crie o esquema com uma função de administrador e conceda DML à função de aplicativo, ou conceda DDL temporariamente para inicializações que aplicam novas migrações |
/oauth/callback mostra “Sign-in could not be completed” | Domínio de email rejeitado, validação de id_token falhou, ou email_verified é explicitamente false, que o gateway sempre rejeita sem substituição | Verifique allowed_email_domains e que o IdP retorna uma reivindicação email verificada. Para email_verified: false, corrija a verificação do lado do IdP. Se seu IdP emite email sob um nome de reivindicação diferente, defina oidc.email_claim. |
Log: token exchange failed: id_token missing email claim | O IdP não está incluindo email no id_token por padrão. Esta rejeição dispara apenas quando allowed_email_domains está definido; sem ele, um email ausente cunha uma sessão sem email | Configure o IdP para emitir email no id_token. Okta: adicione email às reivindicações de token de ID de um servidor de autorização personalizado. Entra: adicione email como uma reivindicação opcional no registro do aplicativo. PingFederate: ative uma Política OpenID Connect que emite email. Se o IdP serve email do endpoint userinfo mas não o incluirá no id_token, como o servidor de autorização da organização Okta, defina oidc.userinfo_fallback: true. |
Cada solicitação do Bedrock retorna 502; o log mostra Could not load credentials from any providers | No EC2, o hop limit padrão do IMDSv2 de 1 bloqueia a solicitação de metadados de instância de dentro do contêiner. A inicialização e /readyz passam mesmo assim porque o AWS SDK resolve credenciais de instância na primeira solicitação, não na construção do cliente | Aumente o hop limit com aws ec2 modify-instance-metadata-options --instance-id <id> --http-put-response-hop-limit 2, ou defina-o no modelo de lançamento. A mudança se aplica a cada contêiner na instância. Prefira funções de tarefa ECS onde disponível, que leem credenciais do endpoint de credenciais do contêiner ECS e evitam a mudança completamente, ou aplique a mudança em uma instância de gateway dedicada para limitar a exposição. |
| Erro do IdP: escopo desconhecido ou não suportado | O IdP rejeita escopos que não reconhece | Defina oidc.scopes para exatamente a lista que seu IdP aceita; deve incluir openid. O padrão é openid profile email offline_access. |
As sessões não se renovam silenciosamente após definir oidc.scopes | offline_access foi removido da substituição | Adicione offline_access de volta se seu IdP o suportar. Sem um token de atualização, os desenvolvedores executam novamente o login do navegador a cada session.ttl_hours. |
| O navegador mostra “This request came from another site and was blocked” | POST de formulário entre sites, bloqueado como proteção CSRF. Esperado para páginas incorporadas ou proxied | Abra o link de verificação diretamente |
| Chrome bloqueia o botão Approve com “Refused to send form data … violates … Content Security Policy directive: form-action”, mas a mesma página funciona no Safari ou Firefox | Chrome impõe form-action contra toda a cadeia de redirecionamento. Seu IdP redireciona para um segundo host que não está na lista de permissões. | Adicione cada origem adicional na cadeia de redirecionamento a oidc.form_action_origins. Abra Chrome DevTools → Console na página Approve para ver qual origem foi bloqueada. |
| A entrada é concluída no IdP, mas o callback falha, com um erro de CSP no Chrome ou “this sign-in link has expired” no Safari | O IdP retornou o código via response_mode=form_post, que o auto-envia entre origens via POST para /oauth/callback. Chrome bloqueia isso sob um CSP estrito; Safari permite o envio, mas o callback lê apenas a string de consulta. | Certifique-se de que seu IdP honra response_mode=query, que o gateway solicita explicitamente para que o callback seja um redirecionamento simples |
| O login funciona localmente, mas falha atrás de um ALB | public_url não definido, então o IdP obtém a origem interna http:// como redirect_uri | Defina listen.public_url para a origem externa https:// |
| O desenvolvedor vê o prompt de confiança repetidamente | O certificado TLS está girando por réplica ou por solicitação | Use um certificado estável no ingress, ou termine TLS uma vez e execute réplicas sobre HTTP simples internamente |
CLI /login: “Could not verify the gateway’s TLS certificate” ou SELF_SIGNED_CERT_IN_CHAIN | A cadeia TLS do gateway é assinada por uma CA privada não no armazenamento de confiança do host CLI | Claude Code lê o armazenamento de confiança do SO por padrão no binário nativo e no Node 22.15 ou posterior; CLAUDE_CODE_CERT_STORE controla esse comportamento. Se a CA está instalada no armazenamento de confiança do SO, certifique-se de que os desenvolvedores estão em um tempo de execução atual. Caso contrário, defina NODE_EXTRA_CA_CERTS para o PEM do certificado CA antes de iniciar. O prompt de impressão digital de primeira conexão ainda se aplica. |
Relacionado
- Visão geral do gateway de aplicativos Claude: início rápido e conexão de desenvolvedor
- Referência de configuração: cada opção
gateway.yaml