跳转到主要内容
工具搜索使您的代理能够通过动态发现和按需加载来处理数百或数千个工具。代理不是将所有工具定义预先加载到上下文窗口中,而是搜索您的工具目录并仅加载它需要的工具。 当工具库扩展时,这种方法解决了两个挑战:
  • 上下文效率: 工具定义可能会消耗上下文窗口的大部分(50个工具可能使用10-20K个令牌),留下较少的空间用于实际工作。
  • 工具选择准确性: 一次加载超过30-50个工具时,工具选择准确性会下降。
工具搜索默认启用。本页面涵盖它的工作原理、如何配置它以及如何优化工具发现

工具搜索的工作原理

当工具搜索处于活动状态时,工具定义会从上下文窗口中隐藏。代理会收到可用工具的摘要,并在任务需要尚未加载的功能时搜索相关工具。最相关的3-5个工具被加载到上下文中,在后续轮次中保持可用。如果对话足够长,SDK会压缩早期消息以释放空间,之前发现的工具可能会被移除,代理会根据需要再次搜索。 工具搜索在Claude首次发现工具时增加一个额外的往返(搜索步骤),但对于大型工具集,这被每个轮次中较小的上下文所抵消。对于少于约10个工具的情况,预先加载所有工具通常更快。 有关底层API机制的详细信息,请参阅API中的工具搜索
工具搜索需要Claude Sonnet 4或更高版本,或Claude Opus 4或更高版本。Haiku模型不支持工具搜索。

配置工具搜索

工具搜索默认启用。在Vertex AI上默认禁用,其中支持Claude Sonnet 4.5及更高版本以及Claude Opus 4.5及更高版本。当ANTHROPIC_BASE_URL指向非第一方主机时也会禁用,因为大多数代理不转发tool_reference块。您可以使用ENABLE_TOOL_SEARCH环境变量覆盖任一默认值:
行为
(未设置)工具搜索处于启用状态。工具定义被延迟并按需发现。在Vertex AI或非第一方ANTHROPIC_BASE_URL上回退到预先加载。
true工具搜索始终启用。SDK即使在Vertex AI和通过代理上也会发送beta标头。在Sonnet 4.5或Opus 4.5之前的Vertex AI模型上,或在不支持tool_reference块的代理上,请求会失败。
auto检查所有工具定义的组合令牌计数与模型的上下文窗口。如果超过10%,工具搜索激活。如果低于10%,所有工具正常加载到上下文中。
auto:Nauto相同,但具有自定义百分比。auto:5在工具定义超过上下文窗口的5%时激活。较低的值更早激活。
false工具搜索关闭。所有工具定义在每个轮次上都加载到上下文中。
工具搜索适用于所有已注册的工具,无论它们来自远程MCP服务器还是自定义SDK MCP服务器。使用auto时,阈值基于所有服务器上所有工具定义的组合大小。 query()上的env选项中设置值。此示例连接到公开许多工具的远程MCP服务器,使用通配符预先批准所有工具,并使用auto:5,以便当工具定义超过上下文窗口的5%时激活工具搜索:
import { query } from "@anthropic-ai/claude-agent-sdk";

for await (const message of query({
  prompt: "Find and run the appropriate database query",
  options: {
    mcpServers: {
      "enterprise-tools": {
        // Connect to a remote MCP server
        type: "http",
        url: "https://tools.example.com/mcp"
      }
    },
    allowedTools: ["mcp__enterprise-tools__*"], // Wildcard pre-approves all tools from this server
    env: {
      ENABLE_TOOL_SEARCH: "auto:5" // Activate tool search when tools exceed 5% of context
    }
  }
})) {
  if (message.type === "result" && message.subtype === "success") {
    console.log(message.result);
  }
}
ENABLE_TOOL_SEARCH设置为"false"会禁用工具搜索,并在每个轮次上将所有工具定义加载到上下文中。这消除了搜索往返,当工具集很小(少于约10个工具)且定义在上下文窗口中舒适地适配时,这可能会更快。

优化工具发现

搜索机制将查询与工具名称和描述进行匹配。像search_slack_messages这样的名称比query_slack更广泛地出现在各种请求中。具有特定关键字的描述(“按关键字、频道或日期范围搜索Slack消息”)比通用描述(“查询Slack”)匹配更多查询。 您还可以添加一个系统提示部分,列出可用的工具类别。这为代理提供了关于可以搜索什么类型工具的上下文:
You can search for tools to interact with Slack, GitHub, and Jira.

限制

  • 最大工具数: 您的目录中最多10,000个工具
  • 搜索结果: 每次搜索返回3-5个最相关的工具
  • 模型支持: Claude Sonnet 4及更高版本、Claude Opus 4及更高版本(不支持Haiku)

相关文档