Agent Decisioner 是一个动态的AI驱动路由系统,它能根据查询内容和目的,自动选择最合适的大语言模型(LLM)来响应用户查询。
该工作流通过智能路由将查询分配给最匹配的模型,确保生成动态化、最优化的AI响应。
优势
-
🔁 自动模型路由:
自动选择最佳模型,提升响应效率与相关性。 -
🎯 资源优化:
将简单查询路由至轻量级模型,避免过度消耗GPT-4等高成本模型。 -
📚 模型感知推理:
基于模型能力元数据(如推理、编程、网络搜索)进行智能选择。 -
📥 模块化可扩展:
轻松集成其他工具,或通过添加模型/自定义逻辑进行扩展。 -
👨💻 适配RAG与多智能体系统:
可作为复杂智能体框架或检索增强生成(RAG)流程的核心枢纽。
工作原理
- 触发会话:用户发送消息时触发路由代理。
- 模型选择:AI代理分析查询并从可选模型中选择最佳(如编程用Claude 3.7 Sonnet,网络搜索用Perplexity/Sonar,推理用GPT-4o Mini)。
- 结构化输出:代理返回包含用户提示和所选模型的JSON响应。
- 执行:选定模型处理查询并生成响应,确保任务性能最优。
配置步骤
-
节点配置:
- 会话触发器:设置接收用户消息的Webhook。
- 路由代理:定义包含模型优势说明和JSON输出规则的系统消息。
- OpenRouter聊天模型:连接OpenRouter获取模型访问权限。
- 结构化输出解析器:确保验证JSON响应格式(
prompt
+model
)。 - 执行代理:配置其将提示转发至选定模型。
-
节点连接:
- 将会话触发器链接至路由代理。
- 连接OpenRouter聊天模型和输出解析器到路由代理。
- 将解析后的JSON路由至通过OpenRouter Chat Model1调用模型的执行代理。
-
凭证设置:
- 确保两个聊天模型节点正确配置OpenRouter API凭证。
-
测试与部署:
- 激活工作流并用示例查询测试模型选择逻辑。
- 根据需要调整路由规则以提高准确性。