基于GPT-4o-mini、RAG与RLHF技术在Telegram上构建智能知识助手(使用MongoDB)

适用对象

本模板专为内部支持团队、产品专家和知识管理者设计,帮助他们通过Telegram构建具备检索增强生成(RAG)和人类反馈强化学习(RLHF)能力的AI知识助手。

解决什么问题?

人工知识管理和处理支持查询既耗时又易出错。该方案能自动将官方文档导入MongoDB向量搜索库,并通过Telegram用户反馈机制持续优化AI回答质量。

核心工作流

工作流1:文档处理与索引

  • 手动触发流程从Google Docs导入产品文档
  • 文档被分割为可管理段落并使用OpenAI嵌入向量化
  • 向量化段落存入MongoDB Atlas向量库实现语义搜索

工作流2:带RLHF反馈的Telegram对话

  • 通过Telegram机器人监听用户消息
  • 在MongoDB执行向量相似度搜索获取相关文档段落
  • 使用GPT-4o-mini模型结合检索内容生成回答
  • 通过Telegram返回答案并收集用户好评/差评反馈
  • 存储反馈数据用于后续模型优化

配置指南

向量嵌入设置

  1. 验证Google Docs并连接含产品文档的URL
  2. 验证MongoDB Atlas并配置向量存储集合,创建支持向量查询的搜索索引
  3. 确保索引名与n8n配置(data_index)一致
  4. 参考下方MongoDB搜索索引模板示例

Telegram RLHF聊天设置

  1. 通过@botFather的/newbot命令创建Telegram机器人
  2. 连接前序工作流中的MongoDB搜索索引,新建feedback和chat_history集合
  3. 在”Knowledge Base Agent”节点配置AI系统提示,确保引用全部三个工具(productDocs, feedbackPositive, feedbackNegative)

注意事项

  • 产品文档和反馈集合需位于同一MongoDB数据库
  • 需建立三个独立集合:产品文档库、反馈库、聊天记录库(后者可分离)
  • 确保Telegram API凭证有效且webhook URL配置正确

MongoDB搜索索引模板

文档集合索引

{
“mappings”: {
“dynamic”: false,
“fields”: {
“_id”: {
“type”: “string”
},
“text”: {
“type”: “string”
},
“embedding”: {
“type”: “knnVector”,
“dimensions”: 1536,
“similarity”: “cosine”
},
“source”: {
“type”: “string”
},
“doc_id”: {
“type”: “string”
}
}
}
}

反馈集合索引

{
“mappings”: {
“dynamic”: false,
“fields”: {
“prompt”: {
“type”: “string”
},
“response”: {
“type”: “string”
},
“text”: {
“type”: “string”
},
“embedding”: {
“type”: “knnVector”,
“dimensions”: 1536,
“similarity”: “cosine”
},
“feedback”: {
“type”: “token”
}
}
}
}

(0)
上一篇 18小时前
下一篇 18小时前

更多相关内容

从零掌握 AI + MCP/Responses API 的自动化设计,节省90%的时间和成本,成为AI自动化专家。学会 n8n、Coze、Dify 接入全球领先 AI应用生态,打造属于你的 AI智能工作流。