适用对象
本模板专为内部支持团队、产品专家和知识管理者设计,帮助他们通过Telegram构建具备检索增强生成(RAG)和人类反馈强化学习(RLHF)能力的AI知识助手。
解决什么问题?
人工知识管理和处理支持查询既耗时又易出错。该方案能自动将官方文档导入MongoDB向量搜索库,并通过Telegram用户反馈机制持续优化AI回答质量。
核心工作流
工作流1:文档处理与索引
- 手动触发流程从Google Docs导入产品文档
- 文档被分割为可管理段落并使用OpenAI嵌入向量化
- 向量化段落存入MongoDB Atlas向量库实现语义搜索
工作流2:带RLHF反馈的Telegram对话
- 通过Telegram机器人监听用户消息
- 在MongoDB执行向量相似度搜索获取相关文档段落
- 使用GPT-4o-mini模型结合检索内容生成回答
- 通过Telegram返回答案并收集用户好评/差评反馈
- 存储反馈数据用于后续模型优化
配置指南
向量嵌入设置
- 验证Google Docs并连接含产品文档的URL
- 验证MongoDB Atlas并配置向量存储集合,创建支持向量查询的搜索索引
- 确保索引名与n8n配置(data_index)一致
- 参考下方MongoDB搜索索引模板示例
Telegram RLHF聊天设置
- 通过@botFather的/newbot命令创建Telegram机器人
- 连接前序工作流中的MongoDB搜索索引,新建feedback和chat_history集合
- 在”Knowledge Base Agent”节点配置AI系统提示,确保引用全部三个工具(productDocs, feedbackPositive, feedbackNegative)
注意事项
- 产品文档和反馈集合需位于同一MongoDB数据库
- 需建立三个独立集合:产品文档库、反馈库、聊天记录库(后者可分离)
- 确保Telegram API凭证有效且webhook URL配置正确
MongoDB搜索索引模板
文档集合索引
{
“mappings”: {
“dynamic”: false,
“fields”: {
“_id”: {
“type”: “string”
},
“text”: {
“type”: “string”
},
“embedding”: {
“type”: “knnVector”,
“dimensions”: 1536,
“similarity”: “cosine”
},
“source”: {
“type”: “string”
},
“doc_id”: {
“type”: “string”
}
}
}
}
反馈集合索引
{
“mappings”: {
“dynamic”: false,
“fields”: {
“prompt”: {
“type”: “string”
},
“response”: {
“type”: “string”
},
“text”: {
“type”: “string”
},
“embedding”: {
“type”: “knnVector”,
“dimensions”: 1536,
“similarity”: “cosine”
},
“feedback”: {
“type”: “token”
}
}
}
}