基于GPT-4o-mini、RAG与RLHF技术在Telegram上构建智能知识助手（使用MongoDB）

适用对象

本模板专为内部支持团队、产品专家和知识管理者设计，帮助他们通过Telegram构建具备检索增强生成（RAG）和人类反馈强化学习（RLHF）能力的AI知识助手。

解决什么问题？

人工知识管理和处理支持查询既耗时又易出错。该方案能自动将官方文档导入MongoDB向量搜索库，并通过Telegram用户反馈机制持续优化AI回答质量。

核心工作流

工作流1：文档处理与索引

手动触发流程从Google Docs导入产品文档
文档被分割为可管理段落并使用OpenAI嵌入向量化
向量化段落存入MongoDB Atlas向量库实现语义搜索

工作流2：带RLHF反馈的Telegram对话

通过Telegram机器人监听用户消息
在MongoDB执行向量相似度搜索获取相关文档段落
使用GPT-4o-mini模型结合检索内容生成回答
通过Telegram返回答案并收集用户好评/差评反馈
存储反馈数据用于后续模型优化

配置指南

向量嵌入设置

验证Google Docs并连接含产品文档的URL
验证MongoDB Atlas并配置向量存储集合，创建支持向量查询的搜索索引
确保索引名与n8n配置（data_index）一致
参考下方MongoDB搜索索引模板示例

Telegram RLHF聊天设置

通过@botFather的/newbot命令创建Telegram机器人
连接前序工作流中的MongoDB搜索索引，新建feedback和chat_history集合
在”Knowledge Base Agent”节点配置AI系统提示，确保引用全部三个工具（productDocs, feedbackPositive, feedbackNegative）

注意事项

产品文档和反馈集合需位于同一MongoDB数据库
需建立三个独立集合：产品文档库、反馈库、聊天记录库（后者可分离）
确保Telegram API凭证有效且webhook URL配置正确

MongoDB搜索索引模板

文档集合索引

{
“mappings”: {
“dynamic”: false,
“fields”: {
“_id”: {
“type”: “string”
},
“text”: {
“type”: “string”
},
“embedding”: {
“type”: “knnVector”,
“dimensions”: 1536,
“similarity”: “cosine”
},
“source”: {
“type”: “string”
},
“doc_id”: {
“type”: “string”
}
}
}
}

反馈集合索引

{
“mappings”: {
“dynamic”: false,
“fields”: {
“prompt”: {
“type”: “string”
},
“response”: {
“type”: “string”
},
“text”: {
“type”: “string”
},
“embedding”: {
“type”: “knnVector”,
“dimensions”: 1536,
“similarity”: “cosine”
},
“feedback”: {
“type”: “token”
}
}
}
}