该工作流旨在利用Mistral的OCR功能处理PDF文档,将提取的文本存储在Qdrant向量数据库中,并支持通过检索增强生成(RAG)回答问题。其运作方式如下:
配置完成后,工作流可自动完成文档导入、向量化和智能查询,实现强大的RAG应用。
优势
-
端到端自动化
无需人工干预:文档读取、处理和查询只需简单设置即可完成。 -
可扩展且模块化
采用子流程和批处理设计,便于扩展和定制。 -
多模型支持
结合Mistral进行OCR识别、OpenAI生成嵌入向量、Gemini智能回答——充分发挥各模型优势。 -
实时问答
通过RAG集成,用户可用自然语言查询文档内容,并获得基于PDF数据的精准回答。 -
精简/完整模式
可选择索引完整页面内容或仅摘要文本,在性能与丰富度间自由权衡。
工作原理
-
Mistral OCR处理PDF:
- 工作流首先将PDF文件上传至Mistral API进行OCR文本和元数据提取
- 提取内容被分割为可管理片段(如页面或章节)以供后续处理
-
Qdrant向量存储:
- 使用OpenAI嵌入模型将文本转换为向量
- 向量存储在Qdrant数据库中,为RAG实现高效相似性搜索
-
RAG问答系统:
- 用户通过聊天界面提问时,工作流基于向量相似度从Qdrant检索相关文本片段
- 语言模型(Google Gemini)根据检索内容生成上下文感知的精准回答
-
可选摘要功能:
- 工作流包含Google Gemini的摘要功能,可压缩提取文本以加速处理或简化RAG使用
配置步骤
在n8n中部署该工作流的步骤:
-
配置Qdrant数据库:
- 在”创建集合”和”刷新集合”节点中替换
QDRANTURL
和COLLECTION
为您的Qdrant实例信息 - 确保集合配置正确的向量尺寸(如OpenAI嵌入需1536维)和距离度量标准(如余弦相似度)
- 在”创建集合”和”刷新集合”节点中替换
-
设置凭证:
- 添加以下API凭证:
- Mistral云API(用于OCR处理)
- OpenAI API(用于生成嵌入向量)
- Google Gemini API(用于聊天和摘要)
- Google Drive(如从Drive获取PDF)
- Qdrant API(用于向量存储)
- 添加以下API凭证:
-
PDF源配置:
- 使用Google Drive时,在”搜索PDF”节点指定文件夹ID
- 也可修改工作流以接受其他来源的PDF(如直接上传或外部API)
-
自定义文本处理:
- 在”令牌分割器”节点调整文本块大小和重叠度以优化文档处理
- 通过切换”设置页面”和”摘要链”节点选择原始文本或摘要内容进行RAG
-
测试RAG:
- 手动或通过聊天消息触发工作流,验证OCR、嵌入和Qdrant存储功能
- 使用”问答链”节点测试查询响应
-
可选子工作流:
- 支持作为子工作流运行以实现批处理(如处理多个PDF)