适用人群
任何在电子表格中整理文本前后对比示例,并希望一键生成微调GPT模型(无需使用curl命令)的用户。支持Google Sheets和Airtable。
解决什么问题?
手动下载CSV、转换为JSONL格式、上传文件并轮询OpenAI状态非常繁琐。
本流程自动化整个闭环:抓取标记为Ready的示例,构建JSONL文件,启动微调任务,最后将生成的模型ID记录到注册表/基表中供重复使用。
工作原理
# | 节点 | 功能 |
---|---|---|
1 | 定时触发器 | 默认每周运行(可调整)。 |
2a | 从表格获取示例 | 从Google Sheet拉取Ready = TRUE 的行。使用JSONL模板表格作为列布局标准。 |
2b | 从Airtable获取示例 (禁用) | Airtable用户的备选数据源。 |
3 | 创建JSONL文件 (代码) | 将每个示例转为聊天格式JSONL,并按80/20比例分割为train.jsonl /val.jsonl 。 |
4 | 上传JSONL | 将训练文件上传至OpenAI(用途:fine-tune )。 |
5 | 开始微调 | 在gpt-4o 模型上启动微调任务(可修改)。 |
6 | 等待→检查任务→条件判断 | 每分钟轮询直至状态=成功 。 |
7a | 记录模型至表格 | 将新模型ID和元数据追加到模型注册表。 |
7b | 记录模型至Airtable (禁用) | Airtable的等效记录步骤。 |
设置步骤
-
导入并配置凭证
- 将JSON流程导入n8n
- 添加OpenAI API密钥
- Google Sheets:创建OAuth2凭证并关联到两个Sheets节点
- Airtable(可选):创建个人访问令牌并绑定到Airtable节点
-
复制模板表格
- 将上述JSONL模板表格复制到自己的云端硬盘
- 必备列(严格命名):
| 系统提示 | 用户提示 | 助手回复 | 就绪 | - 为需要包含的行勾选
就绪=TRUE
-
创建注册表/基表
- 建立名为模型注册表的Google Sheet(或Airtable基表),包含列:
模型ID
,训练示例数
,训练轮次
,批量大小
,学习率
,完成时间
- 建立名为模型注册表的Google Sheet(或Airtable基表),包含列:
-
调整模型与计划
- 按需修改开始微调节点中的基础模型
- 调整定时触发器为每日/按需运行
-
测试流程
- 标记若干示例为
就绪=TRUE
- 手动运行流程
- 在OpenAI检查新微调任务,确认模型ID已记录到注册表
- 标记若干示例为
资源链接
- n8n文档 – <https://docs.n8n.io/>
- OpenAI微调指南 – <https://platform.openai.com/docs/guides/fine-tuning>
- Google Sheets API – <https://developers.google.com/sheets/api>
- Airtable API – <https://airtable.com/api>
流程扩展
- Webhook触发器 – 将定时器替换为webhook实现按需训练
- 多源数据合并 – 同时启用Sheets和Airtable节点合并数据集
- 自动部署 – 将新模型名称保存至环境变量/密钥管理器,供下游生成工作流使用