用Google Sheets或Airtable数据实现GPT-4o微调自动化

适用人群

任何在电子表格中整理文本前后对比示例,并希望一键生成微调GPT模型(无需使用curl命令)的用户。支持Google SheetsAirtable


解决什么问题?

手动下载CSV、转换为JSONL格式、上传文件并轮询OpenAI状态非常繁琐。
本流程自动化整个闭环:抓取标记为Ready的示例,构建JSONL文件,启动微调任务,最后将生成的模型ID记录到注册表/基表中供重复使用。


工作原理

# 节点 功能
1 定时触发器 默认每周运行(可调整)。
2a 从表格获取示例 从Google Sheet拉取Ready = TRUE的行。使用JSONL模板表格作为列布局标准。
2b 从Airtable获取示例 (禁用) Airtable用户的备选数据源。
3 创建JSONL文件 (代码) 将每个示例转为聊天格式JSONL,并按80/20比例分割为train.jsonl/val.jsonl
4 上传JSONL 将训练文件上传至OpenAI(用途:fine-tune)。
5 开始微调 gpt-4o模型上启动微调任务(可修改)。
6 等待→检查任务→条件判断 每分钟轮询直至状态=成功
7a 记录模型至表格 将新模型ID和元数据追加到模型注册表
7b 记录模型至Airtable (禁用) Airtable的等效记录步骤。

设置步骤

  1. 导入并配置凭证

    • 将JSON流程导入n8n
    • 添加OpenAI API密钥
    • Google Sheets:创建OAuth2凭证并关联到两个Sheets节点
    • Airtable(可选):创建个人访问令牌并绑定到Airtable节点
  2. 复制模板表格

    • 将上述JSONL模板表格复制到自己的云端硬盘
    • 必备列(严格命名):
      | 系统提示 | 用户提示 | 助手回复 | 就绪 |
    • 为需要包含的行勾选就绪=TRUE
  3. 创建注册表/基表

    • 建立名为模型注册表的Google Sheet(或Airtable基表),包含列:
      模型ID, 训练示例数, 训练轮次, 批量大小, 学习率, 完成时间
  4. 调整模型与计划

    • 按需修改开始微调节点中的基础模型
    • 调整定时触发器为每日/按需运行
  5. 测试流程

    • 标记若干示例为就绪=TRUE
    • 手动运行流程
    • 在OpenAI检查新微调任务,确认模型ID已记录到注册表

资源链接


流程扩展

  • Webhook触发器 – 将定时器替换为webhook实现按需训练
  • 多源数据合并 – 同时启用Sheets和Airtable节点合并数据集
  • 自动部署 – 将新模型名称保存至环境变量/密钥管理器,供下游生成工作流使用
(0)
上一篇 5天前
下一篇 5天前

更多相关内容

从零掌握 AI + MCP/Responses API 的自动化设计,节省90%的时间和成本,成为AI自动化专家。学会 n8n、Coze、Dify 接入全球领先 AI应用生态,打造属于你的 AI智能工作流。