OpenAI 最近为 ChatGPT-4 引入了新的照片上传功能,这是一项重大增强功能,允许用户上传图像以供 AI 模型分析。此功能在 GPT-4 版本的 ChatGPT 中默认处于激活状态,“附加图像”按钮现在位于输入框的左侧,非常方便。这一发展为用户提供了无数的可能性,从解决损坏的项目到改进网站设计,甚至从图像中提取文本。
“语音和图像为您提供了更多在生活中使用 ChatGPT 的方式。在旅行时拍摄地标的照片,并就其有趣的内容进行实时对话。当您在家时,拍摄冰箱和食品储藏室的照片,以确定晚餐的食物(并询问后续问题以获取分步食谱)。晚饭后,通过拍照、圈出问题集并让它与你们俩分享提示来帮助您的孩子解决数学问题。
如何使用聊天图片上传
此新功能的视频中演示的一个惊人应用是识别和修复损坏物品中的问题。例如,如果用户有一辆坏掉的自行车,他们可以将其图像上传到 ChatGPT。然后,系统可以分析图像并提供有关如何解决问题的分步指南。此功能可以通过为用户提供快速简便的问题解决方案来节省用户的时间和金钱。
有关OpenAI主题的其他文章:
- 如何免费使用OpenAI DallE 3
- OpenAI DALLE 3 AI 艺术生成器亮相
- 了解如何使用 OpenAI Playground 进行编码
- 不同的 OpenAI 模型和功能解释
- 首届OpenAI DevDay开发者大会
- OpenAI宣布新团队应对超级智能
除了实际应用外,新的照片上传功能还可以创造性地使用。例如,用户可以上传角色的图像并要求 ChatGPT 描述他们,甚至为他们创建一个背景故事。对于正在寻找新想法或观点的作家、游戏开发人员和其他创意专业人士来说,这可能是一个有价值的工具。
新功能在网页设计领域也有潜在的应用。用户可以上传网页的屏幕截图,并向 ChatGPT 询问有关如何改进它的提示。该系统可以分析图像,并就如何提高设计和转化率提供建议。对于网页设计师和开发人员来说,这可能是一个游戏规则的改变者,为他们提供了一个人工智能驱动的工具,可以就如何优化他们的设计提供客观的、数据驱动的建议。
新照片上传功能的另一个有趣用例是从图像中提取文本。用户可以上传文本截图并要求 ChatGPT 将其写出来。这在无法直接从文档或网页复制和粘贴文本的情况下特别有用。此功能对于经常需要从各种来源提取和分析文本的研究人员、学生和专业人士来说可能是一个福音。
新的 ChatGPT 图像上传功能的可能应用
在 ChatGPT 中引入图像上传功能为增强跨多个域的用户交互提供了大量机会。以下是此功能可能特别有用的一些方面:
家装
- 家具组装:用户可以拍摄未组装的家具零件的照片,并获得分步组装指导。
- 植物护理:拍摄植物照片以获取护理说明,或诊断叶子变色等问题。
汽车
- 机械问题:用户可以拍摄可能出现故障的汽车零件的照片,并获得有关是否需要专业维修的建议。
- 型号识别:拍摄汽车的照片以获取有关其品牌、型号和估计价值的详细信息。
购物和时尚
- 产品评论:用户可以拍摄他们感兴趣的产品的照片,并要求评论或与其他产品进行比较。
- 服装建议:上传服装图片以获取有关搭配配饰或鞋子的建议。
烹饪和烹饪艺术
- 成分替代:用户可以拍摄可用成分的照片,并在食谱中询问替代想法。
- 烹饪技巧:在各个烹饪阶段拍摄一道菜的照片,以获得有关它是否完成或下一步该做什么的实时建议。
户外和野生动物
- 动植物识别:用户可以上传他们遇到的动物或植物的图像,以了解有关该物种的更多信息。
- 远足径标记:拍摄远足路径上的小径标志或岔路口的照片,以获取有关选择哪条路线的建议。
教育与研究
- 文档摘要:学生可以上传长篇文章或书页的图片,以便快速摘要。
- 化学结构鉴定:拍摄化学结构的照片以进行鉴定或获取有关特性和用途的信息。
艺术与文化
- 艺术品识别:用户可以上传艺术品图片,以获取有关艺术家,艺术风格及其历史背景的详细信息。
- 历史文物信息:在博物馆中拍摄历史文物的照片以获取更多详细信息。
新照片上传功能的引入是 ChatGPT 更广泛更新的一部分,允许它看到、听到和说话,其中包括对不同照片形成逻辑和战略意见的能力。这种增强不仅为 ChatGPT 的功能增加了一个新的维度,而且还为用户开辟了一个充满可能性的世界。无论是对损坏的项目进行故障排除、集思广益、改进网站设计还是从图像中提取文本,ChatGPT-4 中的新照片上传功能都将彻底改变用户与 AI 交互的方式。