在创建过程中利用生成式AI工具,并将微调留给人类专家,他们将生成的输出提升到一个新的水平 – 根据GenAI专家的说法,这一愿景不仅适用于营销和软件开发,而且适用于几乎所有行业和企业。
生成人工智能无疑是 2023 年的主题。2022 年最后一个季度和 2023 年的头几个月开始于围绕生成式人工智能及其可能的商业应用的巨大呼声。ChatGPT和像Dall-e这样的图像生成应用程序占据了头条新闻。
根据谷歌趋势,对这些工具的兴趣正在上升。他们目前的表现超过了对最新电影(如《阿凡达:水之道》)或流行名人(如金·卡戴珊)的兴趣。
围绕生成式AI的呼声受到Midjourney和Dall-e等工具的推动。这些使任何人都可以以最少的精力和费用轻松创建高质量、逼真的图像。这两种工具都被视为节省时间和精力,并引发了对版权的担忧。
这些挑战在GenAI会议期间得到了解决,可以说是第一个促进生成AI生态系统与企业之间合作的会议。
贾斯珀的GenAI – 关键要点
超过1200人参加了在旧金山举行的GenAI会议。这是商业和生成人工智能专家和爱好者会面和讨论用例、新想法以及利用新工具为公司谋福利的方法的地方。
三位演讲嘉宾宣布会议开幕
- 扎克·金(Zach King)——一位网络名人,以制作数字幻觉的短视频而闻名,他使用人工智能生成的图像讲述了他的故事。
- 哈里·麦克(Harry Mack)——一位节拍拳击手和即兴喜剧艺术家,曾与吉米·法伦(Jimmy Fallon)、美国达人秀(America’s Got Talent)和艾伦·德杰尼勒斯秀(The Ellen DeGeneres Show)一起出现在《今夜秀》(The Tonight Show)中,后者对生成式人工智能输出进行了嘻哈诠释。
- Aleah Bradshaw – 教育家和大满贯诗人,目前与Youth Speaks合作,他提出了有关艺术在“做人”中的作用的问题。
这些演讲之后是更多面向商业和公司的演讲,其中包括对GitHub前首席执行官Nat Friedman和OpenAI产品和合作伙伴关系副总裁Peter Welinder的采访。这些小组为生成式人工智能在当今公司中的应用提供了有趣的见解。
要点1:营销的未来(但不仅如此)
会议专家表示,生成式AI模型可用于创建逼真的视觉效果和内容,营销团队可以使用这些视觉效果和内容来节省时间和精力。这也使公司能够更多地关注创造力、研究和战略。
在营销中使用 Jasper.ai 等工具之后,会议强调了Copilot和类似的编码支持工具在软件开发中的作用。使用这些,软件工程师可以专注于解决复杂的问题,而不是陷入无休止的、通常是可重复的代码行的泥潭。
未来通常关注从可重复和无创造性的任务转向需要纯粹人类能力的精细任务,如综合思维和交付新的高质量内容,这些内容不一定基于以前存在的东西。事实上,所有 AI 生成的文本或来自文本的 AI 图像生成器都利用了预先存在的内容。在满足创建新事物(或数据中代表性不足)的需求时,人工智能艺术生成器或人工智能文本生成器可能被证明是不够的。
要点2:人情味对于保持表面至关重要
尽管人工智能(AI)思想领袖强调了增加劳动力而不是用人工智能和自动化系统取代劳动力的作用,但担忧仍然存在。
根据世界经济论坛的一份报告,在未来十年内,多达三分之一的工作可能面临自动化的风险。另一方面,技术的发展预计将创造数百万个就业机会,而不是取代的就业机会。
这个过程与ATM机的引入相当。乍一看,引入一种能够随时存入或提取现金的机器,24/7全天候可用,并且从未表现出任何疲倦的迹象,预计将导致银行员工大规模技术引起的失业。但事实并非如此——事实上,由于管理分行的总体成本降低,对银行出纳员的需求增加了。
根据在会议上发言的专家的说法,在等待自动化的领域工作的专业人士也是如此——人情味将始终是必要的,专业人士的技能将被视为将平庸转变为杰出。
要点3:模型会变大变小
基于人工智能的系统可能以前所未有的水平耗电。根据马里兰大学副教授汤姆·戈德斯坦(Tom Goldstein)的估计,运行ChatGPT每天花费约100万美元或每月约3万美元。这是许多公司希望运营的水平,而不仅仅是在他们的解决方案上花费。这主要涉及电费——全球很大一部分电力是由化石燃料产生的,因此人工智能训练对气候变化做出了重大贡献。因此,不仅货币成本,而且环境成本也起作用。
另一方面,在本地机器或连接设备上部署了狭窄的、集中的模型。
这两种类型的模型将继续提供,这些技术最终将遵循不同的路径。狭义模型将找到通往精确用例和促进特定应用程序的成本效益的方式。例如,这种型号可以在相机中支持深度估计,同时在与Raspberry Pi相当的芯片组上工作。
第二个用例是运行成本数百万美元的模型,将继续出现在自动化助手和多功能模型中,这些模型需要稳定的互联网连接和巨大的计算能力才能运行。
要点4:模特需要停止幻觉
在围绕 ChatGPT 用例和性能的乐观讨论中,有一些举报人强调了模型不时出现幻觉的事实——这是计算机中从未见过的。
什么是模型幻觉
AI模型幻觉是一种现象,AI模型自信地向用户提供听起来可信的信息,但AI的训练数据似乎不合理。示例可能包括模型缺少或编造信息。由于创建模型的方式,即使被人类纠正,它们也倾向于坚持自己的反应。
这种现象是以心理学意义上的幻觉命名的——就像当一个人看到现实世界中不存在的东西时,模型会在它所训练的数据中“看到”事物。
幻觉模型在提供完全无意义的响应或误导用户时可能会以从有趣到有害的方式行事。ChatGPT被科学家当场抓住,完全为他们编造了整个科学文章和参考书目。
这种情况需要结束,特别是如果这种模式在对人们生活产生重大影响的领域得到应用。
信息检索将是构建未来模型的关键要素,并且对模型输出进行更多控制的过程已经开始。
要点5:集成就是一切
ChatGPT,Midjourney和Dall-e之所以受欢迎,主要是因为它们以方便的形式提供。人们只需要一个浏览器就可以享受它们。如果一个人更精通技术,则很容易使用 API 构建解决方案并启动基于模型的大型产品。
专家们强调了为工作流程和程序注入人工智能支持的能力。模型越灵活和通用,将微小(或更大)形式的自动化应用于系统的机会就越大。
这将通过可以由本地机器运行和访问的开源模型的出现得到进一步支持。因此,将提供更大的安全性和更快的性能。此外,这还解决了缺乏快速互联网连接的问题,例如在货船、远程钻井平台或远离人类住区的工业设施中。
总结
生成式人工智能是几乎所有企业和行业的游戏规则改变者。这仅仅是个开始,ChatGPT激发了人们的兴趣,像会议主持人 Jasper.ai 这样的工具,迈出了迈向基本上一切未来的第一步。
“我喜欢参加 Gen.AI 主要是因为围绕生成式人工智能的积极氛围。我是长期使用生成模型的研究科学家,我很高兴看到这些解决方案将在未来如何改变世界,“Tooplox的ML研究员兼弗罗茨瓦夫科技大学副教授Maciej Zięba评论道。
会议在旧金山举行,与会者来自世界各地。这是会议的第一届,浓厚的兴趣清楚地表明市场需求量很大。
Tooplox是全球人工智能领导者之一,在构建基于人工智能的解决方案方面拥有无与伦比的经验。凭借我们在提供生成式人工智能方面的经验,我们支持我们的客户使用尖端技术丰富他们的工作流程。