10 月 4 日消息,微软今日宣布,OpenAI 最新的 DALL-E 3 图像生成器现在可供所有 Bing Chat 和 Bing Image Creator 用户免费使用。而 API 则将在秋季的某个时候上线。
据微软介绍,DALL-E 3 是文本到图像生成的突破,由深度神经网络提供支持,可以从自然语言提示生成逼真且多样化的图像。
微软列举 DALL-E 3 部分特点:
- 相关性和提示遵循:DALL-E 3 遵循用户的提示,比以前的任何型号都更精确、更可靠。为了获得最佳效果,微软建议在提示中提供更高级别的细节 —— 信息越多,最终图像就越精细。
- 连贯性: DALL-E 3 在各种提示下生成的图像比其他模型更逼真。这些图像不仅在视觉上很吸引人,而且在逻辑上与提示一致。
- 美学: DALL-E 3 生成的图像不仅逼真,而且富有创造性和艺术性。图像可以采用独特的风格,满足用户的创造力。
在 9 月举行的开发者大会上,微软宣布将深化和 OpenAI 的合作,在 Bing Chat 中引入对 DALL-E 3 的支持,并于上周末宣布免费开放。该功能在过去一周左右的时间里逐渐开放使用,首先是针对必应企业用户,然后是必应图像创建器,现在该功能已对所有人开放。
微软将加装更多 GPU 以满足必应生图的 DALL-E 3 算力需求
随着大量用户的涌入,必应的图像生成器(基于 DALL-E 3)的生图速度也开始逐渐变慢,而微软最近也已经开始对此进行升级,通过引入更多 GPU 的方式提高算力,从而满足用户需求。
值得一提的是,必应的图像生成器所生成的所有 AI 图像都包含一个隐形水印,该水印遵循 C2PA 规范,其中标有最初创建的时间和日期,并确认图像是人工智能生成的。