介绍
Midjourney是一个由位于美国加州旧金山的同名研究实验室开发之人工智慧程式,可根据文本生成图像,于2022年7月12日进入公开测试阶段,使用者可透过Discord的机器人指令进行操作。该研究实验室由Leap Motion的创办人大卫·霍尔兹(David Holz)负责领导。
以下这些功能它都可以实现:
- 人像卡通化:将人物照片转换成有趣的卡通形象。
- 轮廓生成:可以根据输入的文字描述生成对应的图像轮廓。
- 色彩生成:利用GAN模型,可以生成具有艺术感和创意的彩色图像。
- 视频换脸:可以实现对视频中人物的面部进行换脸操作。
- 视觉问答:通过图像识别和自然语言处理技术,可以实现对图像的问题回答。
- 人脸合成:可以将不同人物的面部特征进行合成,生成新的面孔。
以上这些技术和工具,涉及到计算机视觉、自然语言处理、深度学习等多个领域,具有很高的技术含量和实用性。同时,这些技术和工具也为数字艺术和创意产业提供了新的可能性和创新空间。
模型
Midjourney一直在努力改进其算法,并每隔几个月发布新的模型版本。他们的算法第二版于2022年4月推出,第三版于7月25日发布。2022年11月5日,第四版的alpha迭代版发布给用户使用,第五版的alpha迭代版于2023年3月15日发布。
常规模型 | |
---|---|
版本 | 发布日期 |
V1 | 2022年2月 |
V2 | 2022年4月12日 |
V3 | 2022年7月25日 |
V4 | 2022年11月5日 (alpha) |
V5 | 2023年3月15日 (alpha) |
V5.1 | 2022年5月3日 |
V5.2 | 2022年6月22日 |