midjourney最新v5版本解锁的逆天神技 -米乐网页

文/陈根

继openai发表gpt-4后,ai生成图片工具 midjourney亦推出了新版本midjourney v5。新版本不仅提升了图像细节处理和多人物处理能力,还解决了手指无法准确描绘的问题,更可以生成名人的相片。

midjourney v5的惊艳升级

midjourney是类似于dall·e的一种文本到图像的ai,专长于“漂亮”图像,即可以根据用户提供的文本提示生成华丽的视觉效果。鉴于其本质上是为“默认漂亮”而构建的,因此即使对于定义模糊的提示,它也能提供更可靠的“审美”图像。而且,midjourney可以通过在聊天应用程序discord中向机器人发送消息来使用,不需要编程。

曾经midjourney v4演绎的“六指琴魔”,在v5中几乎得到了堪称完美的解决。那么,短短数月的更新升级,到底做了些什么,会让效果一下拉高到如此“惊人”的程度呢?

首先是细节部分更加逼真。v5生成的效果可以说是越来越逼近照片效果了。不仅如此,在有面部特写时,各种肌肤纹理以及光影效果,比如说反射、眩光和阴影等,v5都能搞定。

其次,拥有了更多的可选风格。在discord发布说明中,相较于v4版本,midjourney v5版本拥有更多的可以选择的风格,分辨率也提升了2倍。单纯从风格上来讲,可以从0~1000中选择,stylize 0=照片,stylize 1000=更艺术。而且,v5还会对提示词更加敏感,用更少更精简的文本生成更好的有效的图片。

再者,经过这次升级之后,midjourney基本摆脱了“不会画手”标签,想要靠看手指数的多少来判别ai作画已经不管用了。
除了上面几点比较明显的升级之外,midjourney v5版本还更新了一些小细节,增添了些新功能。比如:更广泛的样式范围和更灵敏的提示语;更高的图像质量,改进的动态范围;更详细、正确的图像细节;以及,可以减少不需要的文本提示,支持无缝平铺的–tile参数,–ar宽高比大于2:1等。相比较于v3和v4,v5更“不拘一格”,并且经过调整可以提供更广泛多样的输出并对输入做出非常敏感的反应。一言以蔽之,v5 使用截然不同的神经结构和新的美学技术,希望能感受到人类集体想象力中某种深刻而深不可测的事物的进展。

 

免责声明:该自媒体文章由实名作者自行发布(文字、图片、视频等米乐体育官网app入口的版权内容由作者自行担责),且仅为作者个人观点,不代表 米乐网页-米乐体育官网app入口米乐网页-米乐体育官网app入口立场,未经作者书面授权,禁止转载。[投诉 · 举报作者与内容]

「作者 · 档案」
预见未来科技与商业,洞察前沿趋势新变化。

  
(0)

相关阅读

  • 亚马逊宣布了另外三个可再生能源项目

    这些项目是amazon多年来为建设风能和太阳能以为其运营和amazon web services云计算部门提供动力的工作的延续。在宣布这一消息之前,贝佐斯就在宣布自己公司的气候承诺(climate pledge)几周后,承诺到2040年使亚马逊实现碳中和,因此这些新项目可能标志着该公司将在不久的将来加强此类交易。

    2019年10月24日
    2.4k
  • 从ar眼镜到ar隐形眼镜,神经交互或将成为ar未来

    文/观察未来科技 今年年初,美国初创公司mojovision发布了全球首款ar隐形眼镜初创公司mojolens的原型机。近日,这款ar隐形眼镜在沉寂数月之后终于放出了新消息,宣布现…

    科技 2022年8月22日
    336
  • 文/陈根 可穿戴设备捕捉人体生物标记和生理数据是物联网时代的一大应用,在健康产业具有巨大的发展潜力。 比如,一个柔软的皮肤贴片就可以为重症监护室的病人提供一个更自由的选择,包括新生…

    2021年2月17日
    802
  • 文|陈根 当前,纳米技术经过数十年的发展,已经蔚然成风。纳米技术为物理、材料、化学、能源科学、生命科学、药理学与毒理学、工程学等基础学科提供了创新推动力,成为变革性产业制造技术的重…

    2021年12月2日
    425
  • 文/陈根 目前,随着全球化的发展,学习和运用多种语言的人数不断增加,他们能够精准地来回切换不同语言。这也促进了关于语言转换的大脑机制研究。 2017年就有一项研究发现,短期的双语切…

    2020年8月23日
    1.2k

发表回复

登录后才能评论
发布
网站地图