您的位置:主页 > 公司动态 > 公司新闻 > 公司新闻

新版Midjourney绘图工具,太炸裂了-香港期货开户

已往几个月,以ChatGPT为首的谈天机械人搅得科技界满城风雨,人人都忙着去跟各家的AI谈天,让它们来写邮件、写代码、写诗。而当语言模子在大跨步向前进化时刻,AIGC的另一个主要分支——绘图,最近实在也完全没闲着。

去年曾因拿下艺术竞赛大奖而名噪一时的Midjourney,近期在AI天生图片领域热度可以说堪比OpenAI。MidjourneyV4版本去年年底险些跟ChatGPT同期上线,而就在上周GPT-4推出的时刻,Midjourney也飞速推出了第五代版本,而这一次的更新堪称“炸裂”。

一周以来,种种用Midjourney天生的神图层出不穷,国足夺冠、特朗普插秧、教皇打碟、异形下乡……只要你敢想AI就敢画,而且随便拿出一张都能做到以假乱真的水平。但可能有创作的伪照片过于真实,引起了太多争议,太多新用户涌入导致服务器不堪重负,本周二,Midjourney宣布关闭了其免费账户的使用通道。

不外,另外一方面,在人们疯狂娱乐的同时,一些人也实验着把ChatGPT和Midjourney连系起来使用,一些由人类构想、AI主导和操作的“人机互助”作品也逐渐展现出了商业化应用的轮廓。

|当图片向照片进化:一个由AI缔造的平行天下降生

你有没有想象过这样的画面:

在不久前落幕的卡塔尔天下杯上,整个绿茵球场酿成了一片红色的海洋。人人欢呼雀跃,全场掌声雷动。

图片来自小红书博主,账号:Ai船长

爱因斯坦没有泛起在实验室里,而是梳着标志性的发型,在音乐节上狂欢。

图片来自推特

马斯克没有在21世纪造火箭和电动汽车,而是穿越到了苏联工厂,真正当起了一名“钢铁侠”(工人)。

图片来自推特

这样的天下,你以为怎么样?

以上这些无比真实的照片,并不是由谁花了大量时间PS制作的,而是许多通俗人通过动一着手指头,打几个要害字,就让人工智能在十几秒内所自动天生的。

作育这以假乱真天下的幕后推手是一个名为Midjourney的AI天生图片工具。可以说, 现在在AIGC绘图领域,MidJourney是一个比OpenAI还神奇的存在。Midjourney没有任何巨头的重金支持,是一个自筹资金的自力研究实验室,它的提议人为曾两次拒绝苹果收购的Leap Motion公司的首创人David Holz,现在全职员工仅有11人。

但就是这么一个超小型团队,却是当前AI绘图领域最炙手可热的明星,甚至将OpenAI的DALL-E、Stable Diffusion、英伟达的GauGAN2等同类工具都甩在了死后。

|比肩GPT的更新速率,赞叹和争议相继到来

Midjourney的迭代速率相较于OpenAI可以说是有过之而无不及。去年3月份*版本首次上线,4月份便敏捷更新第二版本,接着7月份上线Open Beta V3版本首次向民众开放,之后以其怪异的艺术性气概吸引了一些用户。其中,最出圈的就是这张由通俗人给出提醒词、AI认真创作,跟人类艺术家同台竞赛之后斩获金奖的油画。

之后Midjourney并没有停下更新的脚步,11月又推出第四代版本添加了更多图片气概,紧接着今年3月份,Midjourney V5版本登场。此次V5版本的更新之以是能引发大量关注,主要是由于它解决了一个手艺难题和完成了一次跨越性的突破。

其中,手艺难题指的是——画手。

让AI画出真切的人类手部特征是一个看起来简朴但却出奇庞大的义务。首先,在 AI的训练图集中,手往往都不是图片的重点,同时人们握手、牵手、拍手等差异状态下手部形态各异,很难形成尺度化的模版,这也就造成了AI学习难度的激增。

此外,即便对于传统人类画师来说,画手也是最难题的地方之一。手的几何形状庞大,并没有一套尺度的线条或形状,指枢纽上的皱纹和褶皱、手掌上的阴影等细节异常多,而且每小我私人的手都纷歧样,是*的存在,并不能套用。

因此准确并细腻化地画手对于所有的AI工具来说都是一项难题的挑战,在Midjourney的V5之前,行业内的AI绘画工具都无法很好地完成。

Midjourney(左)、Stable Diffusion(右上)和DALL-E 2(右下)此宿世成的新鲜人手,图片来自buzzfeednews

但现在,Midjourney V5版本的已经*解决了这个问题。

图片来自推特

不仅告辞了六指或畸形,还能连系人物特点画出差异状态和岁数画出差其余手部细节,就连在光影中的手指纹路也能被*出现。

蔡嵩松又找回了他的姓名

图片来自于mpost

而除了攻克了画手这个手艺难题之外,Midjourney V5此次另一跨越性的突破在于——能够天生照片级的图片,而且照样摄影大师拍的那种。

在V5之前,Midjourney天生的图片总体以卡通或超现实气概为主,但V5版本能够支援包罗真实、抽象、油画等更普遍的气概,图像解像度比上个版本提高2 倍。而此次写实气概的上线,可以说直接到了让许多摄影师都要叹息“摄影学不存在了”的境界。

好比,以“90年月大街上的模特”为主题,*缔造出真假难辨的照片。

图片来自推特,账号Nick St. Pierre

以“你好小同伙”为主题,用胶片质感完成童年重现。

图片来自小红书博主,账号:逗比

以“发生飓风的新闻报道”为主题,无中生有地去还原一个灾难现场等等。

图片来自推特

从以上这些照片示例中可以看出,Midjourney的写实图片天生并不局限于一种牢靠的气概,而是会凭证你形貌场景和想要的气概来智能化的调整色调、像素、镜头语言等。最近Midjourney产出的许多图片,甚至已经到达人的肉眼无法判别真伪的水平。

若是从手艺的角度,Midjourney的提高无疑是让人惊艳和赞叹的。但可能也由于这些照片太过于真实和太多新用户的涌入,本周二,Midjourney宣布关闭了其免费账户的使用通道。剖析以为,此举也是为了防止更多离谱的“照片”泛起,从而扰乱现实天下和散布有害信息。

好比,此前真的就有媒体以把特朗普被捕的天生图片当成了真实现场照片,从而造成了虚伪新闻的泛起和发酵。此外,Midjourney现在的要害词审核机制并不严酷,因此也存在发生大量有害照片的风险。Midjourney示意他们正在进一步增强对于AI天生内容的羁系和审核。

图片来自于The Verge

| ChatGPT Midjourney强强团结,AI作品走向商业化应用

现在,MidJourney仍然需要连系Discord使用,使用方式依然很简朴,通过输入文字和一些参数要求形貌即可。现在还支持用户上传自己的图片,再凭证图片举行AI天生。

现在,一段完整Midjourney的“咒语”示例也许如下:

A man in futuristic armor with cyberpunk details(对想要出现图片的文字形貌,可以添加更多细节),shot on Canon R6 with 50mm f1.2(气概形貌,可以提出是什么装备拍摄的、或者是以哪位着名艺术家或摄影师的气概),--v 5(使用第五代版本手艺)--ar 4:6 (画幅比例,V5 版本中你可以自界说任何比例)--iw 1(输入的参考图片的权重占比)

虽然咒语的组成并不算庞大,但对于许多只有一个模糊想法的通俗用户来说,若何让Midjourney来画出自己脑中图像仍然对照难题。于是,ChatGPT也登场了

ChatGPT能施展什么作用呢?首先你可以模糊地形貌你的构想,让ChatGPT拓展成一个充满细节的画面形貌,接着让它从这段文字形貌中提取要害词。然后,你可以将Midjourney的提醒句的语法组成告诉ChatGPT,再通过几回训练让Midjounery记着若何通过你输入的要害词来确立Midjourney的下令语法。

之后你只需要复制粘贴ChatGPT给你的指令粘贴到Midjourney的下令框里即可天生图片,若是你不知足还可以让ChatGPT来继续帮你修改完善要害词。

现在,已经有许多人已经在实验将ChatGPT和Midjourney连系产出的效果,应用于自己的事情中。好比,做电商的不再需要去花大价钱去找摄影师、设计师,而是只需要把产物图片和要害词提供应AI工具,就能直接天生商业大片。

图片来自小红书博主,账号:阿汤娇娇啊、阿泰ATAI动态视觉

未来甚至也不用找真人模特了,直接用AI天生就行。

另有人将其用于室内家居设计领域,辅助自己来做网站、天生宣传图片等。

可以预见的是,ChatGPT和Midjourney的互助可能仅仅只是AI商业化应用的一个劈头。随着AI手艺的快速生长,种种工具的泛起让AI的应用局限也会指数级的扩大。现在,在设计、电商、广告、游戏、影视等各个领域都涌现出了更多的用例,在娱乐性大大增强的同时,全新的时机赛道也在被开启。