土木在线论坛 \ 建筑设计 \ 3dmax/sketchup \ 一键拖动就能让大象转身?AI最新技术逼死PS!

一键拖动就能让大象转身?AI最新技术逼死PS!

发布于:2023-05-29 09:31:29 来自:建筑设计/3dmax/sketchup [复制转发]


最近,一段 AI修图的演示视频在国内外网络爆火,甚至让众多网友表示:逼死ps!这是怎么回事呢?



也许看了下面一段视频的你会和小优发出一样的感叹。



 
是的,你没看错, 只需要拖动图像上任何你想改变的位置点,你就可以对图像进行变形,从而实现对动物、人物、风景、汽车等的表情、姿势、动作、形状和布局的改变,而且毫无违和感,仿佛是你又重新拍摄了一组照片。  

 
比如,让狮子「转头」并「张嘴」:  

 


改变小狗的姿态, 竖起狗子的耳朵、又或是转个头:



甚至让小狗下蹲,让马儿跑起来……



而我们所说的让大象转个身也都能实现,甚至还能让大象摆各种姿势:



当然,不仅局限于动物,还 可以调整形状、位置、尺寸、角度…甚至可以调整人的细微表情;使用范围也很广,能处理人类、动物、汽车、风景等不同类型的图片。



这种方法就是目前爆火的研究技术 “DragGAN” GAN 是生成对抗网络(Generative Adversarial Networks)的缩写 ,而这项技术被称为DragGAN。是由来自马克斯?普朗克计算机科学研究所、麻省理工学院计算机科学与人工智能实验室和谷歌的研究者们(其中包括两位华人研究员), 研究的一种控制 GAN 的新方法,能够让用户以交互的方式「拖动」图像的任何点精确到达目标点


DragGAN 类似于Photoshop中的扭曲变形工具,但更加强大 ,似乎有手就行。因为 它不是“挤压像素”,而是“重新生成物体”,甚至可以旋转三维图像 。这种工具的潜力在于,从文本生成图像的人工智能并不总是能输出你想要的结果,所以你可以在生成图像之后再进行编辑,而不必重新生成一个新的图像。


DragGAN目前还是一篇研究论文,但它已经引起了很多人的关注:



 
很多网友表示:“感觉自己要跟不上AI发展的速度了~!  

 
这篇论文已经入选了 SIGGRAPH 2023。研究者表示,代码将于六月开源。  

 
不过,也有网友指出了DragGAN目前面临的一些问题。例如,由于它是基于StyleGAN2生成的图像进行P图的,目前只能修改stylegan2模型生成的图像,而stylegan2模型训练成本又很高,因此距离真正商业落地可能还有一段距离。    

 


除此之外,在论文中提到的“单卡几秒钟修图”的效果,主要还是基于256×256分辨率图像。至于模型是否能扩展到256×256以外图像,生成的效果又是如何,都还是未知数。


有网友表示“至少高分辨率图像从生成时间来看,肯定还要更长”。


对此你怎么看呢?欢迎在评论区一起探讨一下吧!


全部回复(0 )

只看楼主 我来说两句抢沙发
这个家伙什么也没有留下。。。

3dmax/sketchup

返回版块

5.2 万条内容 · 79 人订阅

猜你喜欢

阅读下一篇

一分钟建出廊架?甲方你是懂设计的!

?? 凌晨一点了,是谁还在熬夜建模! 噢!原来是我呀   因为 甲方 daddy 的要求 需要制作出一个 异形景观廊架 起初我以为是酱紫的廊架...

回帖成功

经验值 +10