IT之家 5 月 21 日消息,近日来自马克斯・普朗克计算机科学研究所、MIT CSAIL 和谷歌的研究者们研究了一种控制 GAN 的新方法 DragGAN,只要点击拖拽,用户就可以“改变汽车的尺寸或者将人物的笑容变成皱眉”。DragGAN 目前还是一篇研究论文,但它已经引起了很多人的关注,由于观看其演示视频的人太多,以至于研究团队的主页都因为流量过大而崩溃。
DragGAN 类似于 Photoshop 中的扭曲变形(Warp)工具,但更加强大,因为它不是“挤压像素”,而是“重新生成物体”,甚至可以旋转三维图像。这种工具的潜力在于,从文本生成图像的人工智能并不总是能输出你想要的结果,所以你可以在生成图像之后再进行编辑,而不必重新生成一个新的图像。研究论文中展示了一些演示案例,包括增加山峰的高度,改变模特的姿势和衣服的长度和形状,张开或闭合狮子的嘴巴,以及将一个人的表情从平淡变成微笑。
目前很多公司都在尝试提供一些针对生成性 AI 内容的功能,但不能编辑 AI 生成的图像。
IT之家注意到,由于 DragGAN 目前还只是一个演示,还不清楚什么时候真正推出,以及推出后的效果如何,尤其是考虑到演示视频都是基于低分辨率的图像。不过这个技术的潜力还是非常大的,如果你也接到了“把大象转个身”的 P 图需求,未来这个技术可以帮你完成任务。