ai绘画人生成器 AI作画的人机战争走向何方?
AI对于人类职业的影响及其引发的舆论波澜,迅猛到让人难以想象。还记得2017年,AI还是个标准的新生事物,我们的核心工作之一就是向读者们解释,同声传译、漫画作家、主持人等人类工作短期内仍是无法被AI取代的。而到了今年,一场因AI作画而引发的人类画家危机大讨论却在国内外社交媒体上演。
DALL-E 2, , , AI, Wombo Dream, Make-A-Video, Novel AI……这些从文本生成图像的AI作画工具大量出现,越来越受欢迎,市面上由AI生成的画作越来越多,不断刷新着大众对AI能力边界的认知,大量围绕AI作画的争议、AI取代人类画手的忧虑,喷涌而出。
在AIGC的激变时刻,关于AI作画的法律、伦理等问题也变得愈发重要,这场人机战争究竟走向何方?我们尝试用一文说清整个事件的起承转合。
起:引发众怒的科技与狠活
AI生成的艺术画作已经存在了很长时间,2017年,AI绘画就成为佳士得、苏富比等高端拍卖场所的座上宾,拍出过数百万美元的高价,除了引发行业内人士的一些分析和唏嘘之外,大众舆论场并没有掀起什么波澜。
然而,对AI作画的声讨,却在近几个月来,在社交媒体中发展到了一个高峰。
其一,大量画师宣布抵制AI。今年8月29日,一个名叫mimic的AI绘画网站上线了测试版,允许用户上传15至100张图像让AI进行学习,然后输出相同画风的AI画作。然而一些未经授权的画作也被上传学习,把AI生成的画作当做自己的创作进行售卖。随后又出现了有人将刚刚去世的画家尚在版权保护期间的作品上传给AI学习,这些动作相继引发了大批原创作者的不满,从而抵制“AI学习”。
其二,舆论危机波及几乎所有主流AI绘图工具。mimic事件直接激发了大量画师和读者对AI的不满情绪,有人删除了自己的公开画作,有人开始诉诸法律条文,一时间针对数据版权、技术伦理等的争议,也开始波及DALL-E 2、和 等知名AI生成工具。人们发现,一些很火的工具如,训练学习所使用的数据来源网站也存在上传无授权图片的情况。
网站发布的声明显示,像这样的生成器是在数千个网站的数十亿张图片上进行训练的,包括Pixiv、、和等艺术家网站,以及、等网站,所以从平台上删除作品并不会阻止AI继续使用画家在其他网站的作品。也就是说,只要是网络上开放的,就有可能成为学习数据,除了询问模型的开发者之外,没有其他方法可以阻止自己的作品被AI学习,除非画家把自己的画全网都删完,否则也很难一一查清楚是否被用来学习了。
其三,个人使用AI作画出现了大量争议现象。随着开发门槛的降低,大量个人AI开发者使用开源工具也出现了大量意料之外的情况,比如有人使用AI生成yhsq等违规内容。9月6日,用AI绘图工具生成的《太空歌剧院》在美国科罗拉多州举办的博览会艺术比赛上获得数字类别中的头奖,也引发了不小的争议,因为作者所付出的劳动就是输入描述文字,AI就会将画作按需求创作出来,被网友认为是“见证了艺术的死亡”“没有意义,没有灵魂”,艺术家Genel 更直言,“用一幅AI画作在艺术领域获得一等奖,真是该死的事”。
(《太空歌剧院》)
担心AI取代人类画师,将AI作画视为对人类能力的贬低,成为一种正在传染的情绪。
如前所说,AI生成绘画并不是什么新鲜事物,为什么偏偏近期突然在大众群体中掀起了水花,引发众怒?人当然不是只靠最后一根稻草压垮的。
承接:AI作画的内卷之路
有必要先来简单了解一下,AI作画是如何在几年间从拍卖行、收藏家们关注的小众艺术,成长为大众创作的主流标配。
计算机视觉一直是深度学习的主要任务方向之一,包括目标识别、目标跟踪、图像分割、图形处理等,有着大量成熟且广泛的应用。具体到图像生成领域,2015年左右,AI艺术创作主要是通过基于卷积神经网络的迁移学习,来进行图像风格转换,先对图像内容进行语义分割,再将内容和场景通过线条弯曲、风格迁移等手法,转换成指定艺术风格,类似美颜软件的“滤镜”功能。显然,这种生成方法的艺术价值并不高,能一键p图的人也并不因此就自认是大艺术家,而且经常出现很鬼畜的作品,谷歌深度学习绘画系统加工过的图片就十分诡异。
AI生成真正开始展现出艺术价值和媲美人类的水平,是从2016年生成对抗网络GAN( Nets)的走红开始的,GAN模型的原理就是让生成器网络和判别器网络相互对抗,从而创作出真实度和准确度都更高的全新图像。这一时期,各种XXGAN的图像生成器出现,诞生了大量“以假乱真”的艺术作品。2018年10月佳士得以43.25 万美元的价格拍卖了由AI创作的《爱德蒙·贝拉米肖像》,成为人类历史上首次AI艺术品拍卖。
但是,GAN也不能摆脱传统AI深度模型的问题:无法理解“逻辑”和“常识”,比如AI能够根据文本关键词把元素堆叠在一起,但因为无法理解隐藏在自然语言背后的逻辑关系,所以经常会画出非常“克苏鲁”的反常识作品。而改变,来自预训练大模型的兴起。
通过大规模数据和暴力计算而训练出来的大模型,展现出了强大的鲁棒性,不仅在机器视觉领域表现优异,而且还不断迭代出了跨模态生成的能力,推动AI生成从语言走向视觉。这一波 “文本转图像”绘画工具能够产生以假乱真的画作,背后的“脑力”普遍来自大模型基础技术的支撑。在AI绘画工具上展开技术竞赛的谷歌、、百度等都是大模型技术的佼佼者和AIGC的推动者。
(KREA一键生成的安迪·沃霍尔风格的“赛博朋克脑极体”)
读懂了AI作画的技术传承之路,也就不难理解,为什么AI创作的争议会在此时此刻被发酵。
首先,巨头云集,技术进展超乎想象。AI作画汇聚了大量科技巨头“亮肌肉”,包括谷歌、、Meta、微软、百度、腾讯等AI能力者,使得技术突飞猛进,工具数量以前所未有的速度爆发性增长,AI作画(图像生成)能力也因内卷而达到令人震惊的水平。2021年1月,推出了DALL-E一年后,又推出了最新的DALL·E 2,分辨率提高4倍,可以从自然语言的描述中创建逼真的图像。谷歌内部就卷出了多个AI绘图工具,包括、Parti等,微软推出的AI绘图平台则起名为NUWA女娲,足见野心不小。
大模型优秀的生成效果,使得AI作画具备了一定的实用性和商用潜力,包括结合文本生成插画、创意工作的初样展示、自动完成勾线等重复机械劳动等,AIGC在走向产业的同时自然面临传统从业者的怀疑。
(DALL-E以“骑马、宇航员”为关键词创作的绘画)
其次,大模型的积极开源,让AI作画门槛一降再降。
这一轮主流的AI绘图工具都选择了开源,繁荣大模型的开发生态,降低技术的使用门槛,任何人都可以使用这些工具进行创作,有的甚至是免费的。比如英国初创公司 AI打造的就完全开放,在9月28日开放了Dall-E 2 并提供免费试用,在10月3号开放,都吸引了大量用户前去使用。