AI、绘画与AI绘画——解读与预测
(长文+多图预警)
这个题材我酝酿许久。
在此期间,围绕着这个话题在中英文互联网上都产生了激烈的交流和冲突。
身为老二次元,关于AI绘画的消息和动向我都十分关注,亲自体验也学习了解了一些其背后的工作原理。
上个月我发了一篇文章“我被AI绘画震撼了”,这里把图贴出来,就作为本文的封面。
封面
那么,我希望这篇文章可以帮助你更好的理解这个新兴事物,而在这之后无论你是支持它还是反对它,都能够对自己的观点有一个更加充分的了解。
本文不表达任何立场。
丨首先,定义AI绘画。
中文这个东西,断句真是艺术。
AI绘画这个词汇,很容易给人一种未知的恐惧感。
大多数人初次去理解它,都会说成:「AI · 绘 · 画」。
但实际上,它的真正含义是:「AI绘 · 画」。
这两个说法之间的区别,可大了去了。
「AI · 绘 · 画」是一条有着完整结构的句子,它包含主语、谓语和宾语。
而「AI绘 · 画」则相对残缺,这里的“AI绘”构成一个单独的动词,句子缺少主语。
主语是啥呢?
是人。
我们平时描述一个人正常绘画会说:
“他用笔画画”。
同理,“他用数位板画画”,“用沙子画画”,“用%¥画画”...无论什么都一样。
而“AI”,并不会超越这个句子结构,完整的表达依旧是:
“人用AI画画。”
AI是工具。
各位在站队表达立场的时候请务必明确:我们支持/反对的不是“AI绘画”,而是用AI绘画的人。
在呐喊之前,切莫被未知的洪流压倒,敌人并不可怕,这永远是人与人之间的斗争。
为了更好的理解这个概念,我需要进行一些详细的解释。
丨AI绘画的原理是什么?
我既不懂AI,也不懂绘画,好在我会使用搜索引擎。关于AI绘画原理的通俗解释有很多,我尝试用更加通俗的语言向你们介绍。
有一个悖论是这么说的:
在空旷的宇宙里,有一只猴子,和一台打字机。
猴子很无聊,打字机也积灰。于是猴子开始随机在屏幕上敲出字来。
如果这个过程可以历经无限长的时间,那么这只猴子最终将敲出一部流芳百世的《哈姆雷特》。
而这只猴子,也被后猴尊称为“莎士比亚猴”。
AI就是这只猴子。
我们先回到猴子。聪明如你,肯定已经计算出,如果把猴子敲键盘的概率、时间、与《哈姆雷特》的字数这些要素综合起来,那么猴子敲出一本大作所需要的时间大概率会远远超出宇宙的寿命。
这玩意没用啊!
欸,且慢,“没用”这个形容词只是相对我们人类而言的。
无限的宇宙有无限的智慧文明,其中又有无限恰好同样使用英语作为语言的种族,这些英语之中又有无限只路过了这只猴子的宇宙舰队...
那么,用无限除以无限,说不定在我们人类眼中是一堆乱码的文字,在其他种族眼里就是一本《哈姆雷特》。
这只猴子,既是相对的蠢材,也是相对的天才。只是大多数时候,我们人类无法理解它。
为了让只猴子可以“天才”的稍微标准一点儿,我们就需要对它进行“驯化”。
过程很简单,如果在无限的码字旅程中,这只猴子偶然敲出了一串人类可以理解的词汇,比如说“”。作为奖励,我们就喂它一根香蕉作为奖励。
次数多了,这只猴子就会把“”和“食物”联系起来。在后面的创作过程中,它就更有可能敲出“”这个单词。
其他的像“”“yes”“no”这些词汇同理,时间长了,猴子能敲出的词汇也就越多,也越有规律。
那么下一步,就是训练猴子进行有逻辑的句子的表达。
如果在漫长的时间后...它又恰巧敲出了:“To be, or not to be: that is the .”这种句子。你给它喂更多的香蕉作为奖励,这样一步一步...
最终,莎士比亚猴理解了你,也就是人类的表达。《哈姆雷特》的问世,就在下一个轮回。
AI学习绘画的过程,就是猴子理解莎士比亚的过程。
例毕。
计算机是天生的画手。
无论图像如何,最终落到屏幕上都要由像素点来表达。
像素点是有限的,而每个像素点可以呈现的颜色也是有限的。
一张任意大小的画布,它都可以在每一个像素点上扔进去一个随机的颜色,从而形成一幅画。
但是,就和莎士比亚猴一样,计算机这样作出来的画,99.9999%的情况下是人类无法理解的糨糊与怪异。(也许对某颗星星上的外星人来说这是杰作。)
与之相比,“三条腿”,“七根手指”这些东西起码能够为我们所认知。
那么,为了让AI可以脱离上述状态,实际为我们应用,也需要对其进行训练,也就是俗称的深度学习。
这个过程和我们训练猴子类似,我们随机给一些图片标注一些要素,AI尝试对图片进行大量的随机理解。这些理解中符合人类需求的留下,不符合的就剔除,大量重复这个过程。
「AI」学习的并非“如何去绘画”,「AI」学习的本质上是“人类的审美”。
量变产生质变,当AI终于理解《哈姆雷特》才是人类爱看的书籍之后(即知道人类需要的是什么),它对于行业的冲击就要来了。
AI是工具。
丨行业冲冲冲——击?
无论你是否愿意接受,AI绘画的冲击已经到来了。
这是我前几天看到的新游戏,它的图标,立绘,使用的都是AI绘画。
(小道消息,不少大厂已经开始进行AI绘画实验了)
在我们知晓不多的小众领域,利用AI已经是常态。
不过即使如此,7年前的阿尔法狗也并没有取代人类棋手。这场冲突的结局如何,现在不可能轻易定论。
在这里,我基于一些浅薄的理解,给出自己的预测:
(使用)AI绘画(的人)可能会取代绘师,但一定不会取代艺术家。
我咨询过一个专业学画画的朋友,据她所说,反正是并没有直接感受到AI对于稿费的影响。说原因,还是AI不太能够理解人类的需求,改图麻烦。
的确,现在的AI在精细化控制上还存在不少毛病,更是很难做到“修改某一特定内容”。在这个领域,用AI反复测试的成本说不定不如请个画师改改图。
但我觉得这并非人类艺术家真正不可被取代的地方。
注意,我们接下来讨论的,应当是使用AI绘画的人与画师之间的差异。
首先,画家学习的不仅仅是绘画技巧。
大家有没有想过,绘画是什么?
甚至比语言更早,我们自古以来就会画画。甲骨文本身就是一种特殊的绘画形式。
绘画的本质,是表达。
而AI在表达上,天然存在缺陷。
经过AI编写的信息,永远会带有“驯化者”的痕迹,而不能充分的表达“使用者”当下的意志。
这一方面意味着画家习得的“用画面表达思想”的能力不会被取代,另一方面意味着AI对于人类社会审美标准的追赶,会存在一个时间差。
我在上面列举了一张梵高的画,以如今的AI技术,可以轻易复刻上万张类似的图片。
但人们凝视《星空》的时候,仅仅只是在凝视星空么?
他们凝视的还有梵高的注视,还有梵高对于那个时代的呐喊,还有梵高在执笔落画之时,所桎梏的一切。
哪怕是你随手在纸上刻出的三两笔,同样也蕴含了你的思想,你的表达。它再难看,也在层次上高于AI批量生产的内容。因为前者可以被人类所解读,而后者不能。
这是独属于人类的技能,也是永远无法被AI取代的技能。
因此我认为,除了引领潮流的顶级画师之外,越是倾向于追逐用户审美而弱于表达的,就越容易被新技术取代。
而越是倾向于思想表达的绘法,则反之——它们在未来的时代会更加珍贵。
一家之言,仅供参考。
另外,画师日积月累的,还有设计能力和美学感受能力。
能否利用好AI绘画,实际上相当考验用户的这两方面能力。前者决定你是否可以设计出丰富有深度的角色,后者决定了你是否可以快速判断AI产出的图片能否获得市场认可。
所以长期沉浸在画画里的人如果积极掌握新技术,往往也有比普通人更大的优势。
目前利用AI辅助绘画的画师已经不在少数,可以在某乎了解。
丨关于AI绘画目前的局限
AI进步的速度有目共睹,从最早舆论爆发到可以精确控制角色,到如今可以精确控制姿势,AI朝着“实现脑海中的画作”这个方向迅猛前进着。
但,硬件能力,属实限制了我们的入场和这项技术成为基础技能的可能性。
前文说过,AI产出一张图需要往一张图上的每一个像素点随机分配一个颜色,而如何使其成为一副好看的画就需要其对每一个像素点进行计算。
这个计算量是随着图片大小指数增长的(从400×400到4000×4000,边长仅仅翻了十倍,但计算量可能翻了1000倍不止)。
所以它对显卡要求极高,普通人根本玩不转,这是其一。
其二,目前的AI画作在画面里内容之间的逻辑关系的展现能力相当之差。这也意味着它在大型商稿方面还处于“仅供参考”的阶段。
如果贸然使用AI绘画,可能画师和审核都没能发现的逻辑错误会被玩家发现,玩家实际上对于画面的逻辑性要求是很高的。
(如之前的《白夜极光》事件)
声明:本站所有文章资源内容,如无特殊说明或标注,均为采集网络资源。如若本站内容侵犯了原著者的合法权益,可联系本站删除。