EN
【原创研究】AI,正在成为艺术家?
来源: 远桥资产-陈天伦日期:2022-12-29浏览量:378

图片作者 | 投资总监 陈天伦


图片

 
(答案揭晓在文章底部)

AI写诗,能否诞出下一个李白?
AI绘画,能否替代人类画家?
 从“AI画家”到“AI诗人”,再到参与高考作文的“AI考生”,人工智能会不会让更多人“丢掉饭碗”?

当我们欣赏“以假乱真”的AI大作时,不禁也为人工智能的巧夺天工所称奇。但这些表面栩栩如生的艺术作品背后,却来自于冷冰冰的模型统计和数据堆砌……离开穷尽计算的围棋博弈,AI能否替代人类的灵感和创意?在主观能动性上,AI能否再现Alpha Go的类人辉煌?


AIGC为什么能火?

为什么AIGC突然火了?
这一切肇始于一幅名为《太空歌剧院》的AI绘画作品,一举斩获了2022年8月美国数字艺术博览会竞赛的头筹。这幅来自于人工智能生成工具Midjourney的画作,一时激起了艺术家的口诛笔伐。
图片Generated from AI : 你能看得出这幅画来自AI画手吗?
AI绘画是否会取代人类画家?AI的艺术行为是否会导致“艺术之死”?AI是否会使更多创作者“丢掉饭碗”?类似讨论甚嚣尘上,但令更多人不得不承认的是:原来AI创作的发展水平竟到了如此“以假乱真”的地步。
所谓AIGC (AI-Generated Content),即指人工智能技术自动生成内容,被认为是继专业产出内容(PGC)、用户产出内容(UGC)后的新型内容生产力。最初,AIGC所生成的内容以文字为主,例如“AI写诗”、“AI作文”;而经过更加多元大模型的训练,AI可生成的内容已经拓展到了包括文字、图像、对话、视频、语音、机器人动作等多种形式。
相比于传统的内容生产方式,AIGC成功扮演了快捷的“灵感生成器”。移动互联网时代后期,流量成本愈来愈高,这导致UGC模式下开发者的内容生成成本不再低廉,很难在传统框架下跟上市场对于内容的质量和产能需求。PGC制作门槛较高、质量有保证,但生产周期较长,UGC降低了生产成本与中心化程度,但质量往往参差不齐——AIGC在某种程度上兼顾了产能和质量,可以被视作是内容生态在发展过程中的新一轮范式转移。
2022年被很多人认为是AIGC的元年,这本质上离不开资本的追捧。10月,人工智能图像生成器Stable Diffusion的母公司Stability AI宣布获得1.01亿美元的融资;时隔不久,文字生成AI初创公司Jasper宣布完成1.25亿美元的A轮融资,估值一举跨过15亿美元。这一天文数字的背后,怀揣了人类对于“艺术革命”的涅槃之期。

图片也许不可置信,但这些画作All from Stable Diffusion

AI的创作能力究竟“谁与争锋”?越来越多的Hyper-scale大厂正在通过开放能力平台以搭建属于自己的开源生态。当然,这也意味着越来越庞大的创作者群体、越来越多的数据、越来越频繁的训练,以及越来越大的模型:
  • Google Brain接连推出AI绘画工具“Imagen”和“Parti”
  • Github 的AI编程神器Copilot供开发者群体测试使用
  • OpenAI正式开放了DALL-E 2的程序接口
  • 百度先后推出AI写诗和作画工具“文心一格”,并开放飞桨能力平台
  • 腾讯推出智能写稿人Dreamwriter以代替传统媒介写手
  • 阿里巴巴推出AI在线设计平台Lubanner生成营销工具
  • 字节跳动旗下的剪映通过AI批量化智能生成视频

所以,AIGC的爆火也许是偶然的,但崛起是必然的。
AIGC的本质是开源框架下开发者群体的共鸣。最早缘起Stable Diffusion开源所产生的“破圈效应”,其不仅开放了开源程序架构,还为开发者提供了颇具规模的预训练大模型,这也从根本上允许更加庞大的开发者群体参与进来。“众人拾柴火焰高”,才有可能构建愈加精准、愈加庞大的“大内容生态”。一旦脱离了UGC所贡献的内容生态,AIGC将失去不断堆叠的数据模型基础;换言之,AIGC的本质是足够开放的应用生态,而其基础是C端用户的链接和参与。

图片开源训练结果来自于成千上万开发者的内容生态

无论是AI工作室团队,还是互联网大厂,大家都在试图为更多的开发者提供更大的生态平台,以吸引更多的数据,归纳更多的训练 ,最终建立更大的模型。

解码AIGC的实现路径 


AIGC高光时刻到来的背后,是已酝酿了8年的技术革命。自 2015  Google Brain 推出Transformers 以来,深度学习正在迅速迭代,其中多模态预训练大模型的逐步成熟,为AIGC奠定了技术底座。
AIGC为什么可以做到?其实很简单:更大的模型、更多的数据、更充分的算力,这使得AI成为未来人类生产内容的最有力帮手,没有之一。
不被理解的人类灵感:小模型时期
在Google发布Transformer之前,小模型一度是人工智能训练的主流模式模式。在2015年以前,小模型在理解人类的语言上曾被认为最好的方式:小模型针对特定行业或使用场景、针对特定规模的数据、针对定向用途(如排产预测、风险评级等),生成了相对智能的结果。遗憾的是,小模型无法满足通用要求,更无法在更大的通用场景中完成任务,这使得内容创作的开放性不够。
Attention is All You Need:大模型时期
2015年,Google Research一篇里程碑式的论文(Attention is All You Need)描述了一种用于自然语言理解的新的神经网络架构 transformer,用以生成高质量的语言模型,且具有更强的并行性和通用型,需要的训练时间更少。这些模型是简单的学习者,可以相对容易地针对特定领域进行定制。
这一模型并不针对特定场景,而是极广泛地收集和训练各类数据。随着模型越来越大,在过去8年间,用于训练这些模型的计算量增加了6个数量级,其结果在书写、语音、图像识别、阅读和语言理解方面超过了人类的表现水平。OpenAI的GPT-3表现尤其突出,成为首个在某些语言交互场景中“超人”的大模型。

图片AIGC的实现方式:深度学习与多模态预训练大模型

更大的模型、更便宜的模型、更可算的模型
深度学习的一大优势是,模型越大越好。自从 Transformer 发明以来,扩大这些模型的规模,已经成为研究和投资的关键领域。在过去三年里,人工智能模型的规模已经增长了 15000 倍以上,并从单一的文字领域扩展至图像、语音、视频等多模态。多模态大模型的普及,最终成为AIGC的技术底座。
很显然,人类对于人工智能的追求,已经转向“更庞大的数据、更频繁的计算”,这将意味着“更好的结果”。背后反映的是,与其让每家公司建立自己的 AI 模型,不如由少数具有数据规模优势和成本优势的玩家,去主导这个市场。换言之,是否应该通过“集中的大模型训练”降低整体AI产业的训练成本?

图片过去5年,计算模型的成长速度是惊人的

因此,无论是互联网大厂,还是独立的人工智能开发团队,都应为了同一个目标所努力:使大模型计算变得更便宜。只有更便宜、更经济的大模型计算,AIGC才能有真正普及的春天。
我们该通过什么样的方式,实现AI产业更低的训练成本呢?
算力:GPGPU已成为大模型普及的基础
在这一趋势中的最大赢家仍然是NVIDIA:以A100为代表的GPGPU,已经事实上成为运行云端 AI 工作负载的实质标准。或者说,在相当长的一段时间内,GPGPU将是人工智能计算产业的基础算力,这也为普及大模型且降低计算成本提供基础。
算法:市场呼唤专门的大模型公司
单一场景的计算意味着更小的数据集、更精准的小模型、更定制的算法。随着模型越来越大、场景越来越多、数据越来越复杂,显然这种思路无法满足成本的经济性,亦无法使人工智能算法最终走向“普惠化”。
因此,AIGC普及的前提,是大模型计算足够便宜、大模型获取足够便捷。这就意味着,人工智能市场需要有这样一类公司,专门为开发者和应用方提供“预训练大模型”,以搭建一个庞大的人工智能算法工厂,成为真正意义上的AI基础设施。所有应用方都可以在现有的基础模型之上建立独特的应用程序,调取“积木化”的算法模块,而无需从头开始重新训练自己的模型。
这样集中训练的“大模型”模式,将大幅降低AI产业的训练成本;这也是在2022年底,我们能触达如此庞博涌现的AIGC工具的本质原因。

避开AIGC的陷阱


大模型的前景是光明的,正如必然崛起的AIGC,终将飞入寻常家。你我之所以能体验AI作画、AI写诗的娱乐,源于数据足够多、模型足够大、计算足够便宜。很显然,数据越来越多、模型越来越大、计算越来越便宜,伴随着这一不可逆的历史趋势,AIGC的能力将越来越强大。
反观现阶段的AIGC,受制于“模型是不是足够大”,还有很多问题没有被解决。
AI创作缺乏独立的情感和灵魂
AI艺术创作,是基于大模型的数据训练和统计,甚至是简单“Input-Output”的结果堆砌。显然,这些创作没有自主灵魂,更没有情感表达。围绕AI绘画、AI写作的批评中,很多人直指其生成的内容堆砌且质量层次不齐,有时甚至会产生类似“缝合怪”一般的滑稽感。不久前哈佛大学的一项研究表明,DALL-E 2对于文本提示内的关系根本不理解,图像正确率仅有22%;这从本质上反映了,尽管艺术创作不是下围棋,但AI的解决方式仍然来自于极限统计。
AI大模型也需要小场景
大模型的通用性,也需要和小模型的专用性相结合。AIGC的需求具有典型的差异化特征,这在很大程度上提高了开发门槛。以AI写作为例,AIGC在不同场景对写作的需求是不同的。比如,说明书和广告文案在措辞上就有天壤之别,新闻评论和小说也是风格迥异。这意味着,只有和小模型的专用训练相结合,才能真正“用得好”。
普惠化,而非商业化
最后,从“尝鲜的噱头”到大规模商业化落地,AIGC依旧挑战重重。由于当前的人工智能还处在传统的弱人工智能阶段,必须高度依赖人类对实际问题的建模,但这种方式存在着相当的不稳定性,加之硬件设施的性能限制,导致生成结果不理想,以及用户缺乏付费意愿,这让AIGC距离大规模商业化落地还需时日。现阶段,AI艺术创作更多是人们参与艺术创作的普惠渠道,却难以真正实现艺术收藏和品鉴价值。
写在最后:
曾几何时,人们对AI的期待,始终是解决简单、重复的机械劳动。这是源于AI永远只能依靠“模仿”而习得技能,正如Alpha Go的成功离不开先进算力对于穷尽问题的暴力求解。与之不同,艺术创作无疑是人的独有天赋,也是人类的主观能动性所在,而AI艺术创作打开了人们更广阔的想象空间。
AI绘画会取代人类画家的地位吗?很显然,不会。
人类艺术的魅力是情感的独特性释放,而不在于画得快,甚至不在于画得好。也正因为如此,AI始终会成为一种新的情感表达工具,而不会成为唯一的艺术供给来源;“艺术不死”,是因为人类有情感、有灵魂,这是AI难以在大模型的训练中所建立和模仿的。
诚如举世名画只有一幅,AI艺术创作却能走进千家万户,这样的“普惠化”也很不错。我们相信,数据会越来越多、模型会越来够大、计算会越来越便宜,这将使AI从根本上提高人类的艺术创作生产力。换言之,AIGC将为更多普通人提供艺术收藏和品鉴的机会,使得艺术创作“飞入寻常百姓家。
答案揭晓:A是真人,B是AI创作的。这一测试有超过一半的小伙伴们无法分辨,或者选择了错误的答案,更加说明AI创作的以假乱真。