李彦宏：AI将颠覆内容产业！现场1秒补全《富春山居图》残卷

智东西（公众号：zhidxcom）

作者 | ZeR0

编辑 | 漠影

“天下佳山水，古今推富春。”

中国古代水墨山水画的巅峰之笔《富春山居图》是元代画坛宗师、“元四家”之首黄公望晚年的杰作，这一传世名画于清代顺治年间遭火焚，断为长短两卷，后人再无从知晓缺失的原画。

在今日举办的2022百度世界大会上，百度首席技术官王海峰展示了基于百度文心大模型“补全”的《富春山居图》。

▲浙江博物馆馆藏《富春山居图·剩山图》局部（左上），台北故宫博物院馆藏《富春山居图·无用师卷》局部（右上），AI补全《富春山居图》并题诗（下图红框处）

▲AI补全《富春山居图》过程

从补全的内容来看，水平如何？

黄公望纪念馆负责人毛传镔的评价是：“与现存真迹风格一致，使两岸画卷走出博物馆实现了合璧，光线风格统一，山水脉络和谐，不仅符合原画审美特点，视觉上还同样具有观赏价值。”

文心大模型还为画作题诗一首，连撒贝宁都直呼“太凡尔赛了”。

▲文心大模型为《富春山居图》题诗

用AI修复老照片、让画中人“活”起来……AI参与文物修复中的案例已经屡见不鲜，但此次用百度文心大模型“补全”富春山居图与以往不同——在其技术支撑下，每个人都可以参与其中。

只要在百度APP搜索“富春山居图”，你就能参与到这一传世之作的“虚拟修复”中，仅需不到1秒，在中间空白处简单勾勒几笔，便能像专业画家般写意山川，补全你心中的《富春山居图》。

▲撒贝宁现场体验“AI作画”

究竟是怎么实现的？我们一起看看背后的技术。

一、复原《富春山居图》背后的技术难题

要“补全”一幅传世名画，有三大技术难点：高清晰度、高还原度、全民参与。

以前许多将AI应用于历史画作的修复清晰度并不高，而只有实现高清尺寸的补全，做到逼真的细节，生成的画作才能具备更高的艺术观赏性。

在只有一幅《富春山居图》样本的条件下，要高度还原黄公望这位“元四家”之首的大师作品，呈现出与原作相近的绘画风格，对模型的迁移学习能力则提出了极高要求。

最后，要通过H5互动，让更多人参与到《富春山居图》的“虚拟修复”中，难点是同时满足所有人多样化的创作期望和天马行空的创意想法。

▲每个人都可以借助AI补全自己心中的《富春山居图》

解决这些问题的利器，是大模型。

据百度技术人员介绍，文心大模型只用不到1秒钟，就能补全《富春山居图》这样一幅高清艺术画作，这大大提升了内容创作的效率。

因为参数量大、建模能力强，文心大模型既能确保生成清晰度较高的画作，又能将大众不同的补全创意实时转化生成。

文心大模型运用了“视觉生成大模型+单样本微调”的技术策略：先是学习大量的中国山水画，实现了从山水画“小白”向“大师”的进阶，等具备“大师”水平后，它再去学习黄公望的《富春山居图》，就能更快速地掌握这幅传世名作的精髓，从而让补全的画作与现存真迹风格一致。

考虑到用户意图存在很强的主观性，要让用户的创作意图得以体现，需保证生成的画面结构与用户的笔触一致。

对此，百度团队进行了大量调试，来确定画作中风格与用户笔触的对应关系，并且前期让更多的用户尽量都尝试修复，收集、照顾不同用户的绘制笔触的特点，从而做好修复效果与用户笔触引导结果之间的权衡；同时在部分尺度上引入随机性，来让生成结果拥有更多可能性，大模型也有强大的泛化能力来保证生成结果的稳定。

像这样的人工智能自主生成内容（AIGC），是继UGC、PGC之后一种新的内容生产方式，它不仅能提升内容生产的效率，也会创造出有独特价值和独立视角的创意内容。

在百度世界大会上，百度创始人、董事长兼CEO李彦宏分享了AIGC将走过的三个发展阶段：第一阶段是“助手阶段”，AIGC辅助人类进行内容生产；第二阶段是“协作阶段”，AIGC以虚实并存的虚拟人形态出现，形成人机共生的局面；第三阶段是“原创阶段”，AIGC将独立完成内容创作。

而大模型技术的突破，正在加速这个发展趋势。

在文心大模型的支持下，AI已具备很强的理解和生成能力，能实现创意作品的自动生成，包括AI作画、AI写歌、AI剪辑等。再往后发展，基于大模型的AIGC有望成为内容生产的主流模式。

“未来十年，AIGC将颠覆现有内容生产模式，可以实现以1/10的成本，以百倍千倍的生产速度，去生成AI原创内容。”李彦宏说。

二、AI数字人背后的大脑，写诗作曲样样精通

除了补全《富春山居图》外，百度AI数字人同样展示出强大的创作能力。

担任今天百度世界大会的AI策划官、助理主持人和开场嘉宾的百度AI数字人希加加，也特别展示了一把创作技能。

现场，主持人撒贝宁出了个难题：“画一张现代派、朦胧感、五彩缤纷的——猫。”

不一会儿，希加加就交出了一幅作品：

看起来是不是还挺切题的？

百度AI数字人已在许多场景中展现AI绘画功底。比如近期，希加加发布并售卖和Qee熊、FE赛车合作的画作，另一位数字人度晓晓亦创作了“无界”系列画作并参加西安美院本科生毕业展。

▲度晓晓携AI画作参加西安美院本科生毕业展

这些参展画作均有AI自动生成，每幅画的创作时间只需数十秒，效率远超人类。

不过，AI作画只是其AIGC能力的一小部分，自动生成内容技术赋予了数字人强大的创造力。希加加会写诗、作曲、唱跳、实时直播，用多国语言交流；度晓晓挑战了高考语文作文，40秒就能写出40篇，随机抽取的一篇分数赶超了约75%的高考考生。

像希加加、度晓晓这样有丰富技能傍身的数字人还有很多。据百度集团副总裁袁佛玉介绍，百度智能云打造了一个数字人平台“曦灵”，提供数字人的制作和运营服务，已形成了一个“AI数字人家族”。“随着百度AI算法的突破，我们能让数字人制作成本十倍、百倍地下降，还能让数字人生产周期，从动辄几个月，缩短到小时级别。”

和AI复原《富春山居图》一样，这些百度数字人的AIGC能力也来自百度飞桨及文心大模型。

例如，AI数字人对话能力，使用的是对话生成大模型-文心PLATO，PLATO拥有接近真人对话水平的；数字人画画能力，使用的是文心大模型-跨模态图文生成模型ERNIE-ViLG，它不仅支持自动生成油画、水彩画、中国画等多种风格的图像，还能实现“看图说话”的效果。