首页 > 科技 > 李彦宏:AI将颠覆内容产业!现场1秒补全《富春山居图》残卷

李彦宏:AI将颠覆内容产业!现场1秒补全《富春山居图》残卷

智东西(公众号:zhidxcom)

作者 | ZeR0

编辑 | 漠影

“天下佳山水,古今推富春。”

中国古代水墨山水画的巅峰之笔《富春山居图》是元代画坛宗师、“元四家”之首黄公望晚年的杰作,这一传世名画于清代顺治年间遭火焚,断为长短两卷,后人再无从知晓缺失的原画。

在今日举办的2022百度世界大会上,百度首席技术官王海峰展示了基于百度文心大模型“补全”的《富春山居图》。

▲浙江博物馆馆藏《富春山居图·剩山图》局部(左上),台北故宫博物院馆藏《富春山居图·无用师卷》局部(右上),AI补全《富春山居图》并题诗(下图红框处)

▲AI补全《富春山居图》过程

从补全的内容来看,水平如何?

黄公望纪念馆负责人毛传镔的评价是:“与现存真迹风格一致,使两岸画卷走出博物馆实现了合璧,光线风格统一,山水脉络和谐,不仅符合原画审美特点,视觉上还同样具有观赏价值。”

文心大模型还为画作题诗一首,连撒贝宁都直呼“太凡尔赛了”。

▲文心大模型为《富春山居图》题诗

用AI修复老照片、让画中人“活”起来……AI参与文物修复中的案例已经屡见不鲜,但此次用百度文心大模型“补全”富春山居图与以往不同——在其技术支撑下,每个人都可以参与其中。

只要在百度APP搜索“富春山居图”,你就能参与到这一传世之作的“虚拟修复”中,仅需不到1秒,在中间空白处简单勾勒几笔,便能像专业画家般写意山川,补全你心中的《富春山居图》。

▲撒贝宁现场体验“AI作画”

究竟是怎么实现的?我们一起看看背后的技术。

一、复原《富春山居图》背后的技术难题

要“补全”一幅传世名画,有三大技术难点:高清晰度、高还原度、全民参与

以前许多将AI应用于历史画作的修复清晰度并不高,而只有实现高清尺寸的补全,做到逼真的细节,生成的画作才能具备更高的艺术观赏性。

在只有一幅《富春山居图》样本的条件下,要高度还原黄公望这位“元四家”之首的大师作品,呈现出与原作相近的绘画风格,对模型的迁移学习能力则提出了极高要求。

最后,要通过H5互动,让更多人参与到《富春山居图》的“虚拟修复”中,难点是同时满足所有人多样化的创作期望和天马行空的创意想法。

▲每个人都可以借助AI补全自己心中的《富春山居图》

解决这些问题的利器,是大模型。

据百度技术人员介绍,文心大模型只用不到1秒钟,就能补全《富春山居图》这样一幅高清艺术画作,这大大提升了内容创作的效率。

因为参数量大、建模能力强,文心大模型既能确保生成清晰度较高的画作,又能将大众不同的补全创意实时转化生成。

文心大模型运用了“视觉生成大模型+单样本微调”的技术策略:先是学习大量的中国山水画,实现了从山水画“小白”向“大师”的进阶,等具备“大师”水平后,它再去学习黄公望的《富春山居图》,就能更快速地掌握这幅传世名作的精髓,从而让补全的画作与现存真迹风格一致。

考虑到用户意图存在很强的主观性,要让用户的创作意图得以体现,需保证生成的画面结构与用户的笔触一致。

对此,百度团队进行了大量调试,来确定画作中风格与用户笔触的对应关系,并且前期让更多的用户尽量都尝试修复,收集、照顾不同用户的绘制笔触的特点,从而做好修复效果与用户笔触引导结果之间的权衡;同时在部分尺度上引入随机性,来让生成结果拥有更多可能性,大模型也有强大的泛化能力来保证生成结果的稳定。

像这样的人工智能自主生成内容(AIGC),是继UGC、PGC之后一种新的内容生产方式,它不仅能提升内容生产的效率,也会创造出有独特价值和独立视角的创意内容。

在百度世界大会上,百度创始人、董事长兼CEO李彦宏分享了AIGC将走过的三个发展阶段:第一阶段是“助手阶段”,AIGC辅助人类进行内容生产;第二阶段是“协作阶段”,AIGC以虚实并存的虚拟人形态出现,形成人机共生的局面;第三阶段是“原创阶段”,AIGC将独立完成内容创作。

而大模型技术的突破,正在加速这个发展趋势。

在文心大模型的支持下,AI已具备很强的理解和生成能力,能实现创意作品的自动生成,包括AI作画、AI写歌、AI剪辑等。再往后发展,基于大模型的AIGC有望成为内容生产的主流模式。

“未来十年,AIGC将颠覆现有内容生产模式,可以实现以1/10的成本,以百倍千倍的生产速度,去生成AI原创内容。”李彦宏说。

二、AI数字人背后的大脑,写诗作曲样样精通

除了补全《富春山居图》外,百度AI数字人同样展示出强大的创作能力。

担任今天百度世界大会的AI策划官、助理主持人和开场嘉宾的百度AI数字人希加加,也特别展示了一把创作技能。

现场,主持人撒贝宁出了个难题:“画一张现代派、朦胧感、五彩缤纷的——猫。”

不一会儿,希加加就交出了一幅作品:

看起来是不是还挺切题的?

百度AI数字人已在许多场景中展现AI绘画功底。比如近期,希加加发布并售卖和Qee熊、FE赛车合作的画作,另一位数字人度晓晓亦创作了“无界”系列画作并参加西安美院本科生毕业展。

▲度晓晓携AI画作参加西安美院本科生毕业展

这些参展画作均有AI自动生成,每幅画的创作时间只需数十秒,效率远超人类。

不过,AI作画只是其AIGC能力的一小部分,自动生成内容技术赋予了数字人强大的创造力。希加加会写诗、作曲、唱跳、实时直播,用多国语言交流;度晓晓挑战了高考语文作文,40秒就能写出40篇,随机抽取的一篇分数赶超了约75%的高考考生。

像希加加、度晓晓这样有丰富技能傍身的数字人还有很多。据百度集团副总裁袁佛玉介绍,百度智能云打造了一个数字人平台“曦灵”,提供数字人的制作和运营服务,已形成了一个“AI数字人家族”。“随着百度AI算法的突破,我们能让数字人制作成本十倍、百倍地下降,还能让数字人生产周期,从动辄几个月,缩短到小时级别。”

和AI复原《富春山居图》一样,这些百度数字人的AIGC能力也来自百度飞桨及文心大模型。

例如,AI数字人对话能力,使用的是对话生成大模型-文心PLATO,PLATO拥有接近真人对话水平的;数字人画画能力,使用的是文心大模型-跨模态图文生成模型ERNIE-ViLG,它不仅支持自动生成油画、水彩画、中国画等多种风格的图像,还能实现“看图说话”的效果。

▲文心ERNIE-ViLG图文双向生成统一建模框架

预训练大模型(简称“大模型”)是当前人工智能发展的重要方向,具有效果好、泛化能力强的特点,能显著降低AI开发和应用的门槛。

谈及大模型的能力,李彦宏举例说,人的学习和记忆能力是有限的,《全唐诗》有接近5万首,通读都很难,背诵就更不容易了。但这对于大模型来说,根本就不是事儿。

而百度基于产业级深度学习平台飞桨打造的知识增强大模型——百度文心大模型从大规模知识和海量数据中融合学习,学习效率更高、学习能力更强,还能跨语言、跨模态学习,一旦跨过某个奇点,就能产生真正意义上的AI原创内容。

三、从重塑内容创作,到提速千行百业

“轻轻几笔连接山河”的背后,文心大模型已从技术创新迈进场景落地,为不同产业提供新思路。

作为国内首个可交互虚拟偶像,度晓晓在百度App中为用户提供的全程AI陪聊功能,以及在聊天过程中表现出更高的“智商”和“情商”,也来自文心大模型的支持。这一方面意味着对话交互式搜索新时代的到来,另一方面也是大模型支持下AIGC能力逐渐成熟的体现。

包括AIGC方向在内,文心大模型已经规模化应用于百度信息流、智能音箱等互联网产品,并落地到工业、能源、教育、金融、通信等行业的智能化转型升级中。

例如在媒体行业,文心大模型的理解和生成创作能力激发创意,提升内容多样性,降低了制作成本;在保险领域应用中,文心大模型的智能解析能力,能使文本处理效率提升30倍;在医疗领域应用中,文心大模型将每份病历的检查时间,从30分钟缩短到了秒级。

目前,百度文心已发布20多个大模型,既包含基础通用的大模型,也包含面向重点任务领域和行业的大模型,以及丰富的工具与平台,支撑企业与开发者进行高效便捷的应用开发。

▲文心大模型全景图:由模型层、工具与平台层和大模型创意与探索社区构成

在拓宽场景覆盖广度之余,文心大模型也在加深产业应用的深度。

面向业界,百度文心首发了两个行业大模型:联合国家电网发布能源电力大模型、联合浦发银行发布金融行业大模型,通过引入行业特色数据和知识,在电力、金融相关领域提升效果显著。

今天的百度世界大会上,百度文心又推出一个关键领域的大模型——航天-百度·文心大模型

这是世界上第一个航天领域的大模型,从航天的场景、数据和知识中融合进行学习,可以对航天数据进行智能的采集、分析和理解,助力太空智能感知、规划和控制。

近期,百度还推出文心大模型创意社区——文心·旸谷社区,希望可以让更多用户零距离感受文心大模型的魅力和应用创新潜力。

据介绍,百度正在尝试通过大模型帮助提升素材和物料的生产效率、降低成本,探索文化创作、交互等场景的更多新玩法,更大限度地拓展艺术家及普罗大众的创作空间。

结语:打破创作壁障,AI拉近艺术与生活的距离

《富春山居图》的部分画卷已经毁于一场大火,我们无从知晓被烧毁的真迹样貌。

人工智能也许并不能真正做到百分之百地还原残画,但它穿越时空,在古老文物与身处现代的我们之间搭起一座连接的桥。

借助大模型等最新的AI技术,文物修复专家不再需要倾其毕生去掌握各个细分领域的技巧,便能提出更加多样的修复方案。专家经验与AI结合,将对书画文物修复工作大有裨益,不仅助力还原遗失的传统文化,也有助于推动基于中国文化艺术的数字内容创新。

而让广大用户参与“虚拟修复”《富春山居图》之类的活动形式,或许能调动更多人的兴趣,去了解这幅传奇画作背后的奇闻逸事和它承载的厚重的历史,去引得更多人真切地祈愿,这两幅身处两地残卷能早日合二为一。

当越来越多不擅长绘画的人用AI执笔,绘出眼中所观、心中所想,也许更多的奇思妙想将跃然纸上,艺术与生活的距离也将被进一步拉近。

本文来自网络,不代表趣头条立场,转载请注明出处:https://www.ngnnn.com/article/4_36619.html
上一篇对话趣店罗敏:每个预制菜争取只赚1元,短期无盈利计划
下一篇通用与福特申请于美国部署无方向盘自动驾驶汽车

为您推荐

李彦宏:L2之后是L4,没有L3了

李彦宏:L2之后是L4,没有L3了

车东西(公众号:chedongxi)作者 |地途编辑 | 晓寒L3级自动驾驶不好搞,李彦宏认为L2之后就是L4!车东西9月1号消息,今天上午,百度创始人、董事长兼CEO李彦宏以视频的形式出席了……
北京颁发自动驾驶“前排无人”测试许可,百度、小马智行等企业获准

北京颁发自动驾驶“前排无人”测试许可,百度、小马智行等企业获准

记者 | 伍洋宇编辑 | 11月21日,北京市智能网联汽车政策先行区颁发自动驾驶无人化第二阶段测试许可,百度、小马智行等企业成为首批获准在北京开启“前排无人,后排有人”的自动驾驶无人化测试资格的企业。据介绍,获得许可后,小马智行10辆无人化测试车将在经开区60平方公里的核心区内开始全新的测试形式,覆盖亦庄复杂的城
百度首谈希壤“进化论” 院士建议发行人民币稳定币

百度首谈希壤“进化论” 院士建议发行人民币稳定币

图源:希壤这两年,百度董事长李彦宏在世界人工智能大会(WAIC)开幕式的亮相,都会带着一个数字人,去年是祝融号,今年是希加加。希加加是一名不拿画笔的“画家”,开幕式上,她的简单几句话,在几秒钟之后变成了梵高风的“外滩游船”、莫奈风的“印象生煎”……李彦宏以最近流行的AI作画,向与会者呈现了过去一年AI技术层
盖茨盛赞ChatGPT:人工智能历史意义不亚于“PC或互联网诞生”

盖茨盛赞ChatGPT:人工智能历史意义不亚于“PC或互联网诞生”

腾讯科技讯 2月3日消息,微软联合创始人比尔·盖茨表示,像ChatGPT这样的AI聊天机器人将变得与个人电脑或互联网同样重要。盖茨今日接受采访时表示:“AI将成为2023年最热门的话题。这是不可避免的。”他随后补充道:“ChatGPT将变得与个人电脑、互联网同样重要。”盖茨在20世纪80年代帮助开创了个人电脑时代。在微软和苹果等
专访墨奇科技CEO邰骋:人工智能需要新的AI数据基础设施

专访墨奇科技CEO邰骋:人工智能需要新的AI数据基础设施

“人工智能要发展到下一代,必然需要基础理论和基础设施的革新,特别是需要新的 AI 数据基础设施。”9月2日,新京报贝壳财经记者获悉,在近日举办的HICOOL2022全球创业者峰会上,AI(人工智能)基础技术和平台墨奇科技的项目团队获得“HICOOL 2022 全球创业大赛一等奖”。墨奇科技联合创始人、CEO 邰骋接受了新京报贝壳财
人工智能大会将举办智慧体育高峰论坛,发布AI+体育蓝皮书

人工智能大会将举办智慧体育高峰论坛,发布AI+体育蓝皮书

2022年世界人工智能大会智慧体育高峰论坛将于9月2日开幕。  主办方供图AI+体育,将成为世界人工智能大会的全新命题和新亮点。2022年世界人工智能大会智慧体育高峰论坛将于9月2日开幕。论坛上将发布由上海人工智能研究院牵头,联合上海交通大学、上海体育学院、首都体育学院、同济大学等单位编制的国内首本《“AI+体育”蓝
大脑还有多少秘密?世界人工智能大会首开脑机接口主题论坛

大脑还有多少秘密?世界人工智能大会首开脑机接口主题论坛

在2022世界人工智能大会上,天桥脑科学研究院(简称TCCI)转化中心联合中国科学院上海微系统与信息技术研究所、脑虎科技、中国神经科学学会、上海市神经科学学会共同举办“脑·机智能融合-让大脑连接未来”论坛,这也是脑机接口首次以主题论坛的形式登陆世界人工智能大会。英国皇家工程院院士、上海交大医疗机器人研究院院
我国人工智能学科主要奠基人涂序彦逝世,享年 88 岁

我国人工智能学科主要奠基人涂序彦逝世,享年 88 岁

IT之家 3 月 28 日消息,据北京科技大学消息,我国人工智能领域著名科学家、人工智能学科的主要奠基人、中国人工智能学会的主要创始人之一、第二和第三届中国人工智能学会理事长、北京科技大学计算机与通信工程学院教授涂序彦先生,因病医治无效,于 2023 年 1 月 1 日 0 时 10 分在北京逝世,享年 88 岁。IT之家附讣告原文
梁建章:人工智能如何影响经济和各行各业

梁建章:人工智能如何影响经济和各行各业

近日人工智能再次成为了热门话题。很多人好奇的是,人工智能未来到底会如何影响经济、人口和创新?今天,我跟大家分享个人的一些看法——谈谈人工智能对于经济以及各行各业的影响。自从深度神经网络出现以来,人工智能的发展速度超乎想象。ChatGPT的出现是个奇迹,超出了几乎所有计算机科学家的预料。一个简单的神经网络模
AI炒股新纪元?头部量化私募幻方宣布全力探索人工智能应用

AI炒股新纪元?头部量化私募幻方宣布全力探索人工智能应用

头部量化私募幻方宣布成立新的独立的研究组织,探索AGI(即通用人工智能,Artificial General Intelligence)的本质。4月14日,幻方发布公告显示,幻方将集中资源和力量,全力投身到服务于全人类共同利益的人工智能之中,成立新的独立的研究组织,探索AGI的本质,“我们将充分而持续地投入,不做中庸的事,用最长期的眼光去
卷完模型卷芯片!为提升效率,微软准备推出专属人工智能芯片

卷完模型卷芯片!为提升效率,微软准备推出专属人工智能芯片

在早期成功押注ChatGPT的研发公司OpenAI之后,市场发现,微软在其武器库中还拥有另一个秘密武器:自研人工智能芯片,这一芯片将为生成式AI背后的大型语言模型提供强大动力。4月18日周二,据媒体援引两位知情人士的话说,微软早在2019年就开始开发内部代号为Athena的AI芯片。其中一位知情人士称,一些微软和OpenAI的员工已经
真正的应用级量子人工智能距离我们还有多远?

真正的应用级量子人工智能距离我们还有多远?

·“量子科技是强国竞争的战略制高点,但不能一哄而上,低水平重复内卷,或片面追求发论文、抢专利,各自为战,闭门造车,而缺少真正的技术投入和系统配合。”·“当下量子系统的规模非常重要,而这很大程度上取决于芯片。”当前,发展量子计算和人工智能已成为世界各国的重要战略,两者交汇而生的量子人工智能更是发展迅速
返回顶部