做者 | 郭照川
编纂 | 麻吉
不断以来,数字人被认为是元宇宙的入口。
7月6日,在2022百度世界大会的预沟通会上,一位红发少女率先退场,以兼具“科技感”和“专业度”的虚拟形象,在此次会议全程担任了关键的串词、控场、发问和嘉宾介绍工做。
适用型虚拟数字人正在走进群众视野,百度旗下数字人度晓晓就是此中之一。固然她的“主业”是百度App的虚拟AI助手,但度晓晓同时又被付与了适用性的“多重身份”:
她既是参与过国内顶尖艺术院校结业展的“AI画家”,又是胜利挑战过高考命题做文的“AI做家”,仍是创做过歌曲、接过告白、发行过MV的“AI偶像”。
做画、谱曲、做主持、写做文、陪聊天......百度硬核手艺撑持下的数字人特有的缔造性和交互性,让人不能不相信现实世界与“元宇宙”的鸿沟正在被突破,数字人则将成为与日常生活亲近联合的有力辅助。
拥有个性化交互才能的数字人,实的存在吗?元宇宙开展到如今,更先进的数字人又被付与了哪些意想不到的才能?
图源:2022百度世界大会预沟通会从二次元到“N次元”
谈到虚拟人物,难离“二次元”。
从初代虚拟偶像初音将来,到许多传统行业的数字代言人形象,根本上都是由二次元人物设想脱胎而来。
关于“二次元”来说,缔造是最难的。固然那些数字人外不雅设想得非常完美,但应用途径也十分单一,哪怕是超写实数字人形象,都离开不了无法实现交互、自己无法缔造的局限。
而在本年的西安美术学院的本科结业展上,有一系列定名为“无界”的画做,突破了传统数字人的缔造“结界”。
那一系列做品的创做者,是百度数字人度晓晓。固然画面由AI数字人所绘,但也被美院传授认证为 “已经到达了本科美术生的根本要求”。其贸易价值同样不成小觑,那些绘画数字藏品此中的四幅,在获展出之前就已经卖出了超越17万元的高价。
本年6月7日高考完毕后,度晓晓又以全国新高考Ⅰ卷做文《本手、好手、俗手》为题,在40秒的时间内完成了审题、逻辑、创做等步调,创做出了40多篇差别的高考做文,还被高考研究专家申怡教师,评判为能够打出48分的“高分做文”。
不久前,“#国内首个可交互虚拟偶像度晓晓”还登上了热搜。她做为百度数字人做词、编曲了歌曲《每分 每秒 每天》,还和龚俊数字人一路举办了新歌发布会曲播。出名乐评人耳帝也认为,度晓晓背后的人工智能缔造内容确实能够“进步创做效率、降低门槛、辅助创做”。
在AI内容创做能涉及的范畴内,度晓晓几乎无处不在,于是她也被各人笑称为元宇宙时代“最卷数字人”。除了能写会画的“数字才女”度晓晓,百度旗下另一位数字人希加加,也吸引了很多存眷目光。
希加加一度被称为“第一个吃到汉堡的数字人”。在成都和大连的富贵陌头,希加加成为数字人新品保举官,从麦当劳门店上方的庞大屏幕中闪身而出,抓住了一只大汉堡,一霎时虚拟与现实的毗连让人过目难忘。
图源:麦当劳她不只成为了“00号太空数字乘客”,登上了我国第一艘数字载人飞船,还接下了和Qee熊、FE赛车一路合做设想的许多使命,仿佛像一个赛博朋克的新员工了。
目前数字人实正落地后,展现出来的现实利用价值,已经超出了我们想象中的认知鸿沟——从被动的二次元薄弱形象,演变成能备实理解才能,能实现创意做品的主动生成的数字人物,给世界带来越来越多的欣喜。
从被设定问答法式的单一“二次元”,到富有创意、适用场景更多元的“N次元”,度晓晓和希加加等百度“AI数字人家族”的出场,让数字人赛道的前景变得愈加冷艳。
辞别“虚火”,铺开现实应用价值
跟着“元宇宙”和“Web 3.0”概念兴起,数字人成为当下最热的风口之一。
按照艾媒征询数据,2021年中国数字人财产市场规模和核心市场规模别离到达1074.9亿元和62.2亿元,估计2025年将到达6402.7亿元和480.6亿元。光是2021年全年,虚拟数字人相关投资就有16笔。
2022年第一个月,虚拟人范畴百起融资金额累计已经超越了4亿元人民币。曾经推出出名虚拟IP“翎”的魔珐科技,也在本年4月刚刚完成了B轮和C轮共计1.3亿美圆的融资。
陪伴着市场对数字人的极高期望,也呈现了良多量疑声音。
许多人认为目前元宇宙以及数字人尚处在十分早期的阶段,反而是风刮得太猛,招致只剩下“概念横行”“一把虚火”。此类观点并不是空穴来风,当下仍然存在着许多行业隐忧,例如数字人AI驱动手艺不达标、现实应用场景不敷、造做成本太高档等。
然而,跟着数字人的应用场景和手艺提拔,此次百度数字人也展现出了其特殊性:
度晓晓和希加加与市道的上其他数字人的差别,她们更大的打破点就在于已经实现了“可交互”——无论是度晓晓仍是希加加,都能够在多样化的现实应用场景中高度拟实,实现像实人一样互动。
度晓晓已经具备了对话才能。闲来无事,用户能够像实人一样随时和她聊天,或者让她唱歌来听,奇特的感情交互系统让她像一个随时在身边的虚拟助手,又像一个实在存在的可靠伙伴。
图源:百度APP以至面临差别的人的交互体例,小我性格和喜好,度晓晓也会呈现出纷歧样的理解和反应。也就是说,在你身边的数字助理度晓晓,无时无刻都和你配合处于向更优良的本身的进化之中。
除了对话,度晓晓还能实正做到“理解”用户,区分闲聊与搜刮企图,满足用户提出的更多生活需求。例如当你告诉度晓晓“想要看片子”时,她会像伴侣一样给你保举影片。而若是你的需求是“想要喝咖啡”,她以至能主动跳转到咖啡小法式,便利你下单一杯咖啡外卖。
虚拟伴侣交叉进整个生命过程的陪同,满足能交互、有回应、满足多种功用需求,才是抱负中数字人的“最末形态”。
数字人之战:大厂实力求鉴
各家互联网大厂,纷繁在数字人范畴疯狂加码。
不久前,字节跳动收买了虚拟社交公司“波粒子科技”,也是看上了其拥有的虚拟人物形象自定义核心手艺,意在为元宇宙再添一张牌。近年来专注于智能语音和AI手艺的科大讯飞,也在去年岁尾上线虚拟人交互系统1.0,试图拓宽人工智能生态。
事实上,百度在很早之前喊出了“All in AI”的标语,2020年就已经筹备上线的度晓晓,降生于元宇宙海潮发端之初,一起头就具备了AI驱动下的视觉识别和语音识别才能,背后百度又有AIGC(AI generated content,人工智能缔造内容)内容手艺的撑持。
百度旗下的虚拟人家族,在互联网大厂的元宇宙赛道合作中的优势也很明显。
按照第三方机构发布的榜单,百度凭仗多年以来语音、视觉等AI才能的积累,在数字人综合实力方面排名第一,尤其在数字人大规模落地范畴,有着强大领先实力。
一方面,百度数字人背后拥有常识加强大模子“文心大模子”。
度晓晓、希加加都是具备AIGC才能的数字人,度晓晓创做的AI画造成的数字藏品,在百度上线24小时内就卖出了8700多份。而那种均匀每幅画用时只需要数十秒的数字人创做,完全倾覆了当下已知的内容消费形式。
如许令人惊异的AIGC高效输出才能,则是依托于百度文心大模子。数字人的绘画创做技能,靠的就是文心大模子-跨模态图文生成模子ERNIE-ViLG。
另一方面,百度AI算法得到打破,使得数字人的造做成本极大收缩,降低了批量消费数字人的门槛。
百度集团副总裁袁佛玉,在2022百度世界大会的预沟通会上也暗示,“跟着百度AI算法的打破,能让数字人造做成本十倍、百倍地下降,还能让数字人消费周期,从动辄几个月,缩短到小时级别。”
那一切,都让数字人大规模应用落地,以至让实现“人均一个数字人小助手”的元宇宙将来抱负成为可能。那也恰是本年百度世界大会的主题“AI深耕,万物生长”所阐释的,在出行、财产、生活等范畴,人工智能都将阐扬史无前例的感化。
7月21日,度晓晓、希加加等百度AI数字人家族成员,都将深度参与到百度2022世界大会之中。
本年的百度世界大会,更像是一场关于尖端人工智能手艺的一次立异式全民科普。拥有强大缔造实力,具备陪同和交互才能,且能实现可控成本批量复造的数字人,已经为我们翻开了元宇宙的大门。