毫无悬念地,2022北京冬奥会成了虎年的第一场流量盛宴。这项全民关注的体育赛事不仅仅是运动员的竞技场,也是各路新科技的秀场,风口上飞了一年的数字人也扎堆来此亮相。其中出镜率最高的,或许就是央视新闻推出的AI手语主播了。
经历了去年的鹊起与火爆,以央视AI手语主播为代表的数字人们,正试图借助奥运会完成一次全民科普。
01.
冬奥会迎来AI手语主播
2月4日冬奥会正式开幕,央视新闻的AI手语主播正式上岗,她就是一位由手语翻译引擎和自然动作引擎驱动的数字人。此后,这位主播就在冬奥会的新闻播报、赛事直播和现场采访中带来实时的手语翻译,让听障人士也能够共享冰雪运动的激情与精彩。
要在冬奥会这样全民瞩目的场合做手语播报,必须要有过硬的专业能力。在这位主播正式上岗之前,央视新闻专门安排了一次高难度的“面试”,派出了曾经让多位手语老师崩溃的播音员朱广权。
只见朱广权说了一段语速超快、专业名词超多的冬奥贯口,直接把翻译难度拉到满级。而这位AI手语主播气定神闲,左右手快速做出对应手势,再配合口型和肢体动作,用连贯、流畅的表达完全拿捏了这一段播报。
AI手语主播能够有如此精彩的表现,要归功于背后的语音识别、自然语音理解等多项技术的应用。
根据央视披露的信息, AI手语主播长时间、系统性地学习了《国家通用手语词典》,另外还学习了百万量级的标准手语平行语料数据和超8500条影视级手语动作数据,从而做出了精准、流畅的手语解说,手语动作精准度达95%以上。
此外,它还专门学习了冬奥相关语料数据,并且参考了“自然手语”的逻辑,才能最终呈现符合听障人士表达习惯的手语。而作为一个在电视转播中出现的数字人,实时的视频渲染与显示也很重要,在4D扫描技术的加持之下,口型合成准确率达到98.5%,并且表情自然生动,出色地胜任了手语的工作。
将数字人技术应用在手语翻译中,既是对特殊人群的人文关怀,也为新技术开拓了落地场景。数据显示,全球约4.3亿人有中度及以上程度的听力障碍,中国现有听障人士超2700万。自这次冬奥会上岗之后,央视的AI手语主播将全年无休地工作,继续服务广大听障人士。
02.
数字人的一次全民科普
除了AI手语主播之外,冬奥会的赛场内外还出现了多位数字人的身影。比如,谷爱凌的数字分身“Meet GU”直接走进咪咕的演播室与主持人实现“虚实互动”,向观众介绍谷爱凌参赛的自由式滑雪女子大跳台项目。
而在2月2号举行的冬奥会文化节开幕式上,中国虚拟歌手洛天依身着中式旗袍,以花样滑冰动作为舞步,献唱歌曲《Time to Shine》为冬奥会应援。
新华社的特约“数字人”记者冬冬,还去逛了一圈满是“冰墩墩”的冬奥会特许商品店,更会在晚上客串直播间卖货。
多种不同类型的数字人集体亮相,成功借助冬奥会这个全民热点完成了一次全民科普——原来数字人离我们的生活这么近!
过去的一年,随着元宇宙概念大热,与之密切相关的数字人也热度飙升,并趁势在多个行业和场景中得到应用。数字人在社交、媒体传播、营销、传统产业等领域的价值正在逐渐显现。
国投美亚基金投资副总裁杨天蔚告诉观澜财经,数字人在冬奥会前后扎堆亮相,背后是上下游的云计算、NLP、边缘计算、实时渲染等技术已经发展到一个节点,在应用层面取得突破是水到渠成的事。国投美亚基金作为由国投智能和美亚柏科(300188)发起的产业投资基金,一直专注于新一代信息技术领域的产业投资与赋能。美亚柏科(300188)本身更是深耕于数据治理、数据智能及数据安全领域的行业龙头。
杨天蔚分析,数字人的概念早已有之,它一方面满足了企业与用户互动方式变迁、升级的需求,成为新一代的企业门户;另一方面也满足了企业形象代言人的需求。企业与用户互动方式,经历了从官网到公众号、视频号等新媒体的变迁,但这些都是单向输出。相比之下数字人有更强的智能性与互动性。同时,数字人不会“塌房”,这么看也是更合理的经济账。
他认为数字人在阶段鲜有商用的核心原因,是目前大部分的企业数据智能化的能力尚还处于建立的阶段,且数字人的技术落地依然是高度定制化,应用落地存在相当高的门槛。“也就冬奥会这样级别的场景才有这个预算,数字人背后都是经费在燃烧。”
他补充道,数字人的未来具有很大市场空间,但如果从加德纳技术成熟度曲线(Gartner Hype Cycle)来看,数字人目前仍处在快速成长的爆发期,离真正的成熟还有很长的距离要走。“数字人背后的基础技术要达到普惠级别,才会趟过破灭期进入平稳发展期。”
也正因此,目前数字人的尝鲜者多数都是B端的客户,这也与本次冬奥会所呈现的产品与应用相吻合。
03.
数字人先在B端照进现实
与国投美亚基金的观察类似,厦门黑镜科技有限公司(下称:黑镜科技)认为,在需求尚未发掘的B端市场,数字人已经具备解决若干问题的能力,比如制作基于数字人的企业内容、虚拟员工等。
黑镜科技将数字人技术应用到企业SaaS服务上,利用自身的全栈虚拟化技术,帮助企业低成本、低门槛地创建数字人,并用这些数字人进一步创作虚拟内容,服务企业的新闻发布、培训、销售等需求,降低虚拟人力成本。
SaaS (Software as a Service,软件即服务) 是云计算的一种服务模式。在SaaS服务模式下,服务提供商将应用软件统一部署在自己的服务器上,用户无需管理和控制底层的基础设施,通过互联网按需定购指定的应用软件服务,并根据服务量、服务时间或其他方式支付费用。
黑镜科技创始人、董事长陈军宏表示,当前数字人应用的一大痛点是成本高,这包含了创建的成本和使用的成本;另外一大痛点是门槛高,不仅技术门槛高,内容门槛也高。这使得数字人应用难以快速普及,“无法做到平民化”。
针对这两个痛点,黑镜科技推出了完全云原生、无代码前端的数字人生产及内容创建工具MetaMaker ,实现了“一站式”与“一键式”的自动化操作,无需专业培训就可以快速上手,完成过去需要十多个专业软件协同才能够胜任的复杂工作。
基于自身全栈的AI虚拟化技术,黑镜科技的MetaMaker 仅用一张真人的照片就可以生成不同风格的3D数字人,不仅可以完全自定义五官、皮肤、头发、服饰等细节,还能智能计算人体自然的动作与口型,并做到镜头的运动切换。
在这个“孪生”的数字人的基础上,MetaMaker 还可结合具体的内容与场景,进一步为数字人添加相应的肢体动作、手势和表情,并利用TTS引擎给数字人配音,从而制作完整的视频内容,服务企业的新闻发布、培训、销售等真实场景。
在MetaMaker 这个工具产品之外,黑镜科技还将数字人的技术能力封装为一个SDK,涵盖3D人脸重建、自定义捏脸、自适应服饰系统、动作驱动、声音驱动、图片驱动等多种解决方案,可以应用到车载数字人系统、智能音箱数字人系统、企业数字人客服系统等领域。
陈军宏透露,目前黑镜科技的产品和技术已经获得了爱奇艺、科大讯飞、一汽奔腾、新氧、中国经济网等客户。
此外,黑镜科技的全栈技术能力也获得了业界认可。在量子位发布的《2021年虚拟数字人深度产业报告》中,黑镜科技成为数字人产业链中游的代表企业,并与百度、小冰公司、字节跳动等大厂一同被列为国内的主要玩家。
观澜财经还注意到,黑镜科技的团队很早就涉足数字人,是当时国内最优秀的团队之一,曾做过一个红遍全球的产品“小偶”。
这个C端的产品一度在全球51个主要国家的 App Store 免费榜里排名第一,在91个国家进入前五名,并且在100多个国家进入了前十名,更俘获了一众欧美及日韩的偶像明星。Lady Gaga、神奇女侠主演盖尔·加朵等都在自己的 Instagram 帐号上发布了用小偶制作的视频。
小偶的成功表明,基于数字人的内容是用户喜闻乐见的。但如何把数字人的创建及内容能力赋能给更多企业,从而让企业利用数字人技术解决生产、销售等各种环节的问题,这是陈军宏和黑镜科技正在探索的新课题。
对于数字人在企业中应用的未来,国投美亚基金投资副总裁杨天蔚补充道,数字人诞生之后还要靠大量的数据来“喂养”,才能逐渐完善为一个逼真的人设,具备对外输出形象和服务的能力,这就要求企业需要具备数据治理以及数据智能化的能力。
“数字人未来就是企业的‘Jarvis’,数字人对数据安全也会提出更高的要求,万一数字人被劫持绑架了呢?”杨天蔚说。