ChatGPT的出现,让大模型一举成为了人工智能行业最主流的方法论。借助庞大参数量的数据训练和推理方法论,全球市场上也涌现出了各类文生文、文生图的人工智能应用,为内容行业增加了更多可能性。
“不过,文生文、文生图是AIGC(人工智能自动生成内容)的终点吗?”魔珐科技CEO柴金祥对钛媒体App表示,AIGC让内容形态可以不断升级,文生文、文生图只是AIGC的两个简单的能力。而AIGC能力演进的终极形态一定是3D虚拟人,因为它可以真正实现从高质量形象,到兼具表达沟通能力和垂直业务能力的跨越进阶。
魔珐科技成立于2018年,天使轮即获得了红杉领投,之后接连拿到了五源资本、软银愿景等机构的投资,总融资额超10亿元。在创办魔珐科技之前,柴金祥是美国工科名校TMU终身教授 在2002年发表全球第一篇基于AI技术生成3D虚拟人动画的论文。
8月16日,魔珐科技对外推出了“魔珐有言”“魔珐有光”“魔珐有灵”三款超写实3D虚拟人AIGC消费级产品,试图在直播、营销、客服等场景为各个行业提供3D虚拟人的全栈AIGC产品。
3D虚拟人,让虚拟人更像人
在虚拟人行业,虚拟人产品主要分为两个大的类别。
以影视动画游戏里的三维虚拟人为例,这类虚拟人产品主要以手工制作为主,形象和声音表现都接近真人,但是没有大规模复制的能力。
另一类则是利用AIGC,生成2D的虚拟人形象,具备对话能力,也就是主流的文生文、文生图的能力。不过,这类虚拟人只具备单点的AIGC能力,没有三维形象,没有生动流畅的表达能力,也无法做到三维化、空间化的呈现。
“3D虚拟人是 ‘具有高质量超写实形象,能表达,可互动,且是AIGC生成的’,3D虚拟人同时具备超写实3D形象、生动的表达能力和垂直领域的专业能力。”
柴金祥称,区别于只具备有限的文生图文、文生唇形AIGC能力的产品,魔珐科技具备全栈AIGC能力的“3D虚拟人”,才能真正将企业金牌员工的“最佳实践”技能进行高质量、高效率、低门槛、规模化复制,以3D虚拟人视频、3D虚拟人直播、3D虚拟人1v1互动的方式,规模化生产企业与人连接所需要的内容,规模化地提供与真人无异的服务体验。
其中,“魔珐有言”具备AIGC视频生产能力,通过文本可以直接生产相关视频。“魔珐有光”支持AI实时驱动的3D超写实虚拟人直播,虚拟主播可以进行实时互动和自主产品介绍。“魔珐有灵”则可以支持企业高效率生成基于垂直业务场景的专属AI虚拟人服务,让虚拟人担任产品推荐官、虚拟导购、虚拟销售、虚拟HR等多样化的职能工作。
比如在汽车行业,导购环节,魔珐有光专业虚拟直播会提供汽车内外展示,到客户意向阶段,魔珐有灵虚拟人服务平台再为客户提供1V1的专业讲解、展示及引导。用户购买后,借助魔珐有灵虚拟人服务平台,虚拟人还可以成为全程陪伴客户的出行助理,并融入车联APP,成为车主的生活助理。
在战略架构上,魔珐科技打造了全球首个端对端的超写实3D虚拟人工业化产线。具体来说,包括三维形象产线、三维动画产线、声音产线和垂类专业能力(比如电商)产线。
AIGC的终极形态
“之所以能实现超写实的3D虚拟人效果,主要与魔珐科技两方面的能力有关。”
柴金祥对钛媒体App表示,一是全栈式的AIGC能力,另一个则是20年来积累的工业化动画生产能力和海量数据。文生文、文生图的训练数据可以在互联网直接获取,但超写实三维虚拟人AIGC之所以难,一个很重要的原因行业缺乏各类高质量三维内容数据,“这是魔珐可以独有的”。
据柴金祥介绍,深度学习和大模型的出现,是AI动画发展过程的一个重要拐点。比如,在20年前甚至10年前,AI动画碰到的很多问题都是难以解决的。但是现在,利用新的技术,高质量的动画数据可以被更好的利用,达到最佳的呈现效果。
在柴金祥看来,企业一直在寻找内容形态好、能够规模化,同时ROI(投入产出比)高的新方法。要让企业觉得3D虚拟人有价值,成本不能太高。因为随着流量越来越贵,每个点转化越来越差,而随着3D虚拟人做到了标准化、高质量、低门槛,把体验转化率做到足够高,企业就会去用虚拟人的产品。
面向未来,3D虚拟人的终局又会是什么呢?
“元宇宙时代,所有的企业的服务都将以虚拟人为中心。”柴金祥对钛媒体App表示,如果说互联时代就是App的时代,那以3D互联网为代表的云宇宙时代,3D虚拟人会是时代的核心,也是AIGC的终极形态。
柴金祥认为, 比如,现在去银行办理业务需要亲自去银行窗口的服务台。但3D虚拟人可以百分百复制,借助VisionPro这样的可穿戴设备,为用户提供现实世界的一切服务。3D 虚拟人可以将各种AIGC 能力集成在一起,成为每个人在虚拟世界的专属智能助理。 (本文首发钛媒体App,作者 | 饶翔宇 编辑 | 钟毅)
根据《网络安全法》实名制要求,请绑定手机号后发表评论