1895年12月28日,一辆火车「驶入」法国巴黎的一家咖啡馆,尽管只是无声的黑白影像,在座观众还是被吓得四散奔逃,这也成为视频产业史上的经典注脚。
音频和视频的发展几乎是同时的,留声机、磁带、唱片机、电话等一一而来,视频从默片走向有声,从黑白走向彩色,从模糊走向超清,技术更新迭代,创造了全新的音视频产业。
譬如美国传媒支柱产业有线电视(流媒体),环球影业(1916年),福克斯(1915年),华纳兄弟(1923年),米高梅(1924年),哥伦比亚影业(1924年)都创立于那个时代,好莱坞一度垄断了产业。
有观点认为,美国好莱坞在于创造了内容生产工业化的流程,从一个点子出发,剧本、项目、拍摄、后期、发行一应俱全,而中国直到4G时代,才堪堪追赶上美国音视频产业的节奏,如今爱优腾等视频平台大多效仿了Netfilx、YouTube等。
音视频制作走向规模化和工业化,靠的不只是创意和点子,更需要建立一套工业生产流程,现实是我们还缺少体系化的工具和实践。
与此同时,围绕音视频技术和产业,一种下沉效应逐渐释放——过去作为最终消费品的音频和视频,下沉成为新消费品的基础,由此形成行业不断向前的驱动力,在这一过程中,音视频技术和产业也在重塑。
如上建立在音视频的广泛普及和产业再生长的前提下,音视频本身有海量的消费空间,突如其来的疫情又极大加速了需求的释放,短视频、在线会议、线上教育、直播,甚至未来的元宇宙等,都依赖于音视频行业的发展。
再定义:音视频是什么
音视频是一类技术还是一个行业?其实都不能准确概括它的现状,在笔者看来,如今的音视频更接近于一门工业。技术和产业的下沉效应并不罕见,相反地,它几乎是任何一个规模工业的必经之路。
泛化定义中,工业是原材料的再加工,在如今的数字化时代,原材料既可以是矿石等自然资源,也可以是数据等数字资源,就像制造业生产出日常生活所需的东西,音视频工业也能生产出不止一种形态的数字消费品。
短视频只是一种简单形式的音视频消费品,却也折射出「规模生产」的属性,抖音和快手两大短视频App并不生产短视频,但是他们提供了短视频规模生产的工具,任何人只用一部手机就可以「生产」短视频,进而被其他人所「消费」。
除了短视频,还有更多形式的音视频消费品。数字世界要映射人的五感,耳听和目视是最为直观的两种感觉,实时交互、远程协作、虚实融合等,无不需要音视频技术的参与。
这从认知角度也说得通,人们更愿意获取直接的反馈和交互,同一件事透过电话和当面交流是两种效果,同一件商品在网上商店和直播间销售又是两种效果,音视频传递的情绪要多得多。
音视频已经覆盖到我们生产生活的方方面面,近年来,音视频行业从业者有一个明显的感觉,需求繁多到应接不暇,新场景涌现得眼花缭乱,自己做的事情却愈来愈后端,因为音视频已经融入并成为千行百业的基础。
千行百业也给予音视频工业以反馈,仅就目前的需求和供给两端来看,音视频工业并不处于平衡状态,即使是发展经年的内容制作,3D音视频内容生产周期一般需要18个月甚至24个月,内容供给能力显著落后。
从工业发展的思路入手,提高音视频工业中间环节的效率,能够同时缩短供需两端的工业化历程,很多厂商已经着手,例如声网在疫情期间凭借音视频技术大获关注,快手和抖音也没有仅限于生产短视频,而是推出了自己的音视频PaaS品牌和产品。
其逻辑并不难理解,音视频技术的通用化,能够撬动传统行业众多实时、互动等场景的数字化升级,我们并不能确切预知音视频的普及广度和改造深度,只能说,音视频的未来市场空间充满想象力。
当音视频走向大工业化
技术的工业化通常可以分为三个阶段,首先是技术应运而生,在场景之下不断完胜自身,这更多是技术本身的成熟,仅就目前音视频技术的演进维度,音视频技术已经发展得相对成熟。
但是若从技术产业化或者工业化的维度来看,音视频还有很多难题尚待解决,这也是第二阶段,音视频技术要大规模走向产业,不止于消费互联网,更是广阔的产业互联网,核心是解决规模化的应用问题。
此后技术工业化将进入第三阶段,将显著提高千行百业的生产力和生产效率,促进经济的发展与创造。
在中国V谷·华为云音视频产业峰会2022,关于如何让音视频走向大工业化,我们观测到了一些趋势。
长沙,马栏山,别名「中国V谷」。招商引资、建设园区是城市发展经济的常见方式,而马栏山的另一面有些不太常见。马栏山投资2.2亿元,通过公有云+私有云构建了马栏山的混合云,并实施5G、WIFI、一百兆光纤、网络全覆盖,实行视频制作的云化,改变生产方式,降低生产成本,提高生产效能。
这给了行业很大的启示。某种意义上,马栏山就是一个鲜明的音视频工业化生产案例,音视频由技术到应用场景,再到产业,同时回溯前端的需求,转化为后端的技术演进,形成一个技术-场景闭环。
其中的关键是“加工厂”。华为云中国区总裁张修征表示,行业正迈向虚实融合的3D互联网时代,音视频产业迎来蓬勃发展期。面向新时代,音视频产业应深入到Cloud for Media、AI for Media,生于云、长于AI。
“音视频领域面临一场人机交互体验的革命,是算力、连接、显示整个端到端革命的升级,市场也在呼唤着颠覆式的终端,现象级的内容以及全新的产业生态”,张修征说道。
音视频的工业化,本质上就是要把音视频做成一个基础设施,音视频的技术路线天然和云计算相近,在云原生的大背景下,音视频的工业版图能够更好的补全。
纵观全球技术厂商,不论是华为云这样的公有云厂商,基于底层IaaS向上层PaaS延伸,还是以Twilio、声网为代表的PaaS厂商,丰富云原生的能力,赛道交叉、一体化的趋势越来越明显。
音视频基础设施下沉之后
从文字到图片到视频,到3D互联网,音视频产业跨越了传统的电影电视,移动互联网时代的点播、直播、短视频实时互动的直播,再到3D互联网时代或者近似于元宇宙,音视频技术正原来内容的表现方式,成为千行百业的生产力。
音视频技术下沉,会下沉成为什么样子?
从客户的需求反推当下的演变,音视频技术应当重塑为云原生媒体基础设施,华为云总结为“1个生态+2类服务+3大引擎+4大核心能力”,具体来看:
1个生态是通过沉淀伙伴的优秀经验,面向不同行业发布系列化的云上生产线;
2类服务是面向伙伴及开发者,提供内容类服务,提升内容生产效率;提供应用类服务,让虚实融合的应用开发更加便捷。
3大引擎是通过云原生的图形、空间、音视频引擎,让3D建模、仿真、渲染、VR/AR等处理更加高效。
4大核心能力是以媒体为中心,重新定义算力、网络、AI、区块链等云基础设施能力,从cloud for computing走向cloud for media。
云原生媒体基础设施不只是技术的集合体,我们也注意到,华为云发布了数字内容伙伴计划,将在未来3年,结合华为云GoCloud计划,发展300家以上数字内容伙伴,会上亮相的参与方包括微赞、芒果幻视、积木易搭、美摄科技、中影年年、融云、ZEGO即构科技、硅基智能、赞奇、中科大洋、造梦星河等。
工业生产首先是分工协作的,然后才是全面专业化升级的,用制造业逻辑来理解,音视频从原材料到最终成品,一定是涉及多方的生产线,存在多个中间环节,没有生态也就无从谈及工业化,协作是专业化发展的必然结果,协作的发展又促进专业化的发展,让音视频解决方案更完善。
其次是服务,一个是面向内容开发的数字内容生产线,另一个是面向应用开发的3D虚实融合应用的生产线,两者可以理解为针对音视频制作方式的变化,工具加服务平台,可以让内容生产门槛大大降低。
此外是云原生、AI原生、CG+CV融合三大引擎,云原生让引擎使用云上的海量算力,基于数据驱动的AI原生,可以实现数字人的自驱动等,通过CG/CV的融合,可以让现实世界拍摄的视频图像,虚拟世界中创作的3D模型能够精准融合。
最后是基础能力,虽然基础,但却体现了技术下沉的核心,诸如多元化的算力、高速文件存储、全球一张网的调度,AI和区块链等等,音视频工业生产线的下游参与者不用再去考虑什么是计算、存储和网络,甚至安全、AI和区块链,只需依据自己的需求再加工,云原生媒体基础设施已经固化了前期要素。
当音视频技术下沉,云原生媒体基础设施重塑了每一个中间环节,音视频走向工业大生产式必经之路,由消费互联网到产业互联网,通过音视频的技术工业化,一切皆可创作,一切皆可想象。
音视频产业化将行至何处?张修征给出了他的判断,“音视频市场又迎来了一个爆发期,人们总是容易高估未来一年发生的事情,而低估未来5-10年发生的事情。”
蒸汽机和内燃机成为工业革命的动力,内置在各种机械中;以电力为基础,电灯、电话、电脑、电冰箱等不断涌现;云计算成为现代IT的基础平台,企业的组织、数据和生产系统都建立在云平台上。
可以预见的是,未来在产业各界实践者的探索下,音视频技术将越来越无需感知,蜕变为产业互联网的基本构成,数字世界的砖石瓦砾,音视频产业吹响大工业时代的号角。(本文首发钛媒体APP 作者 | 张帅)
根据《网络安全法》实名制要求,请绑定手机号后发表评论
音视频技术将越来越无需感知
真的是太让人兴奋了,相信发展会越来越好的,我会一直期待的
太令人期待了