在国内企业先后发布数百个大模型之后,人们的实际生活似乎并没有因为新一轮AI浪潮的到来产生容易被感知的变化。应用端,自年初Chat GPT的爆火和AI绘图成功破圈后,大模型的落地应用似乎就被困在了“陪聊”和“绘画”之中。
“大模型对于行业来说无疑是一场革命,但它并不是万能钥匙,我认为在很多垂直领域,很多企业应该更多地建立自己能够负担起的‘小模型’,通过具备学习能力的AI加速小体量应用场景的体验更新。”未来智能CEO马啸告诉钛媒体App。
作为一家在创业阶段的人工智能硬件公司,马啸将目光投向了“会议耳机”品类,研发服务于在线会议和纪要、摘录功能的智能硬件就是他口中提到的“垂直应用领域”。
“生产力”成为耳机的附加值
后疫情时代,“混合办公”已经成为常态化的工作模式,受疫情影响的3年时间内,很多人从不会用、不习惯在线协同办公、举行会议,逐步被教育成完全适应在线氛围,并以此提升效率。因此在线下生活逐步恢复后,在线会议的需求非但没有熄灭,反而实现了进一步增长,线下与线上呈现出融合趋势,根据腾讯会议的数据,到2022年,平台用户数已经超过2亿。
不过高效、便捷的沟通也带来了一些“副产品”:大量需要转译的语音数据,以平均150字/分钟的正常语速来计算,1小时的会议理论上就会产生9000字的速记稿,这也是为何众多会议平台都开始推出会议纪要、速记等功能的背后原因。
“会议耳机的切口其实就是成为线上以及小规模线下沟通的‘记录员’,相较于单纯由软件提供的转译、记录功能,耳机作为硬件产品,其自身具备拾音和声音传导的特性,因此不会产生兼容性和数据跨平台提取的问题,只要用户需要就能随时进行记录。”马啸说到。
从产品搭载的实际功能来看,会议耳机产品等于在传统的TWS耳机基础上增加了与语音、文字处理相关的功能,换句话说,此类产品带来的差异化体验并不只限于是音质、降噪、佩戴等传统耳机产品竞争的赛道,而是更加偏向于作为提升工作效率的生产力工具,就跟为了码字更快换一把键盘、为了剪辑视频换一台高性能PC同理。
但作为耳机与智能录音笔或其他具备录音处理能力的硬件结合体,哪个类目才是“本我”也是一项挑战,即:究竟是做一个耳机形态的智能录音设备,还是做一个具备录音转写功能的耳机。
刚涉足耳机领域时,未来智能的团队也碰到过钉子,首款验证产品直接延续了“单点打透”的思维,采用突出语音处理的功能属性弱化耳机体验的方式,但经过市场验证后很快回炉重造,事实证明用户并不是需要一台戴在耳朵上的“录音笔”。
马啸分享到:“仅从现阶段的产品表现来说,我们的产品更像是在提供一个符合同价位产品基础体验功能的耳机,比如目前主打的千元级价位,我们推出的Nano+同样也支持低延迟连接、主动降噪、通话降噪等功能,同时它还拥有文本转译、语音记录等功能作为‘附加值’。”他说到。
与生产力的高度贴合,也激发了会议耳机在内卷严重的TWS领域获得了较为差异化的竞争力,在此之上,马啸则认为独有功能会成为用户持续选择旗下产品的“品牌粘性”之一。他提到:“传统的TWS耳机除了手机+耳机的独家生态以外,缺乏很多应用层面的抓手,而与会议记录场景的高度绑定,则让用户在保留核心功能的同时,会为周边体验的升级付费。”
AI不止有大模型,小模型时代也将到来
消费者端,经过一段时间的打磨,初代会议耳机依靠简单的文字速记、语音转译功能开始受到金融圈、媒体等需要高频交流且有实时记录需求群体的关注。而在新一代产品上,则增加了生成式会议助理、同传听译、待办跟进等功能。
其中,生成式会议助理可以根据通话内容自动提取出待办事项,这就需要利用到AIGC(人工智能生成内容)技术,这就与目前主流的大模型人工智能产生了交集,该行业目前也处于极速膨胀的状态,几乎所有科技公司对大模型的趋之若鹜,甚至要花费巨量资金、人力以构建自身的独有大模型。
但对于未来人工智能的整体发展方向,马啸则提出了不同的观点:“经过我们的测算,不需要大模型那么大的参数量 也能够满足绝大多数会议纪要生成、日程提取的需要,同时由于训练数据更加适合专业场景,有限规模的‘小模型’反而效率更高。”
举个例子,通用的大模型在处理语言信息的时候需要用大量广义的资讯、文章甚至论文进行机器学习,才能拥有更强的理解能力和逻辑组织能力,如果还需要增加绘画功能,那么对模型的规模要求还会更上一层楼,因此通用场景往往需要大公司重金投入的大模型才能胜任。
但仅从会议场景和日常办公来说,大量与生活相关或者与专业领域极少产生交叉的资料其实是不需要学习的。“从长远发展来看,我认为每个公司甚至每个产品都会拥有一个适合对应AI场景的小模型,主要是用来解决细分场景的应用落地需求。”马啸表示。
构建会议耳机品类初步认知与为产品加入AI延伸的功能,可以看作是未来智能公司的第一阶段落成,未来在产品层面还会探索更多形态的同时,也还会不断加深市场教育。在其所处的办公赛道,其实并不缺乏竞争者,一方面视频会议平台本身就已经开始涉及到硬件层面的部署,同时传统的办公场景耳机赛道,也有罗技、Poly等厂商正虎视眈眈。
马啸坦言:“面对竞争,我觉得大模型也好,AI功能也罢,都称不上未来智能公司和讯飞会议耳机的最大竞争力。从我的视角来看,‘用户心智’或者说对产品的‘第一认知’才是更重要的底牌,就像可口可乐成为了汽水的代名词,戴森成为了高速吹风机的代名词,那我们的产品就是会议耳机的代名词。(本文首发钛媒体App 作者/邓剑云 编辑/钟毅)
根据《网络安全法》实名制要求,请绑定手机号后发表评论
确实是在办公场景中帮助了非常多,我买的是nano
有深度,语音记录、转写挺好用
这么厉害的吗,又学到了很多知识