【常宁/ 钛媒特约】如今技术的发展已经远远超出我们的想象,像智能手机能识别到最近的商店、公交车站等等已经不算什么新鲜事儿了。研究人员并不满足智能手机是人的辅助工具,他们希望智能手机不只是冷冰冰的机器,而是有情商,能洞察人的情绪,成为人的亲密伙伴。
美国罗彻斯特大学的一个研究团队就在做这样的事情,他们的项目叫做Bridge,目的是为了开发能从人类语音、面部表情或身体姿势中探测出情绪的方法。并且该团队已经开发出一个新软件,它不需要收集说话的内容信息,仅通过分析说话语气就可以知道人的情绪,比如悲伤、幸福、害怕和厌恶等。也就是说,它跟人说什么内容没有关系,而是能洞察人是怎么说的。
新软件对语音情绪的判断精确度可达到81%,而以往研究的准确度只有大约55%,所以新软件在准确度方面有很大突破。研究人员在刚刚闭幕的IEEE语音技术研讨会上对该软件进行了展示。
说什么内容不重要 怎么说才重要
情感和情绪是人的一种复杂心理状态的体验,而这种体验是随着人自身的生理和周围环境的影响而变化的。许多现有的情感和情绪探测方法主要是以人主观的自我陈述作为基础数据,整个过程耗时耗力,且准确性不高。目前研究已经发现,语言中韵律的变化与人们的情感和情绪有很大的联系,所以研究人员想利用这一点来开发出能自动探测人类情绪的方法。
情绪会影响人的说话方式,比如通过人说话的声音大小和音高就能大概判断人的情绪状态。要想教计算机去理解人们的情绪,那么首先要认识人是如何通过声音表达情绪的。
所以,在新软件的情绪探测系统中,研究人员利用语音信号处理方法来提取语音特征,并且给语音确立了12种特殊的语音特征,比如语音的音高、音量、活力等,这些语音特征都能被统计出来,并作为测量标准。随后研究人员会根据这些特征绘制出语音的波形、频谱、共振峰,以此来发现语音信号中与情绪情感相关联的模式,并将语音进行分类,最终教计算机判断出语音中包含的情绪。
首款情绪探测App原型出现
Wendi Heinzelman是罗彻斯特大学电子与计算机工程教授,也是该团队的负责人。她的学生Na Yang已经基于该研究开发出一款app原型,在记录并分析用户的声音后,这款app会显示出用户是处于高兴或悲伤的情绪中。不过这款app的功能还是还是非常简单。
Heinzelman表示,虽然处于早期阶段,但要作出一款更复杂app也不是什么难事儿。他们将继续开发可以推向市场的情绪探测app,比如可根据用户的声音了解用户的情绪,然后播放符合用户心境的音乐等等。并且她认为他们的新方法要比之前的任何研究方法都更有效。
但这款软件还是存在一定的问题,那就是在多人聊天谈话中,系统容易受到干扰,对情绪的判断准确性就会下降,这也是Heinzelman的团队下一步要解决的问题。
相比Siri的机械化 新软件更贴心
业界对语音分析的研究早已开始,但在准确率方面一直表现不佳,就连备受关注的苹果Siri也差强人意。所以谈到这里,肯定有人会将新软件与苹果的Siri来比较。
Siri在回答人们所提的问题方面,确实有吸引人之处,但回答准确率并不太高。据去年7月份美国投资银行派杰(Piper Jaffray)的分析师对Siri进行的一次测试显示,在闹市区,Siri问题理解准确度为83%,回答准确度为62%。在安静的房间内,Siri问题理解准确度为89%,回答准确度为68%。从这些数字来看,Siri的语音分析水平并不是很高。
但是,Siri只停留在根据人们提问的问题进行词语分析,进而来匹配答案,在程度上多少有些机械化。
新技术也属于语音分析的范畴,然而与Siri不同的是,它不需要去解释语音的内容或像其他语音技术去捕捉图像,所以不会涉入太多复杂条件,更容易操作,准确性也更强。所以,这种情绪探测系统可能会更具吸引力。而且,新技术要解决的是更高级的情感问题,希望尽可能的感受到人的情绪,而不是简单的分析词语。因此,从这方面来讲,新软件似乎更胜一筹,更人性化和贴心。
商用价值有空间
未来,医疗研究人员可以在移动设备上利用这种情绪探测和感知技术,用于监护病人或对人的行为进行研究。另外,目前业界一直在研究比较复杂的情景感知系统,而情绪探测技术将会成为情景感知系统研究的入口点。而情景感知系统将会是未来消费电子产品或服务的重要功能,并且也是未来推动移动广告发展的重要技术。这一点来讲,其商用价值有极大的开发空间。
更多该技术的具体介绍可查看罗彻斯特大学网站
根据《网络安全法》实名制要求,请绑定手机号后发表评论