2024T-EDGE文章详情顶部

百度地图推出语音定制功能,可以生成个人语音包 | 钛快讯

语音定制功能推出后,用户只需要在手机录制20句话,经过20分钟左右的制作,就可以生成个人完整语音包。

图片来源@视觉中国

图片来源@视觉中国

钛媒体快讯 | 9月19日消息:百度地图事业部总经理李莹今日宣布,百度推出行业首个地图语音定制功能。据李莹介绍,语音定制功能推出后,用户只需要在手机录制20句话,经过20分钟左右的制作,就可以生成个人完整语音包。

如图,用户可从百度地图首页进入语音定制页面,可选择性别,还可以录制童声。录制的文本方面,用户也可以选择系统推荐文本,卡通文本和电影台词。特别是录制童声时,百度为低龄儿童设置了语句更短、可重复的儿童语句。录制完的语音包可以自己使用,也可通过微信或者百度地图分享给他人使用。

百度地图语音定制模块图示

百度地图语音定制模块图示

据悉,用户定制的语音包使用场景比较广泛,在手机地图的任何场景中都可使用,比如景区智能语音导览、智能语音交互等全部场景使用。用户可免费使用自己或家人的语音包在景区游览。

李莹也特别强调,在整个流程中百度地图遵循了业界最标准、最成熟的安全规范,采取了非常安全的保护措施,会最大程度的保障每个用户的安全隐私。“百度地图对于语音定制服务的权限获取将仅用作语音包录制,不做他用。百度地图未经用户的授权同意,不会将用户的语音包共享给任何人。”

李莹在演讲中介绍道,如果做一个通用大库的语音包,大概需要录制的语音量是上万句,制作周期近半年。如果做个人定制的,如某一个明星的语音包,需要在大库基础之上录制1000到2000句语音,要在专业的录音棚里面录制大概两周时间,而真正把这个语音包用语音技术生成出来需要两个月的时间。

新的语音定制功能大大缩减了此前语音录制的成本。百度语音首席架构师贾磊介绍了语音定制功能背后的技术:

“百度地图语音定制功能基于百度独创的说话人韵律迁移技术Meitron,其特点主要体现在发音人音色转换,多情感朗读和韵律风格迁移三个方面,从而让个性化语音合成的定制门槛大大降低。”

云端深度学习语音合成技术可形成不同风格的声音

云端深度学习语音合成技术可形成不同风格的声音

贾磊介绍道,以前语音合成大多数都是新闻播音腔,而现在百度的语音合成可以有多重风格和声线。在现场原声与合成声音的比对测试中,两种声音几乎分辨不出差别。

当前,在数据生产方面,百度地图80%数据采集环节已实现AI化,拥有3000万的POI空间图谱、700万的用户兴趣图谱,共同组成了百度地图POI高精知识图谱。

(本文首发钛媒体,作者/芦依)

本文系作者 芦依 授权钛媒体发表,并经钛媒体编辑,转载请注明出处、作者和本文链接
本内容来源于钛媒体钛度号,文章内容仅供参考、交流、学习,不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里

敬原创,有钛度,得赞赏

赞赏支持
发表评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容
  • 又出新主意了!

    回复 2019.09.19 · via android
  • 哇!听起来好有趣(✪▽✪),不知道会不会机械

    回复 2019.09.24 · via android

AWARDS-文章详情右上

3

扫描下载App