微软语音发布升级版 HiFiNet 声码器:发音更准更自然、

这篇文章内容给诸位网民产生的新闻资讯是:微软公司视频语音公布全新升级 HiFiNet 声码器:发音更准更当然、高保真度、生成更快 详情请赏析下文

IT大王 6 月 24 日信息 微软公司日前公布新一代深层神经元网络 HiFiNet 声码器,与微软公司上一代语音识别技术对比,由 HiFiNet 声码器生成的神经系统正版响声品质再创佳绩,关键反映在发音更精确、律动更当然、高保真音响实际效果更极致,更受顾客亲睐。自发布至今,被广泛运用到有声阅读、线上教育、车截智能语音助手等行业。

微软语音发布升级版 HiFiNet 声码器:发音更准更自然、

IT大王获知,HiFiNet 是微软公司神经系统正版语音识别技术性中全新的响声编码器,是决策声频品质的首要条件。依据专业评估视频语音当然度的 MOS 检测数据显示,由 HiFiNet 声码器生成的视频语音音色可与用以训炼的真人版音频样版相提并论,并与此同时改进毛边、噪声等声频产品质量问题,輸出的音色具有高些保真度,更多方面复原真人版音频。

(微软公司上一代声码器生成响声)

(微软公司 HiFiNet 声码器生成响声)

视频语音品质的好坏会立即危害收听者的体会,为提高客户接听的舒适感,在 Azure 语音识别系统软件中,神经元网络声学材料实体模型根据深度神经网络互联网,应用真人版音频做为原始记录开展迭代更新训炼。最先,获取真人版音频的声学材料特点。随后,运用真人版音频的声学材料特点自动生成2组声频:一组真正声波频率(初始音频)和一组伪波(生成声波频率)。最终,由鉴别器区别真正声波频率和伪波。伴随着训炼频次的增加,声波频率制作器也会更加“聪慧”,直到转化成鉴别器也没法区别的伪波,这代表着设备生成的响声早已和初始音频相差无异,进而给客户产生更接近当然的感受。

(真人版初始音频)

(微软公司 HiFiNet 协作响声)

由微软公司 HiFiNet 声码器生成的声频品质更贴近真人版初始音频。

微软语音发布升级版 HiFiNet 声码器:发音更准更自然、

▲HiFiNet 声码器训炼平面图

采样频率越高,响声复原越真正。Azure 神经系统正版语音识别声学材料实体模型默认设置每秒取样 24,000 次 (24 千HZ),为复原独特情景中更加繁杂、微小的响声內容,HiFiNet 声码器每秒取样 48,000 次(48 千HZ),满足客户对视频语音品质的严格管理,让客户纵享高清语音感受。

微软语音发布升级版 HiFiNet 声码器:发音更准更自然、

▲声频采样率与保真度比照平面图

除视频语音品质外,HiFiNet 生成速率相较别的实体模型也是有明显的提高,进一步提高了语音识别的即时率。据 RTF(Real Time Factor,即时率,用于精确测量语音识别速率的专用工具)检测数据显示,HiFiNet 在 GPU 机器设备上运作的速率是第一代性能卓越声码器的 3 倍,在 CPU 机器设备上运作的速率是第一代性能卓越声码器的 2 倍。

现阶段,内嵌 HiFiNet 声码器的 Azure 认知能力服务项目神经系统正版语音识别服务项目已适用超出 70 好几个国家和地区的语言表达,给予超出 170 个当然真实的音质供开发人员挑选。

相关 HiFiNet 及语音识别的大量內容:

  • 有关 HiFiNet

  • 有关语音识别使用版 

  • 有关语音识别的大量材料

  • 有关实例编码

© 版权声明
好牛新坐标
版权声明:
1、IT大王遵守相关法律法规,由于本站资源全部来源于网络程序/投稿,故资源量太大无法一一准确核实资源侵权的真实性;
2、出于传递信息之目的,故IT大王可能会误刊发损害或影响您的合法权益,请您积极与我们联系处理(所有内容不代表本站观点与立场);
3、因时间、精力有限,我们无法一一核实每一条消息的真实性,但我们会在发布之前尽最大努力来核实这些信息;
4、无论出于何种目的要求本站删除内容,您均需要提供根据国家版权局发布的示范格式
《要求删除或断开链接侵权网络内容的通知》:https://itdw.cn/ziliao/sfgs.pdf,
国家知识产权局《要求删除或断开链接侵权网络内容的通知》填写说明: http://www.ncac.gov.cn/chinacopyright/contents/12227/342400.shtml
未按照国家知识产权局格式通知一律不予处理;请按照此通知格式填写发至本站的邮箱 wl6@163.com

相关文章