发布网友 发布时间:2022-04-27 06:42
共1个回答
热心网友 时间:2023-09-12 18:11
通常衡量语音识别技术的几个技术指标有准确率、反应时间以及处理性能。目前中文的通用语音连续识别准确率能达到95%。识别率提升的关键是模型的训练。由于发表文章都是公开的,大家的算法差异不显著。主要是比谁的训练数据更多、更好。业界公认从目前水平提升至99%甚至100%的路还很长。这主要是语音的一些特性决定的。一、受场合、情绪、身体状况、内容上下文的影响,导致字或词的语音特性(重音、音调、音量和发音速度等)产生改变。二、语音的模糊性。汉语在会话中不同的词可能听起来是相似的。 人有时也会听不清楚更何况机器。三、汉语的复杂性,对于相同发音的字、词,有时基于语言模型不能确定究竟是哪个字,如章丽丽/张莉莉。四、环境环境噪声干扰,对语音识别有严重影响,尤其是出现多个人声将对正常识别造成很大干扰。