语音识别测试

语音识别(ASR)评估指标

在测试语音识别的过程中,衡量识别内容的准确性,一般通过如下指标进行评估

WER(WordErrorRate,词错率)

定义:为了使识别出来的词序列和标准的词序列之间保持一致,需要进行替换、删除或者插入某些词,这些插入、替换或删除的词的总个数,除以标准的词序列中词的总个数的百分比,即为WER

WER=(S+D+I)/N

S:substitution,替换

D:Deletion,删除

I:Insertion,插入

N:标准词序列中词的总个数

(S+D+I)=识别出来的词序列与标准的词序列之间的编辑距离

注意:因为有插入词(Insertion),所以可能会出现WER>1的情况,不过,WER>1时,表明识别出来的词序列和标准的词序列相差很大,识别效果特别差

SER(SentenceErrorRate,句错率)

定义:句子中如果有一个词识别错误,那么这个句子被认为识别错误,句子识别错误的个数,除以总的句子个数即为SER

SER=SE/N

SE:识别出来的序列中,识别错误的句子个数(即WER!=0的句子个数)

N:标准序列中总句子个数

(2)、验证识别内容的准确性

统计识别文字的WER、SER指标

(3)、关注语音识别耗时

①短语音的识别耗时

②长语音的识别耗时


更多详情可联系亚洲体育博彩平台技术工作人员:Benson

手机/Mob:(+86)13632500972

邮箱/E-mail:marketing@gregorybgallagher.com

服务范围