×
声学学报

电信技术论文_TCN-Transformer-CTC的端到端语

文章摘要:最近,基于Transformer的端到端语音识别系统获得广泛的普及,但Transformer中的多头自注意力机制对输入序列的位置信息不敏感,同时它灵活的对齐方式在面对带噪语音时泛化性能较差。针对以上问题,首先提出使用时序卷积神经网络(TCN)来加强神经网络模型对位置信息的捕捉,其次在上述基础上融合连接时序分类(CTC),提出TCN-Transformer-CTC模型。不使用任何语言模型的情况下,在中文普通话开源语音数据库AISHELL-1上的实验结果表明:TCN-Transformer-CTC相较于Transformer字错误率相对降低10.91%,模型最终字错误率降低至5.31%,验证了提出的模型具有一定的先进性。

文章关键词:

论文DOI:10.19734/j.issn.1001-3695.2021.08.0323

论文分类号:TN912.34

上一篇:海洋学论文_基于总场公式的水下冲击结构响应分
下一篇:没有了

Top