语音识别专题

语音识别的一个难点在于语音和文字的对齐。

特征

MFCC

CTC(Connection Temporal Classification)

https://deepmind.com/blog/wavenet-launches-google-assistant/


语音唤醒 keyword spotting

评价指标: 准召率,实时性,能耗


工具

Essentia

Gentle 语音和文字的强制对齐


参考资料

results matching ""

    No results matching ""