@chesha1请问有什么推荐的音频数据标注工具(用于TTS训练) 中发帖

就是把一个长音频,去噪,检测人声后切片,用ASR初步识别出文本 
然后人可以查看每一条结果,手动修改,选择保存方式
上述每一步都有很好的实现,比如 Silero VAD+whisper,但是自己写太费事了,想问下佬友们有没有推荐的标注工具,带图形界面,导入音频可以直接开干的