yaoxiaoyao 在 讨论声纹识别方案 中发帖
背景:普通Java开发,接触过少量的人工智能
目前想要完成一个关于声纹识别的设计.需要加入大量的噪声(除目标之外的其他声音)
方案一
声音转化为时间序列的振幅然后做归一化进行训练特征,这个方案可以知道是什么声音
方案二
将音频转化为频谱图并使用CNN进行处理,这个方案可以知道声音的详细情况
是否还有其他实现方案更优或者落地复杂度更低