(@Ghidra) 在 transformer转线性RNN,仅需极低成本极少量微调,性能与原模型相当 中发帖
https://mp.weixin.qq.com/s/J0sS9J61nG1cw45Y0AxjJw
有没有懂行的说说这是水文章的还是真的有东西
https://mp.weixin.qq.com/s/J0sS9J61nG1cw45Y0AxjJw
有没有懂行的说说这是水文章的还是真的有东西