JieZzz (@timepg) 在 深度学习代码创新,如何真正把大模型用起来,创造出实验效果好的代码+论文 中发帖
新手小登向大佬们请教个事,最近一直在碰壁:
现在大模型(claude gpt)很火,很热,功能也很强大,完全颠覆了之前的科研模式。之前的科研,以深度学习、遥感分割为例,自己都是拿别人的代码拼拼凑凑,效果好就意味着创新点出来了,那时候也没有大模型帮着改代码,但是实验结果出来的很顺畅,效果好了论文写的也顺利。
但是,现在大模型出来之后,让大模型把一篇论文的创新点总结出来,加到另一篇有代码的baseline上,得到的效果并不是预期,以增量学习为例。现在的模式是按照先前的拼凑模式进行的,但是没有达到大模型辅助下想要的效果。如果效果不好,问怎么修改,大模型的做法是给你一直调参,有时不是很明白,大模型真的适合用来代码创新?
是研究领域的不同,还是大模型没有真正的成熟,或者是我的方法不对呢?请大家赐教~~~
论文方面还没有进行,挖个坑吧,大佬们可以说下,或者以后进行了再来补坑。