JieZzz (@timepg) 在深度学习代码创新，如何真正把大模型用起来，创造出实验效果好的代码+论文中发帖新手小登向大佬们请教个事，最近一直在碰壁：现在大模型（claude gpt）很火，很热，功能也很强大，完全颠覆了之前的科研模式

JieZzz (@timepg) 在深度学习代码创新，如何真正把大模型用起来，创造出实验效果好的代码+论文中发帖

新手小登向大佬们请教个事，最近一直在碰壁： 
现在大模型（claude gpt）很火，很热，功能也很强大，完全颠覆了之前的科研模式。之前的科研，以深度学习、遥感分割为例，自己都是拿别人的代码拼拼凑凑，效果好就意味着创新点出来了，那时候也没有大模型帮着改代码，但是实验结果出来的很顺畅，效果好了论文写的也顺利。 
但是，现在大模型出来之后，让大模型把一篇论文的创新点总结出来，加到另一篇有代码的baseline上，得到的效果并不是预期，以增量学习为例。现在的模式是按照先前的拼凑模式进行的，但是没有达到大模型辅助下想要的效果。如果效果不好，问怎么修改，大模型的做法是给你一直调参，有时不是很明白，大模型真的适合用来代码创新？ 
是研究领域的不同，还是大模型没有真正的成熟，或者是我的方法不对呢？请大家赐教~~~ 
论文方面还没有进行，挖个坑吧，大佬们可以说下，或者以后进行了再来补坑。