Moonie 在 神经网络与大语言模型初步 - 第一章 神经网络 3 中发帖
最近实在是忙,面试、research什么的全部堆在一起了,所以更新速度有所降低,还请见谅。
(不得不提一嘴,腾讯的HR面试太奇妙了,流程走到HR面试几天没约面,年前恐怕难oc了😂
上一期我们讲了非线性的神经网络,这期我们讲 神经网络的效果评估。
至于其他更复杂结构的神经网络,比如CNN、RNN、LSTM,我在想是否需要讲。主要的考虑是:这些内容篇幅较长,且并不是理解LLM机理的必要条件,如果写这些,可能会让真正LLM部分出现地更晚,怕消磨了佬友们的注意力和耐心;不讲的话,又感觉对不起标题中的“神经网络”。佬友们有什么建议吗,欢迎评论区提出。
1.3 神经网络的评估
评估其实很简单,就是做题,以做题结果来评判模型效果。
1.3.1 数据集划分
评估是做题得到的,而做的题是从数据集中得到的,数据集划分是确定哪些数据用于训练、哪些用于评估(具体的评估指标放在1.3.2讲)
一般把...