@kensaltyfish菜鸟文本三元组提取遇到的问题 中发帖

我的想法是这样的,大体思路就是给定一段话,然后尝试从一段话中提取其中隐含的多个三元组,但是三元组的数量不定。我目前简单利用BART参照seq2seq的思路,在BART模型后加一个线性层作为输出层,最后直接计算交叉熵损失函数来计算预测token和truth token之间的差距,input_id直接传的是我的文本,decoder_id传入的是句子中三元组的线性化表示形式,如[head] head1 [relation] relation1 [tail] tail1 …… 但是经过几个epoch的训练,我发现我的模型针对一个文本数据只能提取至多一个三元组,请问L站的大佬们有没有好的见解 😭 😭 😭 😭