荷包蛋 (@ayase) 在 妹系Galgame游戏资源合集-记一次资源爬取过程 中发帖
起因是这样的,在一个qq群里看到了这样一个一抹多列表,我就想把对应的资源都找出来,但是如果手动一个一个地去搜的话,那可太麻烦了,于是有了接下来的操作
[一抹多列表]
角色名转游戏名
首先要做的是找到游戏角色是哪个游戏里的,我第一个想到的是调用gpt的api
[在胡扯的狗屁通]
不过在我尝试了一下之后,就发现他在gal这方便简直就是在胡扯
于是放弃了这条路线,转而想到到了2dfan,这是一个galgame的补丁分享平台,我尝试调用它的搜索接口来搜索角色,很好这样是能查到具体游戏名字的
[2dfan测试]
但是每次会搜出很多结果来,而且我们只需要游戏名字,我准备通过截取
网页源码中这部分,把标题提取出来
[游戏名称]
但是这样我在实际操作的时候截取没有成功,于是我观察了下网页源码,换了另一个思路
游戏标题几乎都是日文,我看了网页源码中出现的第一个日文文本恰好就是...