Google (@8.8.8.8)自动化难题,求大佬把脉 中发帖

这两天有个想法,但是超出自己能力了,请教下大家。 
因为想弄一个自己的时效性比较强的内容体系,所以有了以下的一些想法。
逻辑

日常关注的一些信息源加到X的list里面
每分钟爬取一次list的最新消息
个人推特发的内容直接下一步。官媒消息(比如彭博社、cnn)因为都很简略,需要再次爬取推文自带的链接里的内容
将爬取的消息根据自己的要求用AI过一下
推送到TG

困难点

爬X的步骤可以交给第三方API做,0.3刀/1000次,但是只能爬个人,不能爬list
彭博社这些媒体有付费罩,用Bypass Paywalls Clean可以破,但是我不知道该怎么做到自动流里
这种信息必然会出现很多重复的资讯,要怎么去重比较合理

现状

第三方API爬取一堆账号,汇总
没辙
老的消息存数据库里,新消息来,和老的进行重合度比对判定。
整个流程用n8n串联(小白,只能低代码)

佬们,你们觉得这事儿还...