gzhou上线了一个PPT模板资源分享站-分享一下上线过程 中发帖

因为穷,所以设了一下限制,尽量不花钱。🫣 




资源来源:互联网上下载的。
数据存储:GitHub 仓库。
网站托管:cloudflare pages。
网站生成器:hugo ,主题自己搞的。

分享一下折腾的过程,真的是一步一个坎,太难了。

先下载资源,从网上下载了大概100G的资源。
整理资源:清理掉一些无效的、重复的、空的,最后大概还剩下50G,几千个PPT。
截图、提取关键词、描述:先获取PPT截图和首图,然后把截图给到视觉大模型去输出关键词和描述。这个过程得到了几万个关键词。
精简关键词:因为大模型输出的关键词太杂太乱,通过语意相似度来进行去重整理。最终剩下2000个左右的关键词。
接着把资源传到GitHub上,由于GitHub存储库有一些限制,所以写了一个脚本可以再存储库满的时候,创建新的再继续上传。
静态网站生成。每个PPT作为一篇文章markdown给到hugo去...