松坂砂糖 (@MatsuzakaSato) 在 硬核资源:85万条歌词数据+10万条艺术家数据 中发帖
我们的歌词API项目的公共API服务已经运行了1年整。目前,通过网易云和酷我爬下来的歌词数据已经超过了85万条,艺术家数据超过10万条。
后端使用的数据库是ElasticSearch。
今天全量备份了一下,干脆把备份发出来。
JSON结构很简单,相信你可以看得懂的。JSON做了分片,每个JSON文档10万条数据,全部数据解压前473MB,解压后1.3GB。
{
"title": "一人行者",
"album": "一人行者",
"artists": "汉南蛮久",
"lrc": "[00:00.000] 作词 : ilem\n[00:01.000] 作曲 : ilem\n[00:04.880]嘿呀~嘿呀~嘿呀~嘿呀~\n[00:12.720]嘿呀~嘿呀~嘿呀~嘿呀~\n[00:20.720]嘿呀~\n[00:22.250]嘿朋友\n[00:24.91...