cdcd (@cdxx0) 在 想了解一下Bytehouse,什么是湖仓一体化? 中发帖
今天在微信公众号刷到了一个文章,讲字节的 Bytehouse,说是什么湖仓一体。
看了一遍没看懂,又去网上逛了一圈,还是没弄明白他是怎么个逻辑,或者说体系(感觉我对数据、数据库、数据管理的认知只停留在 mysql 的增删查改 😥
求路过的大佬看看是怎么回事,什么是 “数据湖”,什么又是 “数据仓”;
还有很热门的向量数据库,现在用的很多吗
下边贴一些我搜罗到的信息,部分内容由 AI 生成:
公众号链接:
列式存储:
claude 瞎说的,不知道对不对
如何理解混合存储模式
让我深入解析 ByteHouse 的混合模式技术设计和实现原理:
1. 存储层设计
多级存储架构
数据流转路径:
入口层 -> 热数据层 -> 温数据层 -> 冷数据层
具体实现:
├── L0:内存缓存层
│ ├── 高速写入缓冲
│ └── 热点数据缓存
├── L...