cdcd (@cdxx0)想了解一下Bytehouse,什么是湖仓一体化? 中发帖

今天在微信公众号刷到了一个文章,讲字节的 Bytehouse,说是什么湖仓一体。 
看了一遍没看懂,又去网上逛了一圈,还是没弄明白他是怎么个逻辑,或者说体系(感觉我对数据、数据库、数据管理的认知只停留在 mysql 的增删查改 😥
求路过的大佬看看是怎么回事,什么是 “数据湖”,什么又是 “数据仓”;
还有很热门的向量数据库,现在用的很多吗
下边贴一些我搜罗到的信息,部分内容由 AI 生成:

公众号链接:




列式存储:






claude 瞎说的,不知道对不对


如何理解混合存储模式
让我深入解析 ByteHouse 的混合模式技术设计和实现原理:
1. 存储层设计

多级存储架构

数据流转路径:
入口层 -> 热数据层 -> 温数据层 -> 冷数据层

具体实现:
├── L0:内存缓存层
│ ├── 高速写入缓冲
│ └── 热点数据缓存
├── L...