TiDB 分布式数据库 整体架构图
2025-11-22 22:38:12 0 举报
TiDB 分布式数据库采用去中心化、无单点故障的开放架构设计,其核心由TiDB服务器、TiKV存储引擎和PD(Placement Driver)组件构成。TiDB服务器作为SQL入口,负责SQL解析、优化和执行。TiKV作为高性能分布式事务键值存储,底层采用Raft一致性协议保障数据安全与可靠性。PD组件是TiDB系统的大脑,管理整个集群的元数据,负责数据分布和负载均衡,确保系统高可用。整个架构支持无缝水平扩展,提供弹性伸缩能力。TiDB的设计允许跨数据中心容灾,并针对多云环境和边缘计算优化,是现代化的数据仓库和混合事务/分析处理(HTAP)应用的优选数据库解决方案。
作者其他创作
大纲/内容
TSO/Data location
PD cluster
TiKV
Storage cluster
PD
TiDB
KV API
TiFlash
DistSQL API
TiDB cluster
Metadata
TiDB Server:SQL 层,对外暴露 MySQL 协议的连接 endpoint,负责接受客户端的连接,执行 SQL 解析和优化,最终生成分布式执行计划。TiDB 层本身是无状态的,实践中可以启动多个 TiDB 实例,通过负载均衡组件(如 TiProxy、LVS、HAProxy、ProxySQL 或 F5)对外提供统一的接入地址,客户端的连接可以均匀地分摊在多个 TiDB 实例上以达到负载均衡的效果。TiDB Server 本身并不存储数据,只是解析 SQL,将实际的数据读取请求转发给底层的存储节点 TiKV(或 TiFlash)。PD (Placement Driver) Server:整个 TiDB 集群的元信息管理模块,负责存储每个 TiKV 节点实时的数据分布情况和集群的整体拓扑结构,提供 TiDB Dashboard 管控界面,并为分布式事务分配事务 ID。PD 不仅存储元信息,同时还会根据 TiKV 节点实时上报的数据分布状态,下发数据调度命令给具体的 TiKV 节点,可以说是整个集群的“大脑”。此外,PD 本身也是由至少 3 个节点构成,拥有高可用的能力。建议部署奇数个 PD 节点。存储节点TiKV Server:负责存储数据,从外部看 TiKV 是一个分布式的提供事务的 Key-Value 存储引擎。存储数据的基本单位是 Region,每个 Region 负责存储一个 Key Range(从 StartKey 到 EndKey 的左闭右开区间)的数据,每个 TiKV 节点会负责多个 Region。TiKV 的 API 在 KV 键值对层面提供对分布式事务的原生支持,默认提供了 SI (Snapshot Isolation) 的隔离级别,这也是 TiDB 在 SQL 层面支持分布式事务的核心。TiDB 的 SQL 层做完 SQL 解析后,会将 SQL 的执行计划转换为对 TiKV API 的实际调用。所以,数据都存储在 TiKV 中。另外,TiKV 中的数据都会自动维护多副本(默认为三副本),天然支持高可用和自动故障转移。TiFlash:TiFlash 是一类特殊的存储节点。和普通 TiKV 节点不一样的是,在 TiFlash 内部,数据是以列式的形式进行存储,主要的功能是为分析型的场景加速。
Application viaMySQL protocol
收藏
0 条评论
下一页
为你推荐
查看更多