敲定系统设计:面试敲开大厂的门-读书笔记思维导图模板

1 从0到100万用户的扩展

关键词

持续改进

不断优化

请求流

流量源头

横向扩展

纵向扩展

负载均衡器

数据库复制

缓存层

缓存读

CDN

无状态网络层

数据中心

解耦

消息队列

重要内容

演化过程

最初

服务和数据库都在一起

第一层分割

服务和数据库拆分

网站访问的请求流程

1用户输入域名,访问网站

2域名通过dns解析为ip地址,返回给请求端

3请求端使用ip地址构建http请求,发送到服务器

4web服务器,返回html页面,或者其他响应信息给请求端

流量源头

web应用

移动应用

数据库选择

关系型数据库

关系型数据库通过表和行来表示和存储数据。你可以使用SQL对不同的数据库表执行连接(join)操作。

非关系型数据库

可以分为四类：键值存储、图存储、列存储和文档存储。非关系型数据库一般不支持连接操作。

何时该选择非关系数据库

•你的应用只能接受非常低的延时。

•应用中的数据是非结构化的，或者根本没有任何关系型数据。

•只需要序列化（JSON、XML、YAML等格式）和反序列化数据。

•需要存储海量数据。

扩展方向选择

纵向扩展

纵向扩展也叫作向上扩展，指的是提升服务器的能力（CPU、RAM等）。

初期价格低廉,越往后性价比越低

纵向扩展是有硬性限制的，你不可能给一台服务器无限添加CPU和内存。

纵向扩展没有故障转移和冗余。一旦一台服务器宕机，网站/应用也会随着一起完全不可用。

横向扩展

横向扩展也叫作向外扩展，指的是为你的资源池添加更多服务器

初期性价比较低,越往后性价比越高

由于纵向扩展存的限制，因此对于大型应用来说，采用横向扩展更合适一些。

负载均衡器

作用

将输入流量均匀分配到负载均衡集中的各个web服务器上

增加了负载均衡器和一台Web服务器后，我们成功解决了网络层的故障转移问题，提升了网络层的可用性

对外不再暴露web服务器,只暴露负载均衡器

为了提高安全性，服务器之间的通信使用私有IP地址。

私有IP地址只可以被同一个网络中的服务器访问，在公网中是无法访问的。

负载均衡器和Web服务器之间使用私有IP地址来通信。

数据库复制-主从数据库架构

概念

在很多数据库管理系统中，通常都可以利用原始数据库（Master，主库）和拷贝数据库（Slave，从库）之间的主从关系进行数据库复制

构成

主库

主库通常只支持写操作。

所有修改数据的指令，如插入、删除或更新等，都必须发送给主库来执行。

从库

从库保存主库的数据副本且仅支持读操作

优点

性能更好

可靠性高

可用性高

解决的问题

数据库宕机后可以更块的提供服务

数据库初期读写请求数据量差异较大时的性能瓶颈

从库宕机

从其他从库提供服务

没有从库,暂时将读写请求都迁移到主库

主库宕机

会有一个从库推选为新的主库

产生的问题

在生产环境中，因为从库的数据不一定是最新的，所以推选一个新的主库会更麻烦。缺失的数据需要通过运行数据恢复脚本来补全。

缓存优化

缓存

概念

缓存是临时的存储空间，用于存储一些很耗时的响应结果或者内存中经常被访问的数据，这样后续再访问这些数据时能更快

目的

提升数据反馈效率

作用

提高系统性能，减轻数据库的工作负载以及能够单独扩展缓存层

使用缓存后的访问过程

缓存读

当收到一个请求时，Web服务器首先检查缓存中是否有可用的数据：如果有，Web服务器就直接将数据返回给客户端；如果没有，就去查询数据库并把返回的响应存储在缓存中，再将其返回给Web服务器

缓存使用注意事项

什么时候使用缓存

如果对数据的读操作很频繁，而修改却不频繁，则可考虑使用缓存。因为被缓存的数据是存储在易变的内存中的，所以缓存服务器不是持久化数据的理想位置。

过期决策

执行过期策略是好的做法。一旦缓存中的数据过期，就应该将其从缓存中清除。如果不设置过期策略，缓存中的数据会一直被保存在内存中。

一致性

这关系到数据存储和缓存的同步。当对数据的修改在数据存储和缓存中不是通过同一个事务来操作的时候，就会发生不一致。

减轻出错的影响

单缓存服务器是系统中的一个潜在单点故障

驱逐策略

一旦缓存已满，任何对缓存添加条目的请求都有可能导致已有条目被删除，这叫作缓存驱逐。

不同的驱逐策略

LRU