AHAS
2022-06-19 23:58:39   1  举报             
     
         
 AI智能生成
  AHAS 学习
    作者其他创作
 大纲/内容
  定义    
     业界首款专注于应用高可用能力的SaaS产品,提供应用架构自动探测,故障注入式高可用能力评测和一键应用限流降级等功能,可以让用户快速低成本的提升应用可用性;  
     使用场景    
     应用生命周期管理  
     各种应用场景对于高可用的需求  
     流量洪峰  
     API 精准流量控制  
     削峰填谷  
     慢启动  
     适用场景    
     新系统新架构上线  
     分布式系统依赖治理  
     业务连续性  
     故障修复验证  
     接入方式    
     java    
     Agent接入  
     SDK接入  
     K8s 接入  
     SAE 接入  
     网关防护    
     防护手段    
     入口流量控制  
     热点隔离  
     对依赖方隔离或降级  
     系统防护  
     主要功能    
     针对路由配置中的某个路由进行流量控制  
     自定义一组API 进行流量控制  
     针对请求的客户端IP,Header或者URL 参数进行流控  
     限制某个API 的调用频率,支持秒,分钟,小时,天等多个维度  
     接入方式    
     容器服务Kubernetes应用  
     Spring Cloud GateWay应用  
     Spring Cloud Zuul 应用  
     通过Agent 接入  
     接入Nginx  
     系统保护阈值    
     Load  
     CPU使用率  
     RT  
     线程数  
     入口QPS  
     功能    
     架构感知    
     概念    
     自动感知应用的拓扑结构  
     以可视化的方式直观呈现应用对基础架构的依赖关系和组件间的依赖关系  
     持续记录上述依赖关系  
     第三方组件与云服务识别  
     Kubernetes 集群感知  
     工作流程    
     数据采集  
     关系构建
  
     特征识别
  
     架构可视化  
     可接入资源    
     普通Linux主机  
     云服务器ECS  
     容器服务K8s  
     需访问资源    
     负载均衡SLB  
     专有网络VPC  
     云服务器ECS  
     故障演练    
     AHAS 的故障演练功能承担着问题发现,问题验证,高可用经验沉淀的作用  
     支持场景    
     常见的基础设施资源故障  
     应用级别的故障注入  
     云原生领域的演练场景  
     功能    
     衡量微服务的容错能力  
     验证容器编排配置是否合理  
     测试PaaS 层是否健壮  
     验证监控告警的时效性  
     定位与解决问题的应急能力  
     流程    
     阿里云界面    
     创建演练  
     演练配置  
     执行演练  
     停止演练  
     主体    
     计划  
     执行
  
     观察  
     记录
  
     还原  
     分析  
     爆炸半径影响范围
    
     故障注入  
     流量路由  
     数据隔离  
     流控降级    
     接入方式    
     SDK  
     Agent  
     流量控制    
     限流方式    
     直接模式(按调用方限流)  
     关联模式(关联资源限流)  
     链路模式(调用链路限流)  
     实现方式    
     运行指标    
     QPS  
     并发线程数  
     资源的调用关系    
     资源的调用链路  
     资源和资源之间的关系  
     调用来源等  
     控制效果    
     直接拒绝    
     资源隔离    
     隔离规则通过控制接口或依赖的并发线程数,来保证系统的稳定性  
     快速失败    
     熔断降级
    
     熔断降级会在调用链路中某个资源出现不稳定状态时,对这个资源的调用进行限制,让请求快速失败,避免影响到其他的资源而导致级联错误  
     策略    
     秒级RT模式  
     秒级异常比例模式  
     分钟级异常数模式  
     Warm UP (预热)    
     Warm UP 当流量突然增大的时候,希望系统从空闲状态到繁忙状态的切换的时间长一些,即如果系统在此之前长期处于空闲的状态,希望处理请求的速率缓慢增加,经过预期的时间以后,到达系统处理请求速率的设定值;  
     默认会从配置QPS闽值的1/3开始慢慢往上增加QPS  
     排队等待  
     功能开关  
     对应开源    
     ChaosBlade    
     https://chaosblade.io/zh/docs/  
    
 
 
 
 
  0 条评论
 下一页