第七章-FMEA
2021-01-11 11:50:11 2 举报
AI智能生成
FMEA
作者其他创作
大纲/内容
FMEA概念
对系统潜在故障进行分析,按严重程度分类,确定失效对系统的最终影响。
简单地说:就是设计出一套架构后,使用FMEA进行分析,看是否存在可用性隐患。
FMEA方法
1.给出初始架构设计图。
2.假设架构中某个部件发生故障。
3.分析故障对系统功能造成的影响。
4.根据分析结果,判断架构是否需要优化。
FMEA分析表
1.功能点:从用户角度,不是系统各个模块功能点划分来看的
2.故障模式:包括故障点和故障形式。描述尽量精确,多使用量化描述避免使用泛化描述。
3.故障影响:常见影响包括:功能点偶尔不可用、功能点完全不可用、部分用户功能点不可用、功能点响应缓慢、功能点出错、等。
4.严重程度:业务角度,影响程度一般分为“致命/高/中/低/无”;严重程度 = 功能点重要程度 × 故障影响范围 × 功能点受损程度。
致命:超过70%用户无法登录;
高:超过30%用户无法登录;
中:所有用户登陆时间超过5s;
低:10%用户登陆时间超过5s;
中:所有用户都无法修改资料;
低:20%的用户无法修改头像。
5.故障原因
不同故障原因发生概率不相同;例如导致MySQL查询响应慢的原因可能是bug,也可能是没有索引,但bug概率远远小于没有索引。
不同的故障原因检测手段不一样;例如磁盘坏道可能导致MySQL响应慢,慢查询也可能导致MySQL慢
不同的故障原因的处理措施不一样;Bug导致MySQL慢,应对措施是升级版本,没有索引导致慢,应对措施是增加索引。
6.故障概率:故障原因发生的概率,一般分为“高/中/低”三档。
硬件:随着时间的推移,故障概率会越来越高。
开源系统:成熟的bug率低,刚发布的开源系统bug率高,有经验的开源系统bug率低,刚使用的开源系统bug率高。
自研系统:成熟的故障率低,新开发的故障率高。
7.风险程度:判断某个故障的最终等级;风险程度 = 严重程度 × 故障概率。
8.已有措施:针对具体故障原因,提供某些措施来应对,包括检测告警(人工干预)、容错(系统通过备份手段应对)、自恢复(系统能够自己恢复)等。
9.规避措施:技术手段亦或管理手段。
避免数据丢失,设置冗余;
避免单线路故障,开通多家运营商线路;
降低磁盘坏道概率,强制2年定期更换;
降低疑难bug出现,每周定期重启。
10.解决措施:通常是技术手段。
解决密码暴力破解,增加密码重试次数限制;
解决拖库导致的数据泄露,将数据库中的敏感数据加密保存;
解决非法访问,增加白名单控制。
11.后续规划:缺乏的应对措施,不足,给出后续改进计划。可以是技术手段亦可是管理手段;可以是规避措施亦可是解决措施。同时考虑资源投入情况,优先解决高风险隐患。
本章小结
FMEA是一种在各行业广泛应用的可用性分析方法,通过对系统范围内潜在的故障模式
加以分析,并按照严重程度进行分类,确定失效对系统的最终影响。
加以分析,并按照严重程度进行分类,确定失效对系统的最终影响。
FMEA分析方法很简单,就是一个FMEA分析表。
FMEA中的“功能点”是从用户角度看的,不是从系统各个模块功能点划分来看的。
FMEA中的“故障模式”的描述要尽量精确,多使用量化描述,避免使用泛化描述。
FMEA中的“严重程序”指站在业务角度,故障的影响程度一般分“致命/高/中/低/无”五个档次。
FMEA中不同的“故障原因”发生概率、检测手段和处理措施可能不同。
FMEA中的“风险程度”就是综合严重程度和故障概率来一起判断某个故障的最终等级。
FMEA中不一定所有问题都要解决,采取规避措施也可以。
0 条评论
下一页
为你推荐
查看更多