MES预警概述设计
2024-01-05 09:29:14 0 举报
AI智能生成
MES(Manufacturing Execution System,制造执行系统)预警概述设计是一个关键环节,旨在对生产过程中的潜在风险进行实时监测和预警,以提高生产效率和降低成本。该设计包括核心内容、文件类型以及修饰语,以确保预警系统满足特定需求和行业标准。在200个字以内,无法详细描述整个设计过程,但可提供核心设计理念及关键要素的简要概述。
作者其他创作
大纲/内容
计划预警主题
设备离线率
数据波动
产量正确性验证
排班数据写入
定义
云端:以mes 后台作为云端
监控项:以任意一个预警主题 作为监控项,举例:设备离线率监控的监控项就是设备离线率
阈值配置
事件规则
监控项是否启用
eventCode是什么
以什么规则告警,通过什么方式告警,告警给谁,告警后多久事件内不再告警
子主题 4
异常阈值
由业务定义
数据的偏差/最大值/最小值 的阈值,大于或者小于这个阈值 则作为一个异常
告警阈值
触发异常的设备占全工厂设备数的占比 阈值
触发异常的工厂占全系统工厂数的占比 阈值
触发异常的设备占全系统设备数的占比 阈值
巡检
将按照某一个预警主题进行检查的作业称之为巡检,计划中巡检的模式 是以工厂为单位,巡检后生成统计数据
巡检的阈值数据和基础数据会在前继处理步骤中进行获取
巡检的统计数据和异常阈值进行对比,如果超出异常阈值,则生成一个异常事件
一次巡检中的异常时间 会进行汇总,汇总后事件的统计数据大于 告警阈值 则生成一个告警事件
事件
事件的主体 可能以全系统、工厂、设备 作为主体,举例:LT01设备没有生成排班数据,则这是 一个异常事件,9001工厂 有超过20% 的设备没有生成排班数据,则这是一个 工厂的异常事件,如果系统有超过10% 的工厂没有排班数据,则这是一个系统 为主体的异常事件
事件域的属性包括:服务,业务类型,事件类型,主体类型,主体id,发生时间,上报时间,事件eventCode,影响范围,统计值
事件 会被传递给下一步程序进行统计和处理
事件分类
异常事件
巡检程序的数据,达到异常阈值时生成
告警事件
异常事件的统计数据,在达到告警阈值时生成
异常事件
异常事件:以业务规则定义,是将业务数据和异常阈值 进行比对 深长,比如业务定义某数据项偏差基准值多大范围 或者大于最大值或者小于最小值 则作为一个异常事件.参阅 [阈值配置]
告警事件
告警事件 以监控程序 规则定义,事件异常事件的 数据汇总和 告警阈值进行比对,当异常事件的数据统计值大于 告警阈值 就触发 一个告警事件
离线: 以设备上报离线数据 或者设备 多久时间不上报 数据 作为离线的判断依据
离线多久作为离线这个判断应该由业务方执行和落库
EVENT_CODE
事件类型的唯一编码,告警处理程序以 eventCode进行 告警事件和告警规则的匹配
设备离线率
离线判断:
设备上报离线数据
设备超时没有上报数据/数据未变化定义为离线
中控接入模式 如络筒
中控离线
连接到天工。网关离线,天工会发离线消息给gemi。gemi会补充所有子设备的离线信息
暂不考虑非天工的情况
设备离线
监听kafka消息
直接接入 如细纱
设备离线
监听kafka消息
以上步骤的判断 应该由业务方做出并落库.以保证业务方的判断规则变动对风控透明
数据输入
工厂的所有设备
设备的实时离线/在线 状态
设备离线 的监控项阈值规则
数据输出
工厂有效设备数
设备类型/工序
离线设备数
是否达到工厂级 的离线异常事件
数据波动
以工厂+班次 为单位生成基准数据
基准数据:
暂定 工厂日平均正常运作机台数,工厂平均每分钟产量,每天统计一次并落库到缓存
可以根据业务需要增加 吨纱能耗,转速,等
阈值数据:判断粒度可以比较大,一般以 基准值的3倍和1/3作为范围,超出这个范围作为异常
以工厂为单位,检查当前班次数据比对基准数据的相同班次的数据,如果和基准数据的偏离超出阈值,则生成一个异常事件
产量正确性验证
子主题 3
产量和 的稽核关系
工厂平均每分钟产量和
排班数据写入
设计规则
前继处理规则:获得基础数据和阈值数据
获得排班数据表-,一定要用于后继业务的最终的表,可以发现前面任何步骤出现的错误
以设备为单位,检查设备是否有排班数据
如果有,正常
如果无,检查工厂是否进行过排班
有排班过,记录为程序异常,记录为异常事件
工厂没有排班,作为 提醒事件,可选是否要提醒工厂排班
进行后继告警处理规则,生成告警事件
实现思路
执行步骤
统一配置规则
配置网址: https://dev-basic.szzhijing.com/#/home
事件预警规则
功能入口:运维监控->事件预警规则
配置 UAC告警统一程序 以什么
通知人员管理
功能入口:运维监控->通知人员管理
事件日志查询
统一 前继处理规则
描述:
以工厂为单位,可以灵活进行多线程检查,可以避免全量数据查询造成数据库压力
所有检查都可以先执行该前继步骤,来获得基础数据
获得工厂列表
以工厂为单位开始巡检
获得工厂工序类型
获得工厂下属的有效被启用的设备个数/车间数量/组数量
获得对于检查项的阈值配置
对于数据波动的检查,需要经过数据过滤后保存一份 正确数据作为 基准数据 并 保持每日更新
统一后继处理规则
汇总所有工厂的异常事件
按照异常事件触发工厂的工厂数量进行 和告警阈值的比对
按照 异常事件触发 的设备数量占比和告警阈值进行阈值比对
如果本次巡检 触发了告警事件,将告警消息和eventCode写入kafka
0 条评论
下一页