运维平台产品设计
2024-03-06 14:40:29 0 举报
AI智能生成
我们的运维平台产品设计了一个强大且用户友好的解决方案,旨在帮助运维团队高效地管理、监控和自动化运维任务。该平台基于最新的ITIL最佳实践,提供了全面的功能,包括事件管理、问题管理、变更管理、配置管理、发布管理以及服务级别管理。此外,该平台还具有高度可扩展性和可靠性,支持与各种监控工具、IT服务管理工具以及自动化工具集成。通过这个平台,运维团队可以降低运维成本,提高服务效率,确保业务连续性。
作者其他创作
大纲/内容
用户管理
角色管理
权限管理
审计管理
账号管理
服务名称
项目yaml配置
环境变量
ETCD配置
服务项目
华东阿里云
华北阿里云
国科机房
IDC信息
存储设备
交换机
防火墙
网络设备
物理机
云主机
虚拟机
主机
SSL证书
域名
CDN
MySQL
Redis
ES
OSS
弹性IP
NAS
...
云资源
docker镜像版本
镜像仓库
DUI华东集群
DUI华北集群
DUI国科集群
k8s集群
Ingress
Istio
configmap
HPA
Label
k8s对象
资产类型
批量导入
批量更新
批量导出
组合查询
过期提醒
定期自动更新
功能
资产管理(CMDB)
tag触发构建
手动触发构建
持续集成
代码质量评估
单元测试
压力测试
测试用例管理
测试覆盖率
测试报告
测试模块
开发环境
测试环境
beta环境
正式环境
环境区分
自动化,无需人工介入
业务方可以自助操作
要求
支持AB Testing、金丝雀、rolling update、蓝绿发布
支持快速回滚
支持发布锁,当某个发布任务正在进行时,不允许其他任务发布
所有操作记录到数据库
支持pipeline式的组合更新方式
服务发布
数据库更新
基于CMDB
部署模块
服务更新模块
脚本管理(增删改查)
脚本授权
批量执行脚本
发布定时任务
自动备份
机器自动/批量申请
运维作业平台
打通钉钉
数据统计分析
人工介入
上线审核
工单系统
查看监控项
配置告警项
对接监控系统
通过接口获取日志
日志下载
对接日志系统
jumpserver
跳板机
功能模块梳理
建设一站式的自动化运维平台,所有可以自动化的操作都需要沉淀到平台执行
自动化
目标
通过平台统一管理所有的运维对象,对业务组、运维所有的操作都标准化对hostname,ip,脚本,目录等运维对象制定标准规范,业务部门和运维部门遵循共同的标准,统一基于这个标准建设运维平台
标准化
原则1
实现所有项目的持续集成、部署,都可以由项目组自助完成,提高发布效率,减少故障率涉及到多部门协作,需要程序及文档固化,打造标准交付环境
规范化
原则2
完善的CMDB为所有运维自动化操作提供底层数据和配置支撑,形成完整闭环,驱动所有运维脚本、工具、任务正常执行
CMDB
原则3
所有操作尽量提供API
API
原则4
目标及原则
ELK 日志组件
ansible
jenkins
k8s
docker
prometheus监控
运维工具
腾讯蓝鲸 https://bk.tencent.com/product/#community
bigops运维平台 http://docs.bigops.com/
OpsManage https://github.com/welliamcao/OpsManage
CODO自动化运维平台 https://github.com/opendevops-cn/opendevops
开源项目
工具参考
SSH端口
iptables
各系统权限管控
所有操作记录
安全审计
文件命名规范
变量命名规范
存放目录规范
bash/python版本要求
脚本
网段划分
内外网IP设置规范
iptables配置
网关配置
掩码
网络
系统版本
内核版本
初始化安装
磁盘分区
账号密码
密钥
操作系统
nginx
java
mysql
redis
rsyslog
kafka
rabbitMQ
mongodb
nfs
kubernetes
logstash
supervisor
基础组件
标准化对象
运维平台
0 条评论
回复 删除
下一页