运维工作
2023-03-28 09:01:09 1 举报
AI智能生成
登录查看完整内容
定期巡检、专家巡检、调整优化、故障排除、补丁升级、
作者其他创作
大纲/内容
运维工作
虚拟主机XX台
虚拟主机运行监控
指标:Cpu利用率小于85%,运行队列小于CPU个数的4倍,阻塞队列小于运行队列,交换队列为0
top
cat /proc/loadavg
系统负载
指标:使用率低于90%,页面调出不持续增加,不存在页面扫描活动
free -h
内存使用
lsblk
可用容量>20%
df -h
磁盘空间
性能分析
开启日志、告知查看方法systemctl status rsyslog Active: active (running)代表启动,非running为未启动
登陆情况检查 last
登陆失败检查 lastb
安全日志检查 cat /var/log/secure.log | egrep 'failed | Invalid | disabled | not | warning | err'
启动日志检查 cat /var/log/boot.log | egrep 'failed | Invalid | disabled | not | warning | err'
系统日志检查 cat /var/log/messages | egrep 'failed | Invalid | disabled | not | warning | err'
硬件日志检查 dmesg | egrep 'failed | Invalid | disabled | not | warning | err'
日志检查
设备日志检查
定期巡检
登录测试 使用远程连接工具登录
主机型号巡检 dmidecode | grep \"Product Name\"
CPU数量巡检: ###CPU个数cat /proc/cpuinfo | grep 'physical id' | sort | uniq | wc -l###cpu核数cat /proc/cpuinfo | grep 'process' | sort | uniq | wc -l
CPU主频巡检cat /proc/cpuinfo |grep MHz|uniq
内存测量free -h
硬盘数量、容量测量###数量fdisk -l | grep \"Disk /dev/*\"
网卡状态ip addr
网卡功能巡检
主机名称hostname
查看网关 route -n
ping网关
网络连接状态
date
检查主机系统时间
Asia/Shanghai
cat /etc/timezone
检查主机系统时间时区
检查操作系统版本号cat /etc/*-release | grep NAME
巡检内容
巡检人员1次/季度
专家巡检
明确优化内容
操作系统配置优化
性能调优
cd /var/log目录下 查看是否有超过一年未清理的日志,eg:yum.log-20200512
系统日志清理
find / -name '*.deb'
是否有类似安装之后不使用的安装包 eg:/home/uos/audit/auditd_1%253a2.8.4.1-1+eagle_arm64.deb 这种
系统安装包清理
明确垃圾数据目录
sudo apt-get autoclean
清理旧版本的软件缓存
sudo apt-get clean
清理所有软件缓存
垃圾清理
垃圾数据清理
调整优化()
基本故障
特殊故障(支撑)
重大故障填报工单
所有故障EXCEL留存
记录
故障排除
统信安全应急响应中心(https://src.uniontech.com/index.php?m=&c=page&a=index)
国家信息安全漏洞共享平台(https://www.cnvd.org.cn/patchInfo/list)
国家信息安全漏洞库(http://www.cnnvd.org.cn/web/vulnerability/querylist.tag?isArea=0&repairLd=)
uname -a 查看系统内核版本
每季度,需出季度安全报告,与开发协商补丁升级时间
补丁升级
虚拟主机安全组防护
安全加固内容检查
安全加固
资产管理
配置管理
操作系统
gpstate gpstate -f
实例监控
主从监控
KADB数据库
ps -ef | grep mysql
netstat -nltp | grep mysql
端口
MySQL数据库
ps -ef | grep oracle
su - oraclelsnrctl status
监听
sqlplus / as sysdba
连接监控
Oracle数据库
ps -ef | grep kingbase | grep -w \"D\" | awk 'NR==1'
netstat -nltp | grep kingbase | grep -w \"tcp\"
单机
/cluster/kdb_cluster_poc/db/bin$ ksql -USYSTEM -p9999 -dTEST -W123456 -c \"show pool_nodes;\"
集群主备切换监控tail -f /home/kingbase/cluster/cluster/log/recovery.logtail -f /home/kingbase/cluster/cluster/log/cluster_restart.log
集群
kingbase
运行监控
实例状况、服务进程###检查数据库实例服务的状态select status from v$instance;
kingbase集群###查看集群是否有错误日志cat cluster.log | grep errorcat $KINGBASE_DATA/sys_log
KADBcat $MASTER_DATA_DIRECTORY/pg_log下的日志,筛选有哪些错误日志eg:cat gpdb-2021-12-17_000000.csv | grep error
MySQLcat /etc/my.cnf | grep .log查看里边的日志文件,查看是否有错误日志eg:cat /usr/local/mysql/logs/error.log | grep error
Oraclesu - oraclecd $ORACLE_BASE/diag/rdbms/smsdb/smsdb/tracecat alert_smsdb.log | grep error
数据库日志
错误日志
把数据目录添加到zabbix监控
数据库所用空间需>20%
数据库备份文件、备份日志情况
数据库巡检
实例状况、服务进程ps -ef|grep tomcat
错误日志查看tomcat目录logs下的日志
tomcat
实例状况、服务进程ps -ef|grep apusic
程序产生的日志位于applications同级目录下的logs目录domains\\mydomain\\logs
中间件三个帐号密码
apusic
实例状况、服务进程ps -ef|grep nginx
access.log日志大小,是否自动切割
error.log查看
查看Nginx并发进程数ps -ef | grep nginx | wc -l
nginx
实例状况、服务进程ps -ef|grep redis
redis
中间件
巡检指标
license过期时间
数据库
根据访问IP统计UV
查询访问最频繁的IP(前10)
查看某一时间段的IP访问量(1-8点)
查看访问100次以上的IP
查看指定ip访问过的url和访问次数
根据访问URL统计PV
查询访问最频繁的URL(前10)
查看访问最频的URL([排除/api/appid])(前10)
查看页面访问次数超过100次的页面
查看最近1000条记录,访问量最高的页面
查找指定时间段的日志
列出传输时间超过 0.6 秒的url,显示前10条
列出/api/appid请求时间超过0.6秒的时间点
获取前10条最耗时的请求时间、url、耗时
中间件性能
数据库性能
专家巡检
配置优化
数据库
调整优化
http://nginx.org/en/security_advisories.html
备份检查
数据库备份
恢复测试
数据库恢复
数据备份和恢复
五证合一
数据迁移
数据库、中间件
系统登录日志
系统操作日志
日志检查分析
解答使用问题
指导用户操作
帐号、权限的创建、分配、 调整
使用支持—— 一般支持
数据查询
统计、修改、校正
使用支持—— 数据查询
应用系统需求响应、分析整理
反馈和确认
整理软件需求清单
需求管理
脚本
制定和改进备份策略和方案
备份可用性测试
上传附件等
备份数据恢复
系统备份和恢复
系统迁移
应用
信创环境
0 条评论
回复 删除
下一页