运维部Q4
2016-11-01 13:39:08 0 举报
AI智能生成
在即将迈入第四季度的关键时刻,运维部门正全力准备应对挑战。为了确保系统稳定、高效运行,我们已提前进行了一系列优化升级工作,包括硬件设备的检查维护、软件系统的更新迭代以及安全防护措施的加固。同时,我们还加强了团队内部的沟通协作,提高了应急响应速度和处理问题的能力。在接下来的Q4季度,运维部门将紧密围绕公司的业务需求,全力以赴保障各项业务的顺利推进,为客户提供优质的服务体验。让我们携手共进,迎接充满挑战与机遇的Q4季度!
作者其他创作
大纲/内容
新方向
预算
人员
资产
openresty高性能Web服务器使用
IAMRole和AWS_Key安全
流式传输上报日志到EMR
CMDB
域名管理系统
RI使用监控及管理系统
各业务线费用管理系统
各业务线预算管理系统
服务器资产管理系统
跳板机日志审计模块
成本优化
Autosacling全面落地(11月底-沈灿)
定时伸缩
3s_deliver
adn_net&adn_tracking
adn_setting
adserver
一阶段效果通报
极限定时伸缩
3s_deliver
adn_net&adn_tracking
adn_setting
adserver
二阶段效果通报
定时缩容,按需扩容
3s_deliver
adn_net&adn_tracking
adn_setting
adserver
三阶段效果通报
按需缩容,按需扩容
3s_deliver
adn_net&adn_tracking
adn_setting
adserver
项目总结,整体效果通报
深挖RI空间(12月初-沈灿)
整体EC2,Redshift等全面Review
确定购买方向
执行购买
效果通报
RI是否匹配,监控和检测方式
S3冷热数据优化(12月底-庆辉)
基于当前情况深挖优化点
调研取回费用突增的报警方式,及时止损
目标12月底S3费用通过冷数据节省1W$/月
第二阶段效果通报
AWS机型优化
adnnet&adn_tracking&adn_setting机型优化为C4
dsp_ajump&smartclick_cache机型优化为R4
业务运维&稳定性
单点问题
MongoDB主库(12月-冯瑶)
加入新mongo3.2主库双写
切换一半mongoslave到新3.2主库
高可用方案
ADN ETL服务(12月-劲斌)
ADN CDN源站(12月-冯瑶)
新静态文件迁移至S3
新旧静态文件源同时使用
旧静态资源全部至S3
切换S3为CDN的唯一静态源站
完成CDN源站高可用升级
ADN Portal_crontab(12月-劲斌)
爆量&单点处理预案
3s_tracking整体爆量预案
adn_net&adntracking爆量预案
adn_setting爆量预案
adn_mongoslave爆量预案
adserver爆量预案
DSP爆量预案
Smartclick&Cache爆量预案
adn_mongo主库&ETL&portal_crontab单点故障预案
监控报警&故障处理
子主题
子主题
3s Tracking架构改造升级(12月-庆辉)
RedisSlave集群与Deliver分离
Elastcache踢数据问题,一致性hash
ADN Memcache一致性哈希(12月-劲斌)
问题定位
测试PHP连接MC使用一致性Hash
adnnet&adntracking一致性Hash上线
adn_setting一致性Hash上线
Memcache集群分配以及数量调整到最优
运维效率优化
服务器自动启停工具(12月底-沈灿)
整体功能复盘
规范化复盘
清理无用资源(镜像,安全组,IAMrole)
功能优化,适配所有场景
效果通报
LDAP全面接入(12月中-龙水)
接入跳板机
接入Jira
接入CodeReview
接入其他相关系统
第二阶段效果通报
CloudWatch&Zabbix整合(11月底-沈灿)
展示集中整合至Grafana
全业务线CloudWatch重点监控展示和报警梳理
Zabbix重点监控展示梳理
Grafana权限管理,达到可推广至技术部按需访问
报警集中整合至Zabbix
效果通报
运维系统访问整合(11月底-沈灿)
运维相关内部系统统计
页面设计
访问导航页开发
推广&效果通报
运维资产管理系统一期(12月底-沈灿)
产品及功能设计文档
一期功能确定及各环节配合点确认
项目计划与排期
测试&上线
运维部内部推广
功能改进
一期效果通报
Rundeck任务管理系统(12月底-庆辉)
0 条评论
下一页