-
专业资料分享
云平台下的运维体系建设工作内容
一、
系
统运维
系
统运维负责
IDC
、网络、
CDN
p>
和基础服务的建设(
LVS
、
NTP
、
DNS
)
;负责资产管理,服务器选型、交付和维修。详细的工作职责
如下:
p>
IDC
数据中心建设
收集业务需求,
预估未来数据中心的
发展规模,
从骨干网的分
布,数据中心建筑,以及
Internet
接入、网络攻击防御能力、扩容能
力、空间预留、
外接专线能力、现场服务支撑能力等方面评估选型数
据中心。负责数据中心的建设、现场维护工作。
精品文档
专业资料分享
网络建设
设计及规划生产网络架构,这里面包括:数据中心网络架构、
传输网架构、
CDN
网络架构等,以及网络调优等日常运维工作。
LVS
负载均衡和
SNAT
建设
LVS
是整个站点架构中的流量入口,根据网络规模和业务需
求,
构建负载均衡集群;
完成网络与业务服务器的衔接,
提供高性能、
高可用的负载调度能力,以及统一的网络层防攻击
能力;
SNAT
集中提供数据中心的公
网访问服务,通过集群化部署,
保证出网服务的高性能与高可用。
CDN
规划和建设
CDN
工作划分为第三方和自建两部
分。
建立第三方
CDN
的选
型和调度控制;根据业务发展趋势,规划
CDN
新
节点建设布局;完
善
CDN
业务及监控
,保障
CDN
系统稳定、高效运行;分析业务加
速频道的文件特性和数量,
制定最优的加速策略和资源匹配;
< br>负责用
户劫持等
CDN
日常故障
排查工作。
服务器选型、交付和维护
负责服务器的测试选型,
包含服务器整机、
部件
的基础性测试
精品文档
专业资料分享
和业务测试,降低整机功率,提升
机架部署密度等。结合对公司业务
的了解,推广新硬件、新方案减少业务的服务器投入规
模。负责服务
器硬件故障的诊断定位,
服务器硬件监控、
健康检查工具的开发和维
护。
OS
、内核选型和
< br>OS
相关维护工作
责整体平台的
OS
选型、定制和内核优化,以及
Patch
的更新
和内部版本发布;建
立基础的
YUM
包管理和分发中心,提供常用包
版本库;跟进日常各类
OS
相关故障;针对不同的业务
类型,提供定
向的优化支持。
资产管理
记录和管理运维相关的基础
物理信息,包括数据中心、网络、机
柜、服务器、
ACL
、
IP
等各种资源信息,制定有效的流程,确
保信息
的准确性;开放
API
接口,为
自动化运维提供数据支持。
基础服务建设
业务对
DNS
、
NTP
、
SYSLOG
等基础服务的依赖非常高,需
p>
要设计高可用架构避免单点,提供稳定的基础服务。
精品文档
专业资料分享
二、
应
用运维
应
用运维负责线上服务的变更、服务状态监控、服务容灾和数据
备份等工作,对服务进行例
行排查、故障应急处理等工作。详细的工
作职责如下所述。
设计评审
在产品研发阶段,参与产品
设计评审,从运维的角度提出评审意
见,使服务满足运维准入的高可用要求。
服务管理
负责制定线
上业务升级变更及回滚方案,并进行变更实施。掌握
所负责的服务及服务间关联关系、<
/p>
服务依赖的各种资源。
能够发现服
务上的
缺陷,
及时通报并推进解决。
制定服务稳定性指标及准入标准,
同时不断完善和优化程序和系统的功能、效率,提高运行质量。完善
监控内容,
提高报警准确度。
在线上服务出现故障时,
p>
第一时间响应,
对已知线上故障能按流程进行通报并按预案执行,<
/p>
未知故障组织相关
人员联合排障。
资源管理
对各服务的服务器资产进行
管理,梳理服务器资源状况、数据中
心分布情况、网络专线及带宽情况,能够合理使用服
务器资源,根据
不同服务的需求,
分配不同配置的服务器,
p>
确保服务器资源的充分利
精品文档
专业资料分享
用。
例行检查
制定服务例行排查点,并不
断完善。根据制定的服务排查点,对
服务进行定期检查。对排查过程中发现的问题,及时
进行追查,排除
可能存在的隐患。
预案管理
确定服务所需的各项监控、
系统指标的阈值或临界点,以及出现
该情况后的处理预案。
建立
和更新服务预案文档,
并根据日常故障情
况不断补充完善,提高
预案完备性。能够制定和评审各类预案,周期
性进行预案演练,确保预案的可执行性。<
/p>
数据备份
制
定数据备份策略,按规范进行数据备份工作。保证数据备份的
可用性和完整性,定期开展
数据恢复性测试。
三、
数
据库运维
数据库运维负责数据存储方案设计、数据库表设计、索引设计和
SQL
< br>优化,对数据库进行变更、监控、备份、高可用设计等工作。详
细的工作职责如下
所述。
精品文档
-
-
-
-
-
-
-
-
-
上一篇:中国铜牌号及实用标准与国外对照表
下一篇:工作机构