云平台运维专家
2-4万元/月
更新 2025-12-15 03:25:06
浏览 820
职位详情
运维工程师
5-10年
1.运维架构设计与持续优化:主导云平台运维组织架构、工具链路及运营机制的规划与实施,保障云环境及其公共组件的高可用性与稳定性。
2.平台统一与工具集成:为解决资源管理因入口分散带来的问题,推进统一运维操作平台的应用,整合多类运维工具,提供标准化操作指引,提升管理效率与一致性。
3.权限控制与资源配置:完善账号权限体系,实施精细化管理策略,强化资源使用水位监控与配额管理,实现访问隔离和资源高效分配。
4.监控告警系统建设:针对现有监控覆盖不足的情况,推动产品与资源全链路监控能力落地,及时识别并预警潜在风险,降低故障发生率及影响范围。
5.标准化流程与知识沉淀:总结常见问题处理流程与基础技术文档,逐步构建系统化知识库,提高团队协作效率与问题响应速度。
6.稳定性技术改进项目:联合产研、SRE及业务团队,推进高可用架构解决方案的落地实施,持续提供技术支持与优化建议。
任职要求:
1、具备5年以上IT、互联网或云计算领域运维经验,持有阿里云ACP/ACE认证者优先,有海外工作背景者优先考虑。
2、能在多产品线或中等复杂系统环境下严格执行研发安全规范与流程,确保系统具备容灾、可观测、可处置、易运维、快速恢复的能力。
3、熟悉行业主流研发安全技术体系,并具备在团队中成功推行落地的经验,有效提升系统稳定性和安全性者优先。
4、具备跨产品、中型复杂系统的安全生产实践经历,能应对复杂项目场景和突发状况,保障项目稳定交付。
5、面对部门级疑难问题,能够提出创新性解决方案与技术思路。
6、认同智能运维与自动化理念,主导过自动化运维平台建设,实现降本增效与系统稳定性提升。
7、通过数字化手段识别运营与人员管理中的潜在风险,建立完整风险管理机制并推动执行。
2.平台统一与工具集成:为解决资源管理因入口分散带来的问题,推进统一运维操作平台的应用,整合多类运维工具,提供标准化操作指引,提升管理效率与一致性。
3.权限控制与资源配置:完善账号权限体系,实施精细化管理策略,强化资源使用水位监控与配额管理,实现访问隔离和资源高效分配。
4.监控告警系统建设:针对现有监控覆盖不足的情况,推动产品与资源全链路监控能力落地,及时识别并预警潜在风险,降低故障发生率及影响范围。
5.标准化流程与知识沉淀:总结常见问题处理流程与基础技术文档,逐步构建系统化知识库,提高团队协作效率与问题响应速度。
6.稳定性技术改进项目:联合产研、SRE及业务团队,推进高可用架构解决方案的落地实施,持续提供技术支持与优化建议。
任职要求:
1、具备5年以上IT、互联网或云计算领域运维经验,持有阿里云ACP/ACE认证者优先,有海外工作背景者优先考虑。
2、能在多产品线或中等复杂系统环境下严格执行研发安全规范与流程,确保系统具备容灾、可观测、可处置、易运维、快速恢复的能力。
3、熟悉行业主流研发安全技术体系,并具备在团队中成功推行落地的经验,有效提升系统稳定性和安全性者优先。
4、具备跨产品、中型复杂系统的安全生产实践经历,能应对复杂项目场景和突发状况,保障项目稳定交付。
5、面对部门级疑难问题,能够提出创新性解决方案与技术思路。
6、认同智能运维与自动化理念,主导过自动化运维平台建设,实现降本增效与系统稳定性提升。
7、通过数字化手段识别运营与人员管理中的潜在风险,建立完整风险管理机制并推动执行。
相似职位
很抱歉,暂无相似职位!