职位描述
岗位职责:
1、监控和处理生产环境服务突发故障,保障服务7x24稳定运行;
2、负责系统及应用的安全,网络安全,数据的日常备份和应急恢复;
3、开发、完善系统监控、报警、自动部署等内部工具;
4、规划和优化网站系统架构,提升系统服务性能和服务效率;
5、使用bash、Python编写系统运维所需的各种服务和工具脚本;
6、规范化、自动化并且文档化系统运维工作。
7、机房及IT硬件设备维护
岗位要求:
1、较强的学习能力和独立处理问题能力,能熟练阅读英文文档,对新技术有高度热情,善于钻研;
2、具有良好的团队协作精神, 工作责任心强;
3、三年或以上Linux使用经验,一年或以上Linux系统管理经验;
4、计算机/IT等相关专业本科以上学历。能熟练使用Bash shell,Python,Perl中的一种语言进行运维自动化工具开发;
5、熟悉Zabbix/Nagios/Ganglia/Cacti/Munin等常用监控工具,熟悉Nginx,Haproxy, MySQL, Tomcat, MongoDB, Redis, ActiveMQ, RabbitMQ等配置及优化;
6、熟悉机房运维优先