简历

  • 姓名:吴遵清
  • 性别:男
  • 出生日期:1989.04.07
  • 学历:大学本科
  • 专业:物理学(师范类)
  • 毕业院校:闽江学院 2007-2011
  • 联系方式: xiaoqingnb (at) gmail.com
  • 个人网站:https://midbai.com

5年kubernetes运维和开发工作,且有5年的运维生涯。熟悉kubernetes源码,operator开发。热爱开源,参与社区贡献,比如cilium、autoscaler(vpa)、karmada。热爱互联网,喜欢研究新技术,不断突破自己舒适区。

golang中级水平,目前求职方向云厂商kubernetes相关开发,有合适职位的可以联系。

  • 设计开发基于腾讯云弹性网卡的CNI插件,解决原网络插件基于节点分配子网,集群节点数量受限于子网大小。架构上基于operator和agent模式,节点上使用策略路由模式。

  • kubernetes集群降本–基于vpa算法进行资源推荐功能的开发,包括开发相关的operator,节省了15%的成本。

  • 实现真实负载感知的descheduler节点均衡插件,解决节点过热的问题,提升应用的稳定性。

  • 负责集群的运维工作,包括集群部署、稳定性优化、节点扩缩容、监控从thanos迁移到victoriaMetrics、报警处理等

负责从0开始落地k8s,包括集群搭建,协助业务迁移,平台功能设计

  • 前期进行容器使用现状调研(使用docker进行部署)、了解痛点(没有自动扩容和优雅发布功能)。遵循"研发只需关心应用的配置、应用状态和资源使用情况"的原则,进行架构和发布系统功能设计。

  • 进行集群搭建,包括自建kubernetes集群和公有云的托管kubernetes集群

  • 设计平台底层的k8s架构和迁移方案、让流量接入已有的非kubernete上的服务、并尽量减少对现有系统的改动。

  • 构建kubernetes生态周边系统,比如监控系统、流量接入。对接现有构建系统、日志系统、报警系统。

  • 上线后接入500个pod和20多个node,提升服务可用性, 从有损发布到平滑发布,快速扩缩容, 提高发布效率, 从平均半个小时,降低到2分钟。

负责直播业务相关的运维工作

  • 推动业务从物理机迁移到k8s集群中,解决迁移到后出现的性能问题(通过修改应用参数和开启CPUSet),让php程序在k8s中耗时从20毫秒降低到5ms左右
  • 排查和解决业务在线上的出现的各种问题(比如redis慢、nginx重试导致请求量放大)
  • 参与故障的排查与解决,并进行故障的复盘报告的编写、并追踪后续的优化

负责整个公司的运维工作

  • 服务器操作系统进行规范化和标准化。
  • 负责各个系统的搭建和运维和优化,比如nginx、redis、发布系统、ELK。
  • 设计并实现gitlab ci +docker测试环境的持续部署,提升运维自动化。
  • 对服务器进行整顿,并进行运维的标准化工作。
  • 负责版本上线发布,变更,故障解决,问题发现。
  • 编写脚本,解决日常需要,备份数据库等。