资深k8s工程师,深入解读OpenAI宕机事故真相,以及应对策略

太平洋时间2024年12月11日,OpenAI发生了严重故障,主要原因是其Kubernetes集群控制平面崩溃。对于外行人来说,可能只是看看热闹,但作为内行,我从技术角度来分析一下这个故障。

我在看完事故报告时候,产生3个疑问?

  • Telemetry服务是做什么的?
  • 大量的API请求(expensive requests )是什么请求?为什么这个程序会导致大量的资源敏感API请求?
  • 为什么会影响业务系统?

不打工后路子变多了,总结最近我见到的赚钱路子

不打工之后,突然发现原来世界上还有这么多条路子,视野变广了。以前从来不关注打工之外赚钱的路子,甚至有点看不起。而现在看到什么东西,第一反应是:

  • 这个东西是怎么赚钱的?
  • 有啥门槛?
  • 体量多大?
  • 这条路做好了,是不是也能赚很多钱?

换个思路,瞬间都是希望。

2024年终总结,我放弃了苦苦研究5年的技术

今年 35 ,3 月份被裁,艰难的一年,也许人生转折的一年,自己勇敢往前迈出的一步,想看看自己是不是能够独立生存。目前一直在努力却没有成效,只能走一步算一步。

困难的时间总是煎熬的,做好很长一段时间没有收入心理准备,从自己擅长的事情做起。

如果你有些东西很想做,趁年轻赶紧做吧

马上到了2025年了,回顾自己年初的定的计划,一句话总结”完成度50%,重要的计划被放弃,人生180度大转弯“。

绝症面前是延续生命,还是减少痛苦?亲情下的两难选择

这篇文章是亲人在医院治疗的时候写的,一个自己理性的思考,灵魂的拷问。

当亲人患有现在医学无法解决的病时,我们会面临一个艰难的抉择:治疗能延续生命,但是治疗也会带来更多的痛苦和折磨。我们的好意是否有可能变成了一种“好心做坏事”呢?

先利己再利他,寻求利己与利他的结合点

最近我加入了一个专门为B站UP主设置的沟通反馈群,里面B站的运营人员分享了很多干货教程。这些教程质量确实很高,内容总结得非常到位。不过,B站给UP主的这些建议,更多是从运营的角度出发,分析“好视频”的特点,偏向于利他视角。

相比之下,在《绝非偶然:撬动星球的头部效应》这本书(知识星球出品)里的大部分星主,做公众号内容时往往是从利己出发的。他们分享自己的知识和感悟,从而获得粉丝。