资深k8s工程师,深入解读OpenAI宕机事故真相,以及应对策略
太平洋时间2024年12月11日,OpenAI发生了严重故障,主要原因是其Kubernetes集群控制平面崩溃。对于外行人来说,可能只是看看热闹,但作为内行,我从技术角度来分析一下这个故障。
我在看完事故报告时候,产生3个疑问?
- Telemetry服务是做什么的?
- 大量的API请求(expensive requests )是什么请求?为什么这个程序会导致大量的资源敏感API请求?
- 为什么会影响业务系统?
太平洋时间2024年12月11日,OpenAI发生了严重故障,主要原因是其Kubernetes集群控制平面崩溃。对于外行人来说,可能只是看看热闹,但作为内行,我从技术角度来分析一下这个故障。
我在看完事故报告时候,产生3个疑问?
不打工之后,突然发现原来世界上还有这么多条路子,视野变广了。以前从来不关注打工之外赚钱的路子,甚至有点看不起。而现在看到什么东西,第一反应是:
换个思路,瞬间都是希望。
今年 35 ,3 月份被裁,艰难的一年,也许人生转折的一年,自己勇敢往前迈出的一步,想看看自己是不是能够独立生存。目前一直在努力却没有成效,只能走一步算一步。
困难的时间总是煎熬的,做好很长一段时间没有收入心理准备,从自己擅长的事情做起。
如果你有些东西很想做,趁年轻赶紧做吧。
马上到了2025年了,回顾自己年初的定的计划,一句话总结”完成度50%,重要的计划被放弃,人生180度大转弯“。
这篇文章是亲人在医院治疗的时候写的,一个自己理性的思考,灵魂的拷问。
当亲人患有现在医学无法解决的病时,我们会面临一个艰难的抉择:治疗能延续生命,但是治疗也会带来更多的痛苦和折磨。我们的好意是否有可能变成了一种“好心做坏事”呢?
看到在读本科计算机的v友,发贴问”今年计算机专业还值得选“?这里谈谈我的看法。
先说明计算机不等于互联网,但很多人提到“计算机”,其实指的是互联网。下面聊的都是互联网。
最近我加入了一个专门为B站UP主设置的沟通反馈群,里面B站的运营人员分享了很多干货教程。这些教程质量确实很高,内容总结得非常到位。不过,B站给UP主的这些建议,更多是从运营的角度出发,分析“好视频”的特点,偏向于利他视角。
相比之下,在《绝非偶然:撬动星球的头部效应》这本书(知识星球出品)里的大部分星主,做公众号内容时往往是从利己出发的。他们分享自己的知识和感悟,从而获得粉丝。