好资源和短想法
#系统设计
滴滴前几天出了一个非常大的故障,会看到非常多的文章试图去分析故障的原因。
在《从滴滴的故障我们能学到什么》一文中,提到的k8s升级,可能源自这篇滴滴公众号上的文章《滴滴弹性云基于 K8S 的调度实践》。
尽管如此,目前也并不能确定就是文章提及的原因,至少滴滴官方并没有说明。不过,把《从滴滴的故障我们能学到什么》一文中提到的一些思路作为系统设计的参考倒是不错:降低复杂度、尽量控制出错的范围、拥抱重启。
滴滴前几天出了一个非常大的故障,会看到非常多的文章试图去分析故障的原因。
在《从滴滴的故障我们能学到什么》一文中,提到的k8s升级,可能源自这篇滴滴公众号上的文章《滴滴弹性云基于 K8S 的调度实践》。
尽管如此,目前也并不能确定就是文章提及的原因,至少滴滴官方并没有说明。不过,把《从滴滴的故障我们能学到什么》一文中提到的一些思路作为系统设计的参考倒是不错:降低复杂度、尽量控制出错的范围、拥抱重启。