阿里云相信好多程序员网友都不陌生,就我本人而言,也与阿里云有着深刻的交情,我经历的几个公司都在用,我也对上面的一些产品比较满意,给我的感觉是安全,可靠。就在昨天一名网友爆料阿里云挂了长达两个小时左右。
图片来之互联网
这名网友说最初发现是阿里云函数计算挂了,导致线上故障,打算马上降级到本地运算,结果阿里云的Kubernetes也挂了,想着挨个机器手工改一下,发现OSS也挂了,照这么说这么多故障,阿里云监控的强大预警机制不应该不提示呀,原来SLS也挂了,这是几连挂呀,怎么挂的如此彻底,到底发生了些什么?这名网友也没说具体什么原因导致。
图片来之互联网
这样的事情肯定是程序员们所关心的话题,那么就针对这一事情,看看程序员网友们都是什么观点吧
网友一:今年绩效出大问题咯 (那不好说,得看是什么原因造成的了,不过从现象来看,运维同学的确有一定的责任,因为是比较大面积的故障)
网友二:不是号称很安全嘛?容灾,负载均衡,遍布各地的数据中心节点?(的确是挺安全的,这也不算是常见现象啊,谁都有可能有大喘气的时候,阿里也不例外嘛)
网友三:三连挂,关键时候掉链子!(链子是掉了一会,不过相信还会装好的)
网友四:鸡蛋别一个篮子里面放。(这点,我想阿里的运维同学都知道,他们架构也不可能会出现单点故障)
网友五:先杀一个程序员祭天 (老哥,别到处都黑程序员好不好,这又不是程序员的代码造成的故障,淡定一下)
网友六:所以这就是为什么早上好多公司的网站挂了的原因是不是 (我已经很久没关注阿里云了,你公司受影响了,没事,很快就会好的,相信阿里的技术!)
网友七:是不是没算卦啊?(哎,一个充满神秘彩色的程序员!)
这次从评论区我发现了一个奇怪的现象,那就是阿里的员工出现的很少,不像以前那么积极了,呵呵,可能他们觉得也没啥要说的吧,毕竟也不是什么光彩的事情,好吧,谁都会有犯错的时候啦!
针对这个事情,我就说一下我的个人看法,首先针对目前这些信息量,我还得不出什么结论,不过我有一个好奇,阿里云有成千上万台机器设备,都是分布式部署,怎么那么多设施同时出现故障,这也是我首次看到的现象,具体什么原因我是想不到了,就看看有没有其他网友能够揭晓答案,我也以一颗吃瓜群众的心态坐等真相,不过这么大,持续这么久的一次故障,我想绝非是一个简单的低级错误造成的,背后肯定有着复杂的原因,虽然是有故障了,但是我依然相信阿里云是比较靠谱的,因为我已经有使用阿里云多年经验,他上面的好多东西我都有用过,比如 OSS,RDS,ECS,SLB,CDN等等,给我的感觉都是不错的,如果有一些技术问题,提交工单都能及时回应,总之我相信像这次的故障也不会经常发生就是了!
大家好,我是“上世是朵花”。如果你有什么好的看法或者观点可以在评论区展现你的才华,互动交流,如果想进一步了解我,那就关注我吧!