淘宝回应崩了 系机房网络波动引发服务异常

tmyb
广告

大促前的小插曲刷屏全网

2024年10月11日下午那场淘宝宕机,估计不少人现在想起来还有印象,我当时正蹲点抢家里猫常吃的冻干粮预售——那款粮每月11号有限时优惠,比日常便宜五十多,我定了两点半的闹钟准点进去,结果对着转圈圈的空白首页愣了半分钟:刚换的5G套餐又出问题?还是昨天摔了手机把硬件摔坏了?切wifi、重启APP折腾了五分钟还是不行,刷了微博才发现,原来全中国千万用户都和我一样,“淘宝崩了”已经稳稳挂在了热搜第一。

我闺蜜林琳那天的遭遇,更能说明这场小故障对普通人的影响有多大,她妈妈下个月要做腰椎手术,提前对比了十多家店,选中淘宝一家医疗器械店的术后护理腰垫、恒温擦身器和进口蛋白粉,商家说当天下午6点前下单,第二天顺丰就能送到,刚好赶得上住院用,林琳专门定了闹钟午休起来付款,结果打开淘宝全是空白,换网、卸载重装折腾了十多分钟还是不行,给我打语音的时候声音都抖了:“我晚一天下单,妈妈要用的东西到不了可怎么办?”

那天的热搜评论区里,各行各业的吐槽挤得满满当当:做淘宝女装的广州卖家阿凯是我认识的朋友,他当天下午投了一万块直通车推广新款秋装,就指着两点到四点的流量高峰冲销量,结果用户进不来店铺,一下午烧了六千块广告费一单没出,他在商家群里说,那一下午抽了两盒烟,本来还差一万块还房贷,就指着这次新款走货,结果全被打乱;有网友蹲了三个月的苹果促销,淘宝官旗当天放了一千台降价八百的名额,结果点进去就崩,恢复之后货早就没了,气得直呼离谱;还有人约好当天拍婚纱照付定金,付款页一直刷不出来,差点改了档期;当然也有调侃,说本来下午摸鱼逛淘宝,结果淘宝崩了只能老老实实干活,反而被老板表扬,全公司就我一个人认真工作,还要谢谢淘宝。

整场故障持续了不到四十分钟,从两点半左右出现异常,到三点十分左右全部恢复服务,但就是这不到一小时的中断,直接冲上了全网热搜第一,讨论量半天就破了两亿,足以见得淘宝作为国民购物平台,早就已经渗透到了每个人生活的细节里,一点点波动都会引发大面积的反应。

淘宝回应:一句“网络波动”能不能平息争议?

故障发生后,淘宝的响应速度其实不算慢,出问题二十分钟左右,官方微博就发出了正式回应,也就是开头提到的结论:经排查是运营商机房部分网络波动引发服务异常,目前已经全部恢复,对给用户带来的不便深表歉意。

回应发出后,大家的讨论反而更热了,核心争议点就是:一句“网络波动”加一句抱歉,够吗?我翻当时的高赞评论,有一句话说的很戳人:“现在淘宝就是我们生活的商业基础设施,就像小区停电半小时,物业都知道道歉给补偿,怎么到了平台这里,一句网络波动就完事了?”

其实很多人不知道,这场故障刚好卡在2024年双十一预热的关键节点,今年阿里对双十一的期待很高,前几个季度国内电商赛道竞争加剧,拼多多、抖音电商份额持续上涨,淘宝天猫的增速放缓,本来就想着靠双十一冲一波业绩,拉回用户增长,结果大促刚开始预热就出了宕机,难免不让人多想,当时甚至有不少谣言,说是不是淘宝被攻击、是不是架构调整出了问题,后来官方排查结果出来,确实是运营商机房的光纤故障,不属于淘宝自身的技术问题,但即便如此,用户毕竟是用你的平台,出了问题第一时间找的还是平台,不可能去找运营商追责。

我身边也有不少人持不同观点,说多大点事,又不是故意出故障,几十分钟就修好了,还要什么自行车?其实大家生气的点根本不是出故障,而是出了故障之后只有一句空泛的道歉,没有任何实质的安抚和补偿,毕竟对普通人来说,你耽误了我的急事、让我错过了优惠,一句轻飘飘的抱歉,确实很难抚平情绪;对中小商家来说,几十分钟的流量中断,可能就是大几百上千的真金白银损失,这个损失总不能让卖家自己扛吧?

宕机考的不是技术,是用户信任

我认识一个做互联网架构的朋友,他和我说过,对淘宝这种亿级并发的平台,能做到每年可用性达到99.999%已经是全球顶级水平了,换算下来一年宕机时间不超过5分钟,但是哪怕技术做得再完善,也架不住上游运营商出问题——光纤被挖断、机房设备故障这种事,属于不可抗的上游问题,下游再厉害也没办法,从技术层面来说,淘宝不到四十分钟就恢复了全部服务,这个处理速度放在全球都是合格的。

但为什么大家还是不满意?核心原因是,现在用户对互联网平台的要求早就变了,十年前我们逛淘宝,卡三五分钟大家都觉得正常,那时候3G都没普及,用户早就习惯了等待;现在不一样了,我们的生活节奏被拉得飞快,每个人的时间都被安排得满满当当,我们早就习惯了点一下就出结果、付款一秒成功,别说四十分钟,就算四分钟的等待都会让人烦躁,因为你的一次中断,可能直接打乱了我一整天的计划。

更现实的一个问题是,现在电商赛道早就不是淘宝一家独大了,用户没有淘宝,还有无数种选择:淘宝崩了我要下单,直接打开拼多多、抖音、京东,分分钟就能完成购买,很多人本来只是临时换平台,结果发现别家体验也不错,下次就直接留下来了,这种用户流失是不可逆的,我那个做女装的朋友阿凯,出了这件事之后,第二天就找人把所有新款都上传到了抖音小店,还开了视频号橱窗,他说我以前把所有精力都砸在淘宝,现在算是想明白了,不能把鸡蛋放在一个篮子里,万一再出一次这种事,我这点小本生意根本赔不起,你看,一次几十分钟的故障,不仅影响了当时的成交,还改变了很多中小商家的布局,这个影响其实是长远的。

我的观点:国民平台就要担起国民级的责任

聊到这里,我也说说我自己的看法,首先我觉得没必要对这次故障过度解读,很多人说“淘宝不行了”“要被拼多多超过了”,我觉得这种说法纯粹是博眼球瞎扯,哪怕是全球顶级的科技公司,也没办法保证自己百分之百不出故障:2024年年初微软Azure云全球故障,导致欧美多家银行停摆、航空公司没办法办理登机,影响范围比淘宝这次大得多,巨头也会出问题,技术故障本来就不可能完全避免,这点我们要客观看待。

但是客观看待不代表就可以接受“一句道歉完事”的处理方式,我始终觉得,作为一个月活接近9亿的国民级平台,享受了国民基础设施带来的流量和收益,就要承担对应的责任,淘宝这次的处理,其实还有很大的进步空间。

第一,故障是运营商的,但是用户是你的,你不能把责任一推了之,对当天受影响的商家,广告费可以退、流量可以补,对错过优惠的用户,发一张十几块的通用满减券安抚,成本其实很低,但是带来的用户体验完全不一样,今年年初抖音电商也出过一次小规模的访问故障,当时官方就是这么处理的:给商家补了双倍流量,给用户发了满减券,本来很多生气的用户,拿到券之后气也就消了,还夸平台会做事,对比下来,淘宝这次除了一句道歉什么都没有,确实显得有点敷衍。

第二,现在互联网行业早就进入了存量竞争时代,增量时代拼拉新,存量时代拼的就是用户信任,淘宝做了二十年,能做到今天的规模,靠的就是一代又一代用户的信任,但是不能因为你是老牌平台,就吃老本,不把用户的体验当回事,现在用户的选择太多了,一次不好的体验,可能就是用户离开的开始,我自己身边就有朋友,这次淘宝崩了之后,转去抖音买日常用品,现在已经很少打开淘宝了,这种变化都是一点点发生的,积累起来就是很可怕的用户流失。

第三,这件事其实给所有互联网巨头都提了醒:当你的产品变成了像水电煤一样的公共基础设施,你就要用基础设施的标准要求自己,基础设施不能出问题,出了问题就要快速解决,还要为用户的损失负责,不能一句“客观故障”就把所有责任撇干净,现在国内有多少中小商家,一家老小的生计都绑在淘宝上,有多少用户,日常衣食住行都离不开淘宝,这份依赖,对应的就是责任。

其实说白了,这次“淘宝崩了”就是一次很小的技术插曲,没有谁蒙受天大的损失,但是它能引发这么大的关注,本身就说明淘宝早就不是一个简单的购物网站了,它是我们生活的一部分:我们会在上面买给家人的礼物,会在上面开店养家,会在上面蹲点买自己心仪的商品,它的一点点风吹草动,都会牵动无数人的神经。

我始终觉得,在这个选择过剩的时代,用户的信任才是平台最值钱的资产,出问题不可怕,可怕的是不把用户的情绪和损失当回事,能接住用户的信任,才能做长久的生意,这大概就是这次小插曲给所有互联网平台的提醒吧。