Windows炸了!全球大量PC同时崩溃,多个行业瘫痪!

  炸了,这次是真炸了!

  “微软蓝屏”的话题突然登上微博热榜第一,一开始我以为只是突如其来的一次网友集体吐槽,没想到却见证了本世纪最严重的系统安全事故之一。

  图源:微博

  据不完全统计,此次系统安全事故已经波及新西兰、澳大利亚、日本、印度、美国、中国香港等多个国家和地区,大量公共场所的 PC 系统出现了大范围的蓝屏报错,甚至包括机场、火车站、银行等重要交通枢纽和场所。

  图源:推特

  如果你仔细浏览新闻,会发现出问题的不仅仅是操作系统,还包括微软的云服务系统,微博里不少吃瓜群众以为是蓝屏导致欧美地区的航班大面积延误,实际上系统蓝屏并非唯一原因。

  短时间内接连出现两次重大问题,微软这次是真的遇到大麻烦了。

  微软出事,全球吃瓜

  作为全球 PC 系统的无冕之王,Windows 系统早已遍布各行各业,这也导致微软即使只是打个喷嚏,也有可能导致一次行业地震。在 7 月 19 日的全球系统崩溃问题中,欧美地区的银行、机场和铁道公司等重要部门和企业都受到了严重影响,导致大范围的地区交通停运或延误。

  与此同时,此次事件也影响到了不少中国企业,微博话题「感谢微软提前放假」就一度冲上了热搜榜第一,可以看到许多网友都在分享自己的电脑蓝屏照片,同时也让一群用 MacBook 的网友“破防”,自嘲为「天生打工圣体」。

  图源:微博

  所以,多数人都抱着吃瓜的心态看待此次事件,在推特上,闲下来的外国网友们更是开始集体刷起梗图:

  图源:推特

  还有人晒出了人生中第一张手写机票:

  图源:推特

  更是有网友将此次事件称为“大厂”的烦恼,因为有人发现遇到蓝屏问题的网友,基本供职于跨国大型企业,还有英特尔中国区员工表示下午一点收到口头通知放假下班,因为 IT 部门的电脑也蓝屏了,暂时无法进行修复。

  图源:微博

  虽然多少有点幸灾乐祸的感觉,但是也有不少网友在微博里哀嚎自己的工作没有保存,辛苦一周的成果就这么烟消云散。不过,这种情况还是少数,目前大多数生产力软件都有在线保存和历史文件服务,即使电脑突然关机也只会损失最近的一次修改记录,倒也不至于重新开始。

  不过,如果你正好遇上这次系统事故,然后又急着使用电脑,那么可以试试自行修复,根据一些网络工程师的测试,只要进入系统的安全模式,将C:\windows\system32\drivers\crowdstrike 文件夹重命名为其他名称,然后重启电脑就可以暂时解决这个问题。

  图源:推特

  如果依然无法正常使用,或者是无法进入安全模式,那就只能等公司的 IT 部门来解决了,考虑到接下来就是周末,让我们先为加班的 IT 打工人们默哀一下吧。

  全球系统崩溃,“真凶”到底是谁?

  从网友分享的蓝屏信息来看,错误代码主要为:PAGE_FAULT_IN_NONPAGED_AREA,经常折腾电脑的朋友对这个错误代码可能不会陌生。因为这往往说明你的电脑内存出现了一些问题,需要更换内存或者重新检查内存条的状态,更换内存插槽尝试排除错误。

  图源:微博

  不过,这一次网友分享的蓝屏信息中除了错误代码,还有一个失败操作:csagent.sys,这就说明此次蓝屏并非硬件故障,而是一个软件导致的系统冲突问题。

  图源:微博

  在有详细错误信息的情况下,网友很快就定位到文件位置:安全软件 Falcon 的一个文件夹。并且根据更新报告显示,Falcon 的开发公司 CrowdStrike 在 7 月 19 日正好向全球推送了一个版本更新,随后就引发了全球范围的系统蓝屏。

  谁能想到,一次例行的软件更新,就可以让全球多台电脑同时陷入瘫痪。而且还是一家网络安全公司的安全软件,不得不说是有点黑色幽默的。

  多数人可能都没听说过 CrowdStrike,实际上这家成立于 2011 年的网络安全企业是全球最著名的安全公司之一,只不过他们主要是为企业提供基于云端的端点安全解决方案和本地安全保障服务,所以在个人市场中并不算出名。

  图源:CrowdStrike

  在过去的几次大规模网络安全事故中,CrowdStrike 都发挥了重要作用,特别是在 2020 年末的 SolarWinds 事件中(一次波及美国财政部、商务部、国土安全部等多个部门及企业的严重网络安全事故),CrowdStrike 成功帮助许多企业避开了安全威胁,并因此声名大振。

  CrowdStrike 也因此获得了更多企业的青睐,其中就包括英特尔、美国航空等大型跨国企业,他们在一些关键的系统上部署并使用了 Falcon(CrowdStrike 的一款安全软件)。考虑到这些企业的业务遍布全球,这也导致在 CrowdStrike 推送更新后,引发的系统崩溃问题迅速成为一次全球性的网络安全事故。

  不过,CrowdStrike 的全球性蓝屏问题并非今天唯一的网络安全事故,同一个时间段里,微软云服务也出现了全球性中断。根据网友反馈,Team、office365 等软件都无法正常使用,而且直接影响到了许多公司的在线服务。

  CrowdStrike 与微软云同时出现问题,很难不让人将两者联系在一起,有消息称微软云的服务中断也与 CrowdStrike 的软件问题有关,不过目前为止微软和 CrowdStrike 都没有正面给出官方回应。

  外网的最新报道中,CrowdStrike 表示已经找到了问题的关键,并已经开始撤回本次更新,同时微软也宣布正在逐渐恢复微软云及其他服务,但是想要把全部服务恢复到正常状态还需要一些时间。

  因为受影响的 PC 均为安装了 CrowdStrike 安全软件的设备,所以大多数个人用户都没有受到此次事件的影响,不然就以 Windows 的市场占有率,这次事件将会引起一场真正的网络地震。

  受此次事件影响,CrowdStrike 与微软的股价都出现了不同程度的下跌,同时也引发了网友的激烈讨论:微软的安全问题为什么越来越多了?

  安全事故频发,微软怎么了?

  其实,这已经不是微软今年第一次出现重大网络安全事故,就在刚刚结束的 6 月份,微软云就遭遇了历史上最大规模的数据泄露事件。根据事后调查,黑客利用钓鱼和云账户阶段等手段,窃取了数百个微软云高管的账户,试图访问微软云的内部数据库。

  图源:Azure

  而在今年年初,微软云服务也出现了大范围的中断问题,导致 Outlook、Teams 等关键服务受到影响,只不过当时的影响波及范围尚不如此次,所以并没有引起太多人的关注。

  除了微软云频繁出事外,微软的系统更新也被网友吐槽 BUG 越来越多,先是 1 月份的一个 Windows 10 系统补丁在更新时会出现安装失败问题,导致系统更新会卡在 96% 并停止响应,不少人因为担心强行关闭电源会导致电脑损坏,而长时间无法使用电脑。

  图源:微软社区

  而在随后的 3 月份,一个针对 Windows 服务器系统的补丁更新,被发现会导致部分 Windows 服务器出现崩溃问题。考虑到服务器系统的稳定性需求,在补丁更新之前应该会经过一轮严苛的技术验证,但是从结果来看,这些验证都没能提前发现问题,在这一点上微软显然难辞其咎。

  虽然我们在聊到 PC 时都知道 Windows 并非唯一的选择,比如苹果的 macOS、开放的 Linux 系统都是选项之一,但是我想多数人最熟悉、最常用的系统还是 Windows。根据 StatCounter 的报告,Windows 系统的市场份额高达 72%,完全碾压其他 PC 系统。

  问题在于,这些 Windows PC 中有 66.47% 使用的还是 Windows 10,考虑到微软在年初宣布将在 2025 年停止对 Windows 10 的安全支持,将让大量的 PC 暴露在网络安全威胁的面前。

  对于个人来说,数据失窃、系统被入侵已经很让人糟心了,若是被击溃的是维持社会基本运作的企业、部门,那么我们要面对的就不仅仅是钱财或隐私的损失了。

  更让人糟心的是,像机场、火车站、银行等重要场所,其采用的安全系统往往来自多家公司,避免单个安全软件的漏洞导致系统被入侵。但是,今天的事件却说明了一个问题:那就是不管你的安全系统有多完美,如果其中一环出现问题并引起系统崩溃,那么其他备案也会受到严重的影响甚至失效。

  遍及全球的微软,似乎正在成为网络安全体系中的脆弱一环,今天可以因为一个网络安全公司的更新而众多企业的电脑崩溃,明天就可能因为一个系统更新补丁,让众多个人及企业电脑蓝屏。越发依赖网络及智能设备的现代社会,面对网络安全事故的抗风险能力也在变得更差。

  有网友将微软的安全控制越来越差,归咎于印度员工的问题,在外网的 IT 圈一直有个说法,那就是印度程序员越多的公司,他们的软件出问题概率就越高,这个看法可能有失偏颇。

  不过,不管是不是印度员工的原因,微软的管理层显然都无法推卸掉自己的责任,作为一家已经存在数十年的企业,微软早就建立了一套完善的网络安全保障体系,然而这些保障措施似乎正在失效,并导致一系列安全问题的出现。

  这一次全球范围的系统崩溃,不仅仅是给微软敲响了警钟,同时也让更多的企业需要去思考一个问题:将系统的命脉放在一家公司的手里,真的安全吗?