天塌了 ⚡️
周末,发现网站存储图片文件用的 Linode Object Storage Bucket 空间中 (类似亚马逊云的 S3,及阿里云的 OSS),所有的图片文件都消失了。
对应的,网站上所有的图片都不显示了。
- 登录 Linode 后台,发现所有 Bucket 空间都不见了。连列表都不见了。
- 登录服务器,查看挂载的目录,目录消失。。。连个文件影子都没有。
茫然 😅
我第一反应是,如果连 bucket 都被删除了,要么黑客登录了 Linode 后台,直接操作手动删除。 要么,在服务器上拿到了配置文件中的 Linode access key 和 secret key,然后调用 API 删除了所有 bucket。
这也太恐怖了。
提桶跑路?对不起,桶 (bucket) 都没有了。。。
赶紧从备份恢复才是正事
赶紧找之前的目录备份,想把损失降到最低,只是大部分图片是有备份的。
找备份的过程中,我突然想,不太对,黑客都能拿到 root 组的配置了,就干个这种损人不利己的事情? 最起码发个勒索邮件才像回事吧。
这时,收到了 Linode 故障提醒消息。。。
Investigating - Our team is investigating an issue affecting the Object Storage service. During this time, users may experience connection timeouts and errors with this service. Sep 7, 07:51 UTC
虚惊 🤯
看到官方声明,至少说明不是自己服务器的问题。舒了一口气。
但是反复刷,始终没有看到 bucket 列表,Linode 后台也越来越卡,估计大家都在刷 Linode 后台吧。
查看 Linode 全部服务状态 ⌛️
基本上正规的云服务器提供商都会提供一个 status 状态页面,实时显示当前的运行状态。 Linode 的对应页面是:
https://status.linode.com
10 个小时之后,Linode 才官方宣布解决问题。
Resolved - We haven’t observed any additional issues with the Object Storage service, and will now consider this incident resolved. If you continue to experience problems, please open a Support ticket for assistance. Sep 7, 17:49 UTC
周一看,也没有完全恢复。
如何规避类似问题
这是一个非常严重的事故。特别是对内容类网站来说。长时间的图片 404,肯定会影响 SEO 的效果。
虽然看起来是不可抗力因素,但实际上还是能规避的。至少不至于受影响这么长时间。
之前 Linode OSS 的使用方式也不太对,按理说,应该将图片文件先存储到服务器磁盘上, 然后同步到 Linode OSS。这样即便 Linode OSS 出故障,也能迅速切换到本地磁盘文件上。
微信关注我哦 👍
我是来自山东烟台的一名开发者,有敢兴趣的话题,或者软件开发需求,欢迎加微信 zhongwei 聊聊, 查看更多联系方式