难忘的端午节:不仅(第一次)没在家过,ESXi 的硬盘还逼了草

0x00.TL;DR

https://twitter.com/yuangezhizao/status/1493640040802504706

0x01.前言

storage怎么变成专门用来放翻车经历的文件夹了草?(╯°□°)╯︵┻━┻既然硬盘已经炸了,那还是来记录下是怎么炸的吧

0x02.回顾

几天前#107774340715434959看到树莓派官方终于推出了64-bit的系统,升级一时爽,翻车火葬场(
本来的计划#107802168869021564也是把rpi-slave升级到Raspberry Pi OS (64-bit),而rpi-master保持Raspberry Pi OS
于是光速把rpi-slave下电,并取下SD卡烧录镜像一顿操作猛如虎,然后在折腾的setup时候发现代理炸了
本地访问不到windows serverPAC文件了,并且连pingping不通?
登录ESXi发现虚拟机都在执行关机操作,有几个没装vm-tools的虚拟机自然是操作无效就没关上(现在回想应该还是没有给这几个虚拟机真正关机上,指没有执行关闭电源),然后过了一会ESXi主机就shutdown
去客厅果然异常安静,ESXi还得用不能停于是又给开机了,开机之后再登录发现有几个虚拟机报错说是磁盘有问题(也确实没仔细看

这 tm 是找不到文件啊淦
这 tm 是找不到文件啊淦

以为都是像之前HA的硬盘执行一次修复操作就能恢复(还寻思怎么这么多

1
vmkfstools -x repair /vmfs/volumes/DHG的磁盘/HA/hassos_ova-5.12.vmdk
一片红
一片红

就没太在意于是继续折腾setup了:#107802498430000851&#107802613391102079,直到俩小时差不多搞定后,再回过头来看ESXi,发现出大事情,是磁盘找不到了而不是磁盘有错误
WZ的提醒下才发现少了一块500G的盘……并且500G只识别出了3.86 GB#107802717830824989
本来想着U盘启动去PE里看看能不能修,结果BIOS里就看不到,直接入土(这可不是拿个软件修修坏道那么简单的事情了

500G 不见了
500G 不见了
寄

事已至此,只能掏钱买新盘了,当晚就众筹下单了(2T+4T),大佬们的赞助还是很给力的,还加购了条内存到总128GPCI-E 转 6 口 SATA3.0 *4的转接卡,属于被迫提前升级了一波

0x03.坏

今晚回家后,把那块盘从机箱里拿出来了#107807952048112891,也没抱太大希望,果然「这盘上电转都不转,只亮蓝灯嘟嘟响,等到不响了红灯闪烁也没转草」:#107808112968448154
v2搜了下这种情况多半是驱动板/固件坏了:#107808253285378695能开盘恢复但是得1000+,告辞(

0x04.ups.sh

罪魁祸首:UPS与ESXI联动实现断电自动关机,不能因为是腾讯公司网络技术服务专家写的文章就完全相信,甚至还翻到了自己留的到现在也没有被回复的评论(注:对方文章照常更新

草

心情复杂,抛开一直等着别人评论不说,当初开始用山特的UPS软件Winpower的时候,就应该把这个最开始的ups.sh的方案删掉就好了,明明只用前者就够了(

0x05.后记

事实再一次证明了笔记本盘不能用于7*24h,包括台式机里的普通家用硬盘(如希捷酷鱼),还是一分价钱一分货得上企业级的(tb灵车它不香吗?)或者说是NAS硬盘(如希捷酷狼)
当然,这个笔记本硬盘也不是自己的,创建虚拟机的时候也压根没有把数据放在了随时都可能被点爆的笔记本硬盘上的意识(根本不知道这是一块笔记本硬盘
最后看下损失,这些全部木大(自己的主要是HAcn-py-dl-c8#107807854876297870
虽然没啥极其重要的东西,但是那里面随着时间一点点积累的东西一下子就都木大了还是挺心疼的(不仅限于cn-py-dl-c8上的mongo里就存着爬虫的千万级破站视频api信息),呜呜呜~(ಥ_ಥ)