V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
elevioux
V2EX  ›  站长

去机房维护需要检查注意什么项目?

  •  
  •   elevioux · 2021-12-30 15:38:01 +08:00 · 2629 次点击
    这是一个创建于 1062 天前的主题,其中的信息可能已经有所发展或是发生改变。

    小公司,服务器托管在一个 IDC 里。之前是我们的技术总监在管理,但他离职之后没有再招人,我变成了什么事都要做一点。

    今天被问到去机房要检查什么东西。我就一个写代码的,组装电脑我会,但对服务器硬件维护实在一窍不通。不是跑着没问题就好了吗?😂

    请教一下各位,对着黑漆漆的机柜,要检查些什么东西?

    25 条回复    2022-08-01 20:54:07 +08:00
    westoy
        1
    westoy  
       2021-12-30 15:40:37 +08:00
    检查个球啊, 没故障走个过场算了, 别把托管在旁边机器的网线给带下来

    我就是那个邻居, 还不止一次......
    Keystroke
        2
    Keystroke  
       2021-12-30 15:41:20 +08:00 via Android
    你一窍不通,只是被问到的话,说不知道就好,别给自己挖坑。如果你要亲自去,还是建议你别给自己挖坑。
    killva4624
        3
    killva4624  
       2021-12-30 15:44:53 +08:00
    需要去现场看的一般是物理问题,比如服务器运行是否有异响(服务器没有正常固定,没有放置平稳),机柜里温度是否过高,弱电、强电的电缆插接是否有松动,有没有其他机柜的人从你的柜里飞线之类……都托管 IDC 了一般也不用去机房检查。
    murmur
        4
    murmur  
       2021-12-30 15:45:19 +08:00
    你们巡检没有巡检单么,全靠个人能力的?
    Moderkaiser
        5
    Moderkaiser  
       2021-12-30 16:03:50 +08:00 via Android
    一般服务器都有 UID 指示灯,过去之前先通过 ipmi 让指示灯亮起来,再去机房就很好找了。
    Moderkaiser
        6
    Moderkaiser  
       2021-12-30 16:06:07 +08:00 via Android
    @Moderkaiser 还是把 ipmi 专用网口用上吧,以后不用过去,直接网页管理。
    opengps
        7
    opengps  
       2021-12-30 16:42:07 +08:00
    没有异常就是正常,非要应付下的话:
    看看各种面板灯,查查各种资源利用率
    zerohzd
        8
    zerohzd  
       2021-12-30 17:16:27 +08:00
    主要看硬盘和电源有没有报警灯。
    其他都做做样子,比如机房温湿度、机器有没有异常噪音。
    my101du
        9
    my101du  
       2021-12-30 17:30:13 +08:00 via iPhone   ❤️ 1
    @westoy 同经历。。。 之前公司有 3 台服务器,和别人的机器托管放在一个柜,中间夹着几台别人的,型号还一样。在前面看准了数好 123 绕到后面去拔线,果然拔错了。。。
    kiotech
        10
    kiotech  
       2021-12-30 18:33:27 +08:00
    穿件厚点的外套
    kokutou
        11
    kokutou  
       2021-12-30 18:38:43 +08:00 via Android
    看灯。
    特别是硬盘灯。

    报警了赶紧报修换
    alect
        12
    alect  
       2021-12-30 22:33:59 +08:00
    @kiotech #10 机房不应该很热吗?
    gavindexu
        13
    gavindexu  
       2021-12-30 22:40:00 +08:00 via iPhone
    @alect #12 机房是最凉爽的地方吧……
    alect
        14
    alect  
       2021-12-30 22:57:50 +08:00
    @gavindexu #13 我去过的机房都挺热的,
    这都冬天了,也不用穿多少吧。
    带个耳塞倒是真的,太吵了。
    呆个几个小时,耳朵都要废了。
    heihav2
        15
    heihav2  
       2021-12-30 23:02:22 +08:00 via Android
    (理论上)穿防静电服,操作机柜内设备带防静电手环
    heihav2
        16
    heihav2  
       2021-12-30 23:04:00 +08:00 via Android
    检查的话可以看后台的网管系统
    Tianao
        17
    Tianao  
       2021-12-30 23:39:29 +08:00
    @my101du #9 一定要使用定位识别指示灯按钮啊。
    Mac
        18
    Mac  
       2021-12-30 23:50:31 +08:00 via Android
    这还去个毛,看网线插没插,机房有没有 UPS ,硬盘灯亮不亮。有没有值班人员?
    bclerdx
        19
    bclerdx  
       2021-12-31 00:11:25 +08:00
    @my101du 你拔掉了别人的网线了?
    mhycy
        20
    mhycy  
       2021-12-31 01:18:12 +08:00
    机房的机器有啥好检查的?
    破托管机房里面的线路比我们自家机柜都乱,没得检查。
    虚拟化自建路由之后日常运维硬件监看全都可以远程搞定
    IDRAC 也进设备内网了,远程就好
    hay313955795
        21
    hay313955795  
       2021-12-31 08:28:25 +08:00
    @heihav2 防静电手环能不能在日常生活中使用呢? 是不是只要戴在手上了就能达到防静电的功能?
    coolloves
        22
    coolloves  
       2021-12-31 11:19:54 +08:00
    看下服务器是否开了 ipmi 管理网卡,如果有的话,配置个邮件报警,否则,就每次去看看灯就完事了吧
    julyclyde
        23
    julyclyde  
       2021-12-31 12:02:32 +08:00
    公共机房的话,主要是看看状态灯
    不过其实在操作系统内看硬件检查软件也可以,一样的

    建议云
    heihav2
        24
    heihav2  
       2021-12-31 20:45:57 +08:00 via Android
    @hay313955795 机柜上的防静电手环是连着机柜的,机柜是有接地的。
    zhlxsh
        25
    zhlxsh  
       2022-08-01 20:54:07 +08:00 via iPhone
    嗨,进去走一圈,看看有没有起火,没有就是未发现明显异常。
    如果仔细一点,就提前找个本子,抄一下 SN 号,然后到自己的机柜前面版对比一下,找到了就可以了。
    你打算更加仔细一点,那就是看一下前面板的灯,如果你觉得红色橘色黄色绿色都差不多,那就拍照回来。谁问你你就发给他看,就好了。
    一般会有人领着你,不会放你自己进去乱跑的,这时候,你只要跟在他后面就好,让你按什么按钮你才按,把自己锁住还是小问题,触发了防火措施,几分钟就能把空气吸出机房的。
    机柜后面插的网线光纤线电源线都不要去动。也不需要检查,除非你想换工作了。而且是服务器排风口比前面板热上 20 度都有可能。所以前面可能冻死,然后转个弯就是热死。
    所以机柜前面走一圈就可以了,与机器最近的距离就是你手机拍照的时候,什么都不要碰,什么都不要摸,时刻跟在领你进去的人后面。
    对我来说机房有一个噩梦般的存在,就是静电,如果你也怕冷不丁被电一下就尽量穿纯棉衣服,薄一点的鞋。手不要乱碰任何东西
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1739 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 00:00 · PVG 08:00 · LAX 16:00 · JFK 19:00
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.