主机运维
当前位置:时讯云电脑 > 资讯 > 主机运维 >
当机房服务器异常时应该如何处理
发布日期:2019-12-10 阅读次数: 字体大小:

  现在许多企业会选择将服务器托管到一个具有专业资格的托管商机室的服务器上,从而节省了不必要的麻烦。如果机房的服务器有问题,服务器托管公司也可以及时解决。但是你知道服务器在机房会遇到什么异常吗?如果机房服务器异常,我该怎么办?今天这篇文章滕友的科技编辑会做一个简单的介绍。


  处理机房异常服务器主要有以下几种方式:


  一、机房环境


  1.温度和湿度:最佳工作温度:20-25摄氏度,极限工作温度:10-40摄氏度,湿度:8-80%(23摄氏度)。


  2.同时,机房应确保服务器干净,机房应保持服务器干净。如果空气太多灰尘,很容易导致读写资源错误,损坏磁盘或磁盘驱动器中的读写头。定期使用皮老虎和刷子清除服务器上的灰尘。


  第二,电源


  电压:需要稳定的电压。峰值电压会损坏设备。
  电压范围:220伏/- 10%,即200-240伏,50-60赫兹。
  电源:取决于机器类型和系统配置。
  电源线:标准零、地、火三相电,零、地电压不超过3.0V.
  电源连接:连接空气开关或其他符合当前要求的设备以及主机的电源线,以确保计算机系统的可靠运行。应使用稳压电源和不间断电源。对于冗余电源连接,应采用两个独立的输入。


  三.硬件检查


  检查服务器和磁阵列的安装以及电源线主机的布线是否符合要求。


  四、服务器状态检查:


  1.当服务器处于启动和正常工作状态时,前面板的液晶屏上不应显示任何信息。
  2.当液晶屏上显示数字和字母信息时,会出现硬件警报。您可以查询相关型号。


  五、面板报警数字信息查找到相应的报警原因,情况严重时,应立即通知服务器制造商进行故障排除。


  1.当服务器的状态灯显示为橙色时,表示硬件报警。这时,检查电源、接线、硬盘等。磁柜的。如果出现硬件故障,请立即更换并纠正。如果没有发现具体问题,请联系相关制造商进行进一步诊断。
  2.当硬盘正常工作时,每个硬盘对应的硬盘灯将为绿色。如果没有阅读或写作,绿灯将一直亮着。如果硬盘上有读写操作,绿灯将不规则闪烁。当硬盘损坏或磁盘阵列出现问题时,硬盘状态灯将会熄灭,或者会以1 ~ 3秒的频率定期连续闪烁。


  六、系统日常维护流程


  1.系统启动
  系统启动的正常顺序如下:打开外围设备(磁盘阵列、磁带库等)的电源。)首先。所有外围设备通电并完成自检后,主机将通电并正常启动。主机通电后,可以按下power键启动机器。


        2.系统关闭
  当服务器系统关闭时,需要确认服务器的服务是否对当前网络服务有影响,同时,需要确认关闭服务器运行中的程序进程,指定软件安全关闭步骤,并执行关闭操作。


  系统和数据备份,有效和及时的系统备份是系统管理的一个非常重要的部分。


  当系统出现故障时,特别是当文件系统严重损坏或硬盘损坏时,通常需要使用系统备份来恢复系统。系统备份应在以下情况下进行:
  (1)新安装。硬件和系统软件安装完成后,应备份系统。
  (2)软件变更。当系统软件或应用软件发生变化时,应进行系统备份。
  (3)定期备份。定期备份系统,最好每三个月备份一次。
  系统恢复(System recovery):当系统发生严重故障,无法采用一般维护方法在短时间内恢复原系统时,经上级确认后,可以将最新的系统备份返回给机器,使系统在最新备份时完全恢复到系统环境中,然后将当天的数据备份返回给系统。此时,系统可以恢复正常运行。之后,制造商应对整个事件进行全面分析和审查,以找出故障原因,并采取相应措施防止类似事件再次发生。


  3.安全工作守则


  (1)系统应定期备份。
  (2)当系统发生变化或安装了操作系统补丁时,必须进行系统备份。
  (3)当发现硬盘故障时,注意当天的数据备份。更换硬盘时,请确认数据备份已在当天完成。
  (4)更换敏感电子元件时,务必防止静电。
  (5)插拔外围设备时,请关闭外围设备电源。
  (6)删除文件时,请注意当前路径是否正确。
  (7)解压缩文件时,请注意参数和路径。


  七、故障定位、排除


  根据系统实际运行中遇到的问题,总结了以下常见故障及其定位方法和解决方案。


  1硬件故障


  硬件故障种类繁多,对系统的影响也各不相同。这里,硬件根据故障对系统的影响程度进行分类:具有致命影响的硬件故障和仅影响功能的硬件故障:
  损坏将对系统造成致命影响(将导致机器停机或无法启动)的硬件包括:
  主板、中央处理器、磁盘阵列卡、电源模块、风扇、本地硬盘、内存损坏等。


  这些设备的损坏将使系统无法完成自检、引导和启动。液晶屏上将出现错误信息。错误原因可以根据液晶屏上的错误代码进行比较。如果这些硬件损坏发生在工作状态,系统将暂停或关闭。


  损坏只会影响系统功能(机器不会停机,可以正常启动)的硬件包括:损坏网卡、带有坏块的本地硬盘、显卡和其他外围设备只会影响特定功能,如网络功能、显示功能和访问磁性阵列的功能。对于具有坏块的本地硬盘,这取决于坏块是否包含重要的系统文件。如果它们不是重要的系统文件,系统功能不会受到影响,但也建议立即更换硬盘。


  故障定位和故障排除:液晶屏上的错误代码。
  根据错误代码,确定是什么硬件出了问题。对于系统来说,原则上,必须切换服务,以便损坏的服务器脱机,而不影响用户的使用。然后故障机器被修复,系统被恢复。


  2磁阵列故障


  磁阵列引起的故障是目前遇到的最常见、最有害的故障。据不完全统计,它们的故障占总故障的70%以上。具体而言,可能导致磁阵列故障的链路包括:


  磁盘阵列硬盘、主机上的磁盘阵列卡、连接到主机的SAS线、硬盘的位置和布线、机箱和周围磁场使用的电压、磁盘阵列/硬盘/磁盘阵列卡等。都可能导致异常。


  磁阵列问题是最复杂的。一般来说,有物理损坏原因和环境原因。这是主要原因,如布线、插件板的位置不符合要求、未能及时检查系统报警等辅助因素,造成系统中断。根据经验,无论是什么硬件故障导致故障,系统都会产生报警。如果能够及时发现问题并采取措施,如果出现硬件故障,可以从状态灯观察到:


  当单个硬盘出现故障或未使用时,其面板上的硬盘状态灯将不会点亮阵列的状态灯,黄色灯将点亮服务器的磁性阵列。磁性阵列配置的磁盘阵列卡通常有一个可充电电池,用于突然断电的情况。