一、设备环境
客户一套IBM PueFlex刀箱插着5台IBM P260刀片,每台IBM P260刀片连接存储,安装VIOS虚拟化,VIOC系统安装在存储磁盘上。
二、故障描述
客户报修,表示一台IBM P260 VIOS及VIOC无法连接。登录HMC查看主机IBM P260连接状态为无连接,初步判断主板故障。
三、故障处理
1、重新插拔IBM p260刀片并加电后发现初始化失败,由此判断刀片主板故障导致系统宕机。
2、连接刀片的ASMI管理界面进行记录system name ,以便更换主板后修改成原system name。
3、通过命令行备份主机分区
telnet
调出命令行窗口
通过命令:bkprofdata实现分区备份
命令示例如下:
命令: bkprofdata -m LA10-18-S10-7895-22X-105907B -f /home/hscroot/105907B/F1
命令详解:LA10-18-S10-7895-22X-105907B要备份这台机器在HMC上的名字,105907B是新建的存放备份文件的文件夹,F1是备份文件的名字。
现在已经备份完成了。
4、更换主板
之后开始更换主板(所有内存、硬盘、网卡、前盖都要倒到另一个机器上,不包括CPU和散热片)。注:这个CPU和散热器和主板是一套的,只要动就有可能起不来机器。把新主板插进刀箱,观察状态灯,等状态灯慢闪,登陆CMM管理界面看是否认到刀片,认到后更改设备的管理口IMM IP。
修改IMM后查看HMC正常管理后主机后,进入ASMI把system name称改成原名称。
选择如下选项更改名字:P260VI-7895-23X-SNXXXXXX
5、HMC正常管理到刀片后,给刀片节点加电,设备正常加电后HMC连接状态为恢复,这时需要恢复分区数据。
分区恢复完成后,检查分区是否为原来的配置。分区恢复一致后启动VIOS分区,启动后使用padmin/padmin用户名和密码进入操作系统,检查VIOC的配置是否存在:$lsmap –npiv –all
如上图所示FC name:后面如果有光纤口名称显示表示配置还在,如果后面没有光纤口名称显示即表示配置丢失,需要把VIOC的虚拟光纤跟物理光纤口一一对应。
#cfgmgr重新识别设备信息后,配置VIOC虚拟光纤及物理光纤的对应关系。
根据VIOC的profile配置文件结合命令$lsmap –npiv –all重新建立对应关系。
示例命令如下:
#vfcmap –vadapter vfchost0 –fcp fcs0
配置完光纤的对应关系后启动VIOC到SMS模式扫描启动盘并选择启动盘。
故障处理完毕。
四、特殊情况的处理办法
如果分区恢复报错,可以初始化管理系统,步骤如下:
1、在做初始化前,先通过命令行copy分区文件到其他目录备份,以便恢复。
进入HMC命令行ls -al /var/hsc/profile/xxxxxx(设备SN)查看系统自己备份的分区文件backupFile copy到其他目录。
2、初始化管理系统
选择恢复分区数据->初始化受管系统 ,初始化完后将是一个全新的设备,状态会变成备用状态,如图所示:
主机的HMC状态变成备用以后是没有分区的,这时需要在HMC用命令行手动恢复分区。
恢复完分区以后点击主机查看分区是否恢复完全,恢复完分区以后就按照以上步骤恢复VIOC光纤配置信息。
五、经验总结
1、更换主板前如果HMC还能管理主机,先在HMC用命令行手动备份,如果HMC管理不了了,进入HMC命令行ls -al /var/hsc/profile/xxxxxxx(设备SN)查看系统自己备份的分区文件backupFile copy到其他目录,这是防止分区文件backupFile被覆盖。
2、关机设备,检查VPD对应的主板CPU主频后更换主板。
3、更换完主板查看指示灯慢闪后登录刀箱CMM更改新主板的管理IP地址。
4、更改完主板的管理IP地址后检查HMC是否可以管理主机了,管理到主机后进入ASMI更改系统名称,把system name改成以前一样 。
5、更改系统名称以后开机,主机正常加电以后HMC管理状态是恢复的状态,这时要求恢复以前的分区 。
6、恢复完分区以后启动VIOS检查 VIOC的配置,如果配置不见了重新MAP配置 ,重新配置后完启动VIOC。
注:部分资料及资料图来源于网络,如有侵权,请联系删除。
如欲了解更多,请登录365bet足球比分官方网站:cs.fhcyl.com