• 1. 培训内容: 1、HACMP的工作原理及安装 2、IBM磁盘阵列及文件系统的管理 培训对象: 培训时间: 1
    • 2. Hacmp双机系统的功能介绍 Hacmp(High Availability Cluster Multi- Processing)双机热备份软件的主要功能是提高客 户计算机系统及其应用的可靠性,而不是单台主 机的可靠性。 2
    • 3. Hacmp双机系统的工作原理1.作为双机系统的两台服务器(主机A和B)同时 运行Hacmp软件 2.服务器除正常运行自机的应用外,同时又作为 对方的备份主机 3.两台主机系统(A和B)在整个运行过程中,通过 “心跳线”相互监测对方的运行情况(包括系统 的软硬件运行、网络通讯和应用运行情况等)3
    • 4. Ha双机系统的工作原理(续)4.一旦发现对方主机的运行不正常(出故障)时 ,故障机上的应用就会立即停止运行,本机( 故障机的备份机)就会立即在自己的机器上启 动故障机上的应用,把故障机的应用及其资源 (包括用到的IP地址和磁盘空间等)接管过来, 使故障机上的应用在本机继续运行 4
    • 5. Ha双机系统的工作原理(续)5.应用和资源的接管过程由Ha软件自动完成,无 需人工干预 6. 当两台主机正常工作时,也可以根据需要将 其中一台机上的应用人为切换到另一台机(备 份机)上运行 5
    • 6. HACMP双机系统结构图 主机 (服务器) A 安装Hacmp 软件 共享磁盘阵列 (存储子系统)心跳线(tty) Service A 主机 (服务器) B 安装Hacmp 软件 Service B Service Network Standby Network6
    • 7. Hacmp安装配置前需作的准备工作1. 划分清楚两台服务器主机各自要运行的应用 (如A机运行应用,B机作为standby) 2. 给每个应用(组)分配Service_ip、Standby_ip、 boot_ip和心跳线tty,如:7
    • 8. Ha安装配置前需作的准备工作(续)主机A(运行应用): Service_ip: 172.16.1.1 Standby_ip: 172.16.2.1 Boot_ip: 172.16.1.3 主机B(standby): Service_ip: 172.16.1.2 Standby_ip: 172.16.2.2 Boot_ip: 172.16.1.48
    • 9. Ha安装配置前需作的准备工作(续)3. 按照各主机的应用的要求,建立好各自的磁盘 组,并分配好磁盘空间 4、根据Ha软件的要求,对服务器操作系统的参数作必要的修改9
    • 10. IBM HACMP双机系统的安装及配置HACMP的安装配置步骤如下: 一、在两台服务器上分别安装HACMP软件 #smit installp 二、分别检查两台主机上安装的软件是否成功 #/usr/sbin/cluster/diag/clverify software cluster clverify>software Valid Options are: lpp clverify.software> lpp 若没有error出现则安装成功。10
    • 11. 三、分别配置两台服务器的boot IP地址和Standby IP地址,保证boot 网和Standby网能ping通(用smit tcpip命令) 用netstat命令检查配置是否正确: #netstat -i 四、利用smit tty在两台主机上增加一个TTY接口,配置心跳线(RS232): #smitty tty TTY tty0 TTY type tty TTY interface rs232 Description Asynchronous Terminal Status Available Location 20-70-01-00 Parent adapter sa2 IBM HACMP双机系统的安装及配置(续)11
    • 12. PORT number [0] Enable LOGIN disable BAUD rate [9600] PARITY [none] BITS per character [8] Number of STOP BITS [1] 用lsdev –Cc tty查看tty是否配置好 #lsdev –Cc tty 在两台上分别输入如下命令: S85_1# cat /etc/hosts >/dev/tty0 S85_2# cat
    • 13. IBM HACMP双机系统的安装及配置(续)五、具体配置 注:HACMP的配置(或修改配置)只需要在其中的一台主机上进行,当配置(或修改)完毕后使用同步命令将配置结果传到另外一台主机上。一般选S85_1在进行配置 在S85_1上运行smit hacmp,然后按照下面的步骤进行配置: #smit hacmp 1、Cluster Configuration 1.1、配置Cluster Topology 配置Configure Cluster/ Add a Cluster Definition * Cluster ID [100] # * Cluster Name [sb_ha] 配置Configure Nodes,增加两个Node * Node Names [s85_a] * Node Names [s85_b]13
    • 14. IBM HACMP双机系统的安装及配置(续)配置Configure Adapters,分别配置两台机的service地址,boot地址,standby地址及tty(a_svc、b_svc、a_boot、b_boot、a_stdby、b_stdby、a_tty、b_tty) * Adapter IP Label a_svc Network Type [ether] Network Name [ethnet] Network Attribute public Adapter Function service Adapter Identifier [172.16.1.1] Adapter Hardware Address [ ] Node Name [s85_a] 修改/etc/hosts及/.rhosts文件,如: 14
    • 15. IBM HACMP双机系统的安装及配置(续)修改/etc/hosts文件,增加以下内容: 172.16.1.1 a_svc 172.16.1.2 b_svc 172.16.1.3 a_boot 172.16.1.4 b_boot 172.16.2.1 a_stdby 172.16.2.2 b_stdby 修改/.rhosts文件,增加以下内容: a_svc b_svc a_boot b_boot a_stdby b_stdby15
    • 16. IBM HACMP双机系统的安装及配置(续)1.2、同步cluster(Cluster Configuration/ Cluster Topology/ Synchronize Cluster Topology) 在进行同步的时候可以先进行模拟(Emulate)同步,当模拟同步 OK后再进行实际(actual)同步 Synchronize Cluster Topology Type or select values in entry fields. Press Enter AFTER making all desired changes. [TOP] [Entry Fields] Ignore Cluster Verification Errors? [No] + * Emulate or Actual? [Emulate] + 16
    • 17. IBM HACMP双机系统的安装及配置(续)2、Resource Group的三种节点关系 (Node Relationship): (1) Cascading (2) Concurrent (3) Rotating 17
    • 18. IBM HACMP双机系统的安装及配置(续)3、配置Cluster Resources 3.1 定义一个资源组(Define Resource Groups) 注意,在定义资源组的时候,要注意Participating Node Names的先后顺序 Resource Group Name data_res New Resource Group Name [] Node Relationship cascading Participating Node Names [s85_a s85_b] 3.2 定义应用服务器(Define Application Servers) Server Name ora_app New Server Name [ ] start Script [/etc/start] Stop Script [/etc/stop]18
    • 19. IBM HACMP双机系统的安装及配置(续)3.3、修改资源组属性(Change/Show Resources for a Resource Group) data_res组: Resource Group Name data_res Node Relationship cascading Participating Node Names s85_a s85_b Service IP label [a_svc] Filesystems(default is all) [] Filesystems Consistency Check fsck Filesystems Recovery Method sequential Filesystems to Export [] Filesystems to NFS mount [] Volume Groups [datavg logvg] Concurrent Volume groups [] Raw Disk PVIDs [] Application Servers [ora_app] 19
    • 20. IBM HACMP双机系统的安装及配置(续)3.4、 同步资源组(Synchronize Cluster Resources) 在进行同步的时候可以先进行模拟(Emulate)同步,当模拟同步 OK后再进行实际(actual)同步 Synchronize Cluster Resources Type or select values in entry fields. Press Enter AFTER making all desired changes. [TOP] [Entry Fields] Ignore Cluster Verification Errors? [No] + * Emulate or Actual? [Emulate] + 20
    • 21. IBM HACMP双机系统的安装及配置(续)4、 HACMP的启动及关闭 (1)启动过程: #smit clstart #tail –f /tmp/hacmp.out May 22 17:29:23 EVENT COMPLETED: node_up_complete s85_a 如果/tmp/hacmp.out文件显示类似上述信息,则表明HACMP在本 机上可以正常启动。 (2)关闭过程: #smit clstop21
    • 22. 5、HACMP功能的测试 在HACMP配置完成并检查没有错误后,即可 按3的方法启动HACMP,进行功能测试。包括应 用在同一台服务器的两个网卡能否切换,在两台 服务器间能否切换等。可用命令: #netstat -in 来看地址的切换情况 IBM HACMP双机系统的安装及配置(续)22
    • 23. IBM磁盘阵列及文件系统的管理一、几个基本概念 物理卷(PV):一个物理卷指一块硬盘 卷组(VG):卷组是可用物理硬盘的集合,可以 逻辑地看成一块大硬盘 物理分区(PP):卷组中物理卷划分成固定大小 的块(缺省为4MB) 逻辑卷(LV):逻辑卷是位于物理分区上的信息 集合 逻辑分区(LP):逻辑卷由一定数量的逻辑分区 组成 23
    • 24. IBM磁盘阵列及文件系统的管理(续)二、常用命令 lsvg rootvg 看内置硬盘属性 lsdev -Cc disk 看所有硬盘 lsvg 看所有VG lsvg -o 看本机已激活了的VG lsvg -l datavg 根据VG查看其上所有的LV lsvg -p datavg 看指定VG上所有的硬盘 lslv lv00 查看LV状态 lspv 看硬盘及所在VG lspv hdiskx 看hdiskx上的详细信息 lspv -l hdiskx 列出hdiskx上的LV lspv -p hdiskx 列出hdiskx上PP的状态 varyonvg datavg 手工激活VG varyoffvg datavg 使VG变成非激活状态24
    • 25. 三、磁盘阵列的划分(非concurrent方式) 1、在A机上增加一个卷组(Add a Volume Group) #smit vg VOLUME GROUP name [datavg] Physical partition SIZE in megabytes 64 * PHYSICAL VOLUME names [vpath0 vpath1 vpath2 …] Activate volume group AUTOMATICALLY no at system restart Volume Group MAJOR NUMBER [] Create VG Concurrent Capable? no IBM磁盘阵列及文件系统的管理(续)25
    • 26. IBM磁盘阵列及文件系统的管理(续)2、激活一个卷组 #varyonvg datavg #lsvg -o 如果能看到datavg,则正常 3、创建LV #smit mklv 输入LV的name,大小,所属VG即可 4、创建文件系统 #smit crjfs Mount AUTOMATICALLY no at system restart? Start Disk Accounting no. 26
    • 27. 5、对LV做镜像 #smit mklvcopy 选择LV、用作镜像的物理盘、copys的数量 #lsvg -l datavg 确定LV的copys #lspv -l hdiskx 确定LV的copys所在的物理位置 6、测试文件系统 #fsck /filesystemname #mount /filesystemname #umount /filesystemname 文件系统的属性定义在/etc/filesystems文件中 6、在A机上使用varyoffvg释放datavg #varyoffvg datavg IBM磁盘阵列及文件系统的管理(续)27
    • 28. 7、在B机上使用importvg命令将datavg import到B机上来 #smit importvg VOLUME GROUP name [datavg] PHYSICAL VOLUME name [vpath0] ACTIVATE volume group yes after it is imported? #lsvg -o 如果能看到datavg,则表示磁盘阵列切换正常 8、设置VG的属性(Changing a Volume Group’s Startup Status) #smit chvg Activate volume group [no] automatically at system restart? A QUORUM of disks [ ] required to keep the volume group online?IBM磁盘阵列及文件系统的管理(续)28