HACMP 安装,配置,管理与诊断分析



    IBM SVC 牛新庄 HACMP安装配置理诊断分析

    IBM SVC 25页 第1页 牛新庄








    HACMP 安装配置理诊断分析
    IBM SVC 牛新庄 HACMP安装配置理诊断分析

    IBM SVC 25页 第2页 牛新庄
    HACMP 工作原理
    HACMP 工作原理利 LAN 监控机网络网卡状态 HACMP
    环境中 TCPIP 网络非 TCPIP 网络TCPIP 网络应客户端访问公网
    该网数 AIX 支持网络 EthernetTRFDDIATMSOCCSLIP
    等等 非 TCPIP 网络 HACMP HA 环境( Cluster)中节点进行监控提
    供代 TCPIP 通讯路径 RS232 串口线节点连接起
    节点 SCSI 卡 SSA 卡设置成 Target Mode 方式
    安装 HACMP 软件
    机 屏幕显示 键盘操作
    xinzhuan
    g1
    xinzhuan
    g2
    含 HACMP 软件光盘插入光驱
    root:> smitty install_latest
    INPUT device directory for devcd0
    Software SOFTWARE to install All
    PREVIEW only no
    安装完成提示 OK
    root:> shutdown –Fr 关机重启

    HACMP 进程
    Cluster Manager daemon(usrsbinclusterclstrmgr): HACMP 核心进程运
    行群集节点监视群集目标节点网络接口网络等变化生成事件
    激活相应事件脚程序 script 做处理
    Cluster SMUX Peer daemon(usrsbinclusterclsmuxpd):运行群集节点通
    clinfo 客户端应提供 SNMP 支持该守护进程维护理信息库
    MIB(Management Information Base)中群集状态通标准 SNMP 函数访问
    数注意时运行 snmpd
    Cluster Information Program daemon(usrsbinclusterclinfo):运行群集节点
    RS6000 客户机通查询 SMUX Peer维护群集状态拓扑图客户端提供应
    程序接口 API 访问数
    Cluster Lock Manager daemon(usrsbinclustercllockd):群集配置成访问方式
    IBM SVC 牛新庄 HACMP安装配置理诊断分析

    IBM SVC 25页 第3页 牛新庄
    需该守护进程运行群集节点通 API 应访问享磁盘提供加锁功
    避免突
    HACMP 术语(课堂逐解释画张图)
    Cluster
    Node
    Network
    Topology
    Resource
    Resource group
    Application server
    Reintegration
    Synchronization
    Event
    HACMP 事件
    见usrsbinclusterevents 系统带事件脚
    usrsbinclustereventscustom 华编写脚
    HACMP 日志
    clusterlog Generated by cluster scripts and daemons
    clustermmdd Cluster history files generated daily
    cspoclog Generated by CSPOC commands
    cmlog Generated by the clstrmgr daemon
    dms_loadsout Generated by deadman's switch activity
    emuhacmpout Generated by the event emulator scripts
    hacmpout Generated by event scripts and utilities
    IBM SVC 牛新庄 HACMP安装配置理诊断分析

    IBM SVC 25页 第4页 牛新庄
    HACMP 资源接三种方式
    Resource Group 三种节点关系
    (Node Relationship)
    (1) Cascading
    (2) Concurrent
    (3) Rotating
    IBM SVC 牛新庄 HACMP安装配置理诊断分析

    IBM SVC 25页 第1页 牛新庄
    安装配置 HACMP
    安装配置 HACMP 时应保证卷组 datavg 激活状态
    参数规划
    机参数
    生产机 xinzhuang1 备份机 xinzhuang2
    机名 xinzhuang1 xinzhuang2
    网络掩码 255.255.255.0
    网卡 IP 址
    en0 xinzhuang1_svc
    461471100
    xinzhuang1_boot
    461471102
    xinzhuang2_svc 461471101
    xinzhuang2_boot 461471103
    en1 xinzhuang1_stb
    461472100
    xinzhuang2_stb 461472101

    集群(HACMP)参数
    生产机 备份机
    Cluster ID 1
    Cluster Name xinzhuang_cluster
    Node Name xinzhuang1 xinzhuang2
    Adapters
    Service
    Boot
    StandBy
    Serial

    xinzhuang1_svc
    xinzhuang1_boot
    xinzhuang1_stb
    xinzhuang1_tty

    xinzhuang2_svc
    xinzhuang2_boot
    xinzhuang2_stb
    xinzhuang2_tty
    Application Server
    Start Script
    Stop Script
    btpdb2_srv
    etcbtpdb2_start
    etcbtpdb2_stop

    Resource Group
    Group Name
    Cluster Mode
    Cluster Node
    Service Adapter
    Share VG
    xinzhuang1_gr
    cascading
    xinzhuang1 xinzhuang2
    xinzhuang1_svc
    datavg
    xinzhuang2_gr
    cascading
    xinzhuang2 xinzhuang1
    xinzhuang2_svc
    Filesystems








    btp
    btpdbs
    btpmsg
    btplog
    btprpt
    btpslg
    db2catalog
    db2log
    db2tmp

    Application Server btpdb2_srv

    机etchosts 文件rhosts 文件容
    生产机(xinzhuang1)
    IBM SVC 牛新庄 HACMP安装配置理诊断分析

    IBM SVC 25页 第2页 牛新庄
    etchosts rhosts
    127001 loopback localhost xinzhuang1
    461471100 xinzhuang1_svc
    461471102 xinzhuang1_boot
    461472100 xinzhuang1_stb

    461471101 xinzhuang2_svc
    461471103 xinzhuang2_boot
    461472101 xinzhuang2_stb
    xinzhuang1_svc
    xinzhuang1_boot
    xinzhuang1_stb
    xinzhuang1_tty
    xinzhuang2_svc
    xinzhuang2_boot
    xinzhuang2_stb
    xinzhuang2_tty
    备份机(xinzhuang2)
    etchosts rhosts
    127001 loopback localhost xinzhuang2
    461471100 xinzhuang1_svc
    461471102 xinzhuang1_boot
    461472100 xinzhuang1_stb

    461471101 xinzhuang2_svc
    461471103 xinzhuang2_boot
    461472101 xinzhuang2_stb
    xinzhuang1_svc
    xinzhuang1_boot
    xinzhuang1_stb
    xinzhuang1_tty
    xinzhuang2_svc
    xinzhuang2_boot
    xinzhuang2_stb
    xinzhuang2_tty

    配置网络机名
    屏幕显示 键盘操作
    root:> smitty mktcpip
    网卡设置成示(参见参数设定)
    Hostname IP Address Network Mask Network Interface
    xinzhuang1_svc 461471100 2552552550 en0
    xinzhuang1_stb 461472100 2552552550 en1
    xinzhuang2_svc 461471101 2552552550 en0
    xinzhuang2_stb 461472101 2552552550 en1
    root:> smitty chinet
    en0 IP 址改应 xinzhuang1_boot 址( 461471102)
    en0 IP 址改应 xinzhuang2_boot 址( 461471103)

    编辑机etchosts rhosts 文件

    配置心跳信号线:
    机型支持心跳线串口:F50H50H70 置串
    口口( S3)F80H80M80M85 置串口口
    ( S4)S70S7AS80S85 置串口做心跳线接口外接
    户卡(般配置 8 口户卡)串口
    机 屏幕显示 键盘操作
    xinzhuang1 root:> smitty mktty
    Parent Adaptersa1
    Port number 0
    Enable
    LOGIN

    xinzhuang2 root:> smitty mktty
    IBM SVC 牛新庄 HACMP安装配置理诊断分析

    IBM SVC 25页 第3页 牛新庄
    Parent Adaptersa1
    Port number 0
    Enable
    LOGIN

    检查配置
    xinzhuang1 root:> stty < devtty1
    命令进入等状态
    xinzhuang2 root:> stty < devtty1
    两机显示终端设置信息返回命令提示符

    配置 HACMP 集群
    节操作仅集群台机器执行里建议生产机操作
    111 定义集群
    # smitty hacmp
    ÆCluster Configuration
    ÆCluster Topology
    ÆConfigure Cluster
    ÆAdd a Cluster Definition
    Cluster ID 1
    Cluster Name xinzhuang_cluster

    112 定义节点
    # smitty hacmp
    ÆCluster Configuration
    ÆCluster Topology
    ÆConfigure Nodes
    ÆAdd Cluster Nodes
    Node names xinzhuang1 xinzhuang2

    113 定义网络
    # smitty hacmp
    ÆCluster Configuration
    ÆCluster Topology
    ÆConfigure Networks
    ÆAdd a Network
    分选择IPbased NetworkNon IPbased Network网络进行配置 配置 IPbased
    Network时 F7 键时选择网段 461471024 461472024
    Network Type Network Name Network Type Subnet(s)
    IBM SVC 牛新庄 HACMP安装配置理诊断分析

    IBM SVC 25页 第4页 牛新庄
    IPbased Network network1 ether 461471024
    461472024
    Non IPbased
    Network
    serialnet rs232

    114 定义网卡
    # smitty hacmp
    ÆCluster Configuration
    ÆCluster Topology
    ÆConfigure Adapters
    ÆAdapters on IPbased network
    Adapter IP Label Network
    Type
    Network
    Name
    Network
    Attribute
    Adapter
    Function
    Adapter
    Identifier
    Node Name
    xinzhuang1_svc ether network1 public service 461471100 xinzhuang1
    xinzhuang1_stb ether network1 public standby 461472100 xinzhuang1
    xinzhuang1_boot ether network1 public boot 461471102 xinzhuang1
    xinzhuang1_tty rs232 serialnet serial service devtty1 xinzhuang1
    xinzhuang2_svc ether network1 public service 461471101 xinzhuang2
    xinzhuang2_stb ether network1 public standby 461472101 xinzhuang2
    xinzhuang2_boot ether network1 public boot 461471103 xinzhuang2
    xinzhuang2_tty rs232 serialnet serial service devtty1 xinzhuang2

    115 定义资源组
    ¾ # smitty hacmp
    ÆCluster Configuration
    ÆCluster Resources
    ÆDefine Application Servers
    Æ Add an Application Server
    Server Name btpdb2_srv
    Start Script etcbtpdb2_start
    Stop Script etcbtpdb2_stop
    注意:请两脚生成容空确保 root x 权限
    ¾ # smitty hacmp
    ÆCluster Configuration
    ÆCluster Resources
    ÆDefine Resource Groups
    ÆAdd a Resource Group
    Resources Group Name xinzhuang1_gr xinzhuang2_gr
    Node Relationship cascading cascading
    Participating Node Names xinzhuang1
    xinzhuang2
    xinzhuang2
    xinzhuang1

    IBM SVC 牛新庄 HACMP安装配置理诊断分析

    IBM SVC 25页 第5页 牛新庄
    ¾ # smitty hacmp
    ÆCluster Configuration
    ÆCluster Resources
    ÆChangeShow ResourcesAttributes for a Resource Group
    Resources Group Name xinzhuang1_gr xinzhuang2_gr
    Node Relationship Cascading Cascading
    Participating Node Names xinzhuang1
    xinzhuang2
    xinzhuang2
    xinzhuang1
    Service IP Label xinzhuang1_svc xinzhuang2_svc
    Volume Groups datavg
    File System btp
    btpdbs
    btpmsg
    btplog
    btprpt
    btpslg
    db2catalog
    db2log
    db2tmp









    Application Servers btpdb2_srv


    116 步 HACMP 集群定义
    ¾ 步集群拓扑
    # smitty hacmp
    ÆCluster Configuration
    ÆCluster Topology
    ÆSynchronize Cluster Topology
    先 Emulate 确认问题时 Actual
    ¾ 步集群资源
    # smitty hacmp
    ÆCluster Configuration
    ÆCluster Resources
    ÆSynchronize Cluster Resource
    先 Emulate 确认问题时 Actual
    述两步骤运行状态 OK 时

    117 校验 HACMP 集群定义
    # smitty hacmp
    ÆCluster Configuration
    ÆCluster Verification
    IBM SVC 牛新庄 HACMP安装配置理诊断分析

    IBM SVC 25页 第6页 牛新庄
    ÆVerify Cluster
    述步骤运行状态 OK报错时

    118 HACMP 性调整
    生产机备份机应分确认
    ¾ # smitty hacmp
    ÆCluster Configuration
    ÆAdvanced Performance Tuning Parameters
    ÆChangeShow IO pacing
    HIGH water mark for pending write IOs per file 33
    LOW water mark for pending write IOs per file 24

    ¾ # smitty hacmp
    ÆCluster Configuration
    ÆAdvanced Performance Tuning Parameters
    ÆChangeShow syncd frequency
    Syncd frequency (in seconds) 10

    ¾ # smitty hacmp
    ÆCluster Configuration
    ÆAdvanced Performance Tuning Parameters
    ÆChangeShow a Network Module
    Ærs232 ethernet
    Failure Detection Rate Slow

    12 HACMPDB2BTP 启动停止脚
    两台机器编辑启动停止 HACMPDB2BTP 脚修改脚权限
    700文件均放etc 目录脚容参见附录
    etcha_startetcha_stopetcha_statetcha_listetcbtpdb2_startetcbtpdb2_stop
    测试 HACMP

    检查心跳线否已配置:
    1两台分输入命令:
    S85_1# cat etchosts >devtty0
    S85_2# cat IBM SVC 牛新庄 HACMP安装配置理诊断分析

    IBM SVC 25页 第7页 牛新庄
    果 S85_2 机接收信息表明心跳线已配置
    2测试心跳线否正常工作:
    A 机:
    # stty B 机:
    # stty 果两台机均出现该 TTY 配置信息说明心跳线设置正确
    3果 7133 做心跳先安装软件:devicessa*具体背出
    target 者 tmssa 类系统盘
    2chdev l ssar a node_number1
    3cfgmgr v
    4lsdec Cc tmssa 没 tmssa1tm tmssa1im
    5测试心跳 stty < devtty0 测试实际配置关 3124 3125
    6定义心跳时选 ssa target 方式 devtmssa1 做心跳设备

    HACMP 测试:
    HACMP 诊测响应三种类型障:1 网卡障2 网络工作3 节点障面
    三种障分进行介绍
    1网卡障
    前面讲HACMP 群集结构中 TCPIP 网络外非 TCPIP
    网络实际根心跳线专门诊测节点死机仅仅网络发生障
    图示旦节点加入 Cluster(该节点 HACMP 已正常启动)该节点
    网卡非 TCPIP 网络会断接收送 KeepAlive 信号KA 参数调
    HA 连续发送定数量包丢失确认方网卡网络节点发生
    障 KA HACMP 轻易发现网卡障旦某块网卡发
    生障发该块网卡 KA 会丢失时 node 1 cluster manager( HACMP
    脑)会产生 swapadapter 事件执行该事件 script(HACMP 中提
    供部分通环境事件 scripts标准 AIX 命令 HACMP 工具写
    )节点少两块网卡块 service adapter提供外服务
    IBM SVC 牛新庄 HACMP安装配置理诊断分析

    IBM SVC 25页 第8页 牛新庄
    块 standby adapter存 cluster manager 知道应 client
    知道旦发生 swapadapter 事件cluster manager 原 service adapter
    IP 址转移 standby adapter standby 址转移障网卡时网
    络节点进行 ARP 刷新网卡互换 (swapadapter)秒完成太网
    3 秒种转换应 client 说透明发生延迟连接中断

    1网卡障:
    网络接口障:
    命令:# ps – ef | grep cluster确认节点 HACMP 已启动
    命令:# errclear 0清空系统错误日志
    命令:# tail – f tmphacmpout监控 HACMP 运行状态
    命令:# ifconfig en0 down宕掉 Service 网卡
    命令:# netstat – in查 Standby 网卡否接宕掉 Service 网卡 IP
    址 MAC 址
    命令:# ifconfig en1 down宕掉接 Service 网卡 IP 址 MAC 址
    Standby 网卡
    命令:# netstat – in查 Service 网卡否 IP 址 MAC 址接回

    2网络障
    果发 node1 service standby 网卡 KA 包全丢失非
    TCPIP 网络 KA 然存 HACMP 判断 node1 然正常网络发生障
    时 HACMP 执行 network_down 事件
    网卡连接电缆障:
    命令:# ps – ef | grep cluster确认节点 HACMP 已启动
    命令:# errclear 0清空系统错误日志
    命令:# tail – f tmphacmpout监控 HACMP 运行状态
    断开 Service 网卡连接网线
    命令:# netstat – in查 Standby 网卡否接 Service 网卡 IP 址
    IBM SVC 牛新庄 HACMP安装配置理诊断分析

    IBM SVC 25页 第9页 牛新庄
    MAC 址
    重新连接原 Service 网卡连接网线
    命令:# netstat – in查时原 Service 网卡 IP 址 MAC 址否原
    Standby 网卡 IP 址 Service 址
    断开原 Standby 网卡连接网线
    命令:# netstat – in查 Service 网卡 IP 址 MAC 址否恢复原
    Service 网卡 IP 址 MAC 址
    重新连接 Standby 网卡连接网线
    命令:# netstat – in查 Standby 网卡 IP 址 MAC 址否恢复原
    Standby 网卡 IP 址 MAC 址




    3 节点障
    果仅 TCPIP 网络 KA 全部丢失非 TCPIP 网络 KA 丢
    失 HACMP 断定该节点发生障产生 nodedown 事件时资源接
    放享磁盘陈列资源备份节点接接包括系列操作:Acquire
    disksVaryon VG Mount file systemsExport NFS file systems Assume IP network
    Address Restart highly available applications中 IP 址接重新启动应
    HACMP 实现 AIX 完成
    IBM SVC 牛新庄 HACMP安装配置理诊断分析

    IBM SVC 25页 第10页 牛新庄
    整节点发生障时HACMP 障节点 service IP address 转移备
    份节点网络 client 然 IP 址程称 IP 址接
    (IPAT)
    节点 down 掉果设置 IP 址接网络 clients 会动
    连接接节点样果设置应接该应会接节点动重启
    系统继续外服务实现接应需 HACMP 中设置成
    application server告诉 HACMP 启动应 start script 全路径名停止
    该应 stop script 全路径名见应接配置 HACMP 中十分简单
    重 start script stop script 写作需户应解
    节点障:
    模拟*作系统崩溃:
    命令:# ps – ef | grep cluster确认节点 HACMP 已启动
    命令:# errclear 0清空系统错误日志
    命令:# tail – f tmphacmpout监控 HACMP 运行状态
    命令:# cat etchosts > devkmem模拟*作系统崩溃状态
    命令:# netstat – in# lsvg – o# ps – ef APP_PID查备份节点否接
    障节点 Service 址享卷组应程序
    重新启动障节点启动 HACMP
    命令:# netstat – in# lsvg – o# ps – ef APP_PID查该节点否原
    属 Service 址享卷组应程序接回
    模拟 CPU 障:
    命令:# ps – ef | grep cluster确认节点 HACMP 已启动
    命令:# errclear 0清空系统错误日志
    命令:# tail – f tmphacmpout监控 HACMP 运行状态
    直接断开某节点电源模拟 CPU 障
    命令:# netstat – in# lsvg – o# ps – ef APP_PID查备份节点否接
    障节点 Service 址享卷组应程序
    重新启动障节点启动 HACMP
    命令:# netstat – in# lsvg – o# ps – ef APP_PID查该节点否原
    属 Service 址享卷组应程序接回
    4障
    HACMP 检测网卡网络节点否发生障作出相应转移接
    行障 HACMP 缺省作动作
    a硬盘障
    IBM SVC 牛新庄 HACMP安装配置理诊断分析

    IBM SVC 25页 第11页 牛新庄
    般硬盘设置成 RAID5 方式 mirror 方式提供硬盘高
    性RAID5 奇偶较验位分散硬盘组中组硬盘坏掉组
    硬盘通奇偶较验位该硬盘数恢复出RAID5 方式般
    硬件实现 7133 SSA 适配器果组两硬盘坏掉该组硬盘
    数会全部丢失mirror 方式数写少两物理外置
    效率没 RAID5 盘量安全性 RAID5 高易实
    现通 AIX 中(Logic Volume Management)方便设置
    b硬盘控制卡
    存储设备连接机必须通块控制卡SCSI 设备 SCSI Adapter
    SSA 设备 SSA Adapter果块卡坏掉连接外设法利种办法
    解决问题
    种办法 adapter机两块两块 adapter分连接
    mirror 数硬盘坏掉 Adapter 坏掉数
    机利会出现单点障种方法实现起难必须配置块 adapter
    必须采数 mirror 方式种方法通 HACMP 实现
    种方法块 adapter利 HACMP 中 Error Notification
    Facility( 错误通告机制)解决
    Error Notification Facility HACMP 提供设备监控工具
    报告 AIX 错误(error)捕获采取相应措施HACMP 提供 smit 界面
    配置简单化
    已知道 LVM 实现硬盘镜盘坏掉份数镜
    盘里数进行读写时数性镜盘坏掉数全部丢
    失例中PV 丢失(LVM_PVMISS)信息会幅显示控制台面提
    醒户仔细查 error log 找出障修复样例中 HACMP 提供界面
    结合 AIX 功监控障发生
    c应障
    果户应 kernel call 调 root 身份启动等旦应
    发生障容易导致操作系统 down 掉发生死机时实际等节点障HACMP
    IBM SVC 牛新庄 HACMP安装配置理诊断分析

    IBM SVC 25页 第12页 牛新庄
    会采取相应接措施果应身死掉AIX 正常运行HACMP 利 Error
    Notification Facility 提供监控功应身采取动作果应
    中调 AIX SRC (System Resource Controller)机制提供 API 接口
    应 down 掉动重新启动 SRC 提供 API 接口外HACMP 中 clinfo
    提供样 API
    clinfo cluster Information daemon负责维护整 cluster 状态
    信息clinfo API 允许应程序利状态信息采取相应行动
    d HACMP 障
    果 cluster 中节点 HACMP 进程 down 掉HACMP 升级节点障
    发生资源接
    述HACMP 全权负责诊断网卡障网络障节点障三类障
    负责实现 IP 址转换接整系统资源 ( 硬件文件系统应程序
    等等)接三类障外障结合 AIX 基功 HACMP 提供
    机制 Error Notification Facility clinfo API 等样实现
    障监控采取相应措施


    HACMP 常见障解决:

    1导致集群中节点失效反映开关(Deadman Switch)

    问题现象:
    集群中节点历着极端性问题:量 IO 传输错误记录存
    足等导致集群理器( clstrmgr)没足够 CPU 处理时间引起反映
    开关分配时间重置某应程序运行权限高集群理器时会导致问题

    解决方法:
    术语Deadman Switch指特定集群条件未时重置该开关引起系统
    宕机转储核扩展部分反映开关超特定时间限制会宕掉处挂起
    状态节点程导致集群中节点接处挂起状态节点资源解决
    问题需解决相关性问题:
    1调整系统 IO pacing
    2增加信息步(syncd)频率
    3增加通信子系统存量
    4更改错误探测速率

    1调整系统 IO 步调:
    IBM SVC 牛新庄 HACMP安装配置理诊断分析

    IBM SVC 25页 第13页 牛新庄
    IO pacing 调整系统量写*作时系统资源分配更合理 HACMP
    集群激活 IO Pacing 必尤集群中会量磁盘数块写 *作时

    述步骤修改 IO Pacing 设置:
    # smitty hacmp
    Cluster Configuration
    Advanced Performance Tuning Parameters
    ChangeShow IO Pacing
    修改 HIGH water mark for pending write IOs per file 域推荐值 33
    值 0-32767 间
    修改 LOW watermark for pending write IOs per file 域推荐值 24值
    0-32767 间
    系统两值修改两值稍微减少写次数通常够解决
    述问题

    2增 syncd 运行频率:
    增加 syncd 运行频率缺省 60 秒运行次变 30 秒20 秒 10 秒运行次
    样强迫增加 IO 刷新速率减少沉重 IO 流量触发反映开关

    述步骤修改 syncd 运行频率设置:
    # smitty hacmp
    Cluster Configuration
    Advanced Performance Tuning Parameters
    ChangeShow syncd frequency
    修改 syncd frequency in seconds 域推荐值 10 秒值 0-32767 间

    3增加通信子系统存量:
    果运行命令:# netstat – m发现请求 mbuf 拒绝运行命令# errpt 发现
    LOW_MBUFS 错误应增加网络参数thewall值Thewall 缺省值 25%
    系统实存增加 50%系统实存
    述步骤修改 thewall 值设置:
    # vi etcrcnet
    文件末尾加入:
    no o thewall xxxxx
    xxxxx 指希设置供通信子系统实存值:
    no o thewall10240

    4修改错误探测速率:
    果激活 IO Pacing 增加 Syncd 运行频率解决反映开关重置问题时
    修改错误探测速率值该 Slow样延长挂起节点调反映开
    关前接节点探测节点障获挂起节点资源前需时间
    注意:
    完成述步骤前IO Pacing 必须先激活修改设置会调整 IO 数
    传输量
    IBM SVC 牛新庄 HACMP安装配置理诊断分析

    IBM SVC 25页 第14页 牛新庄
    二双机户组致

    HACMP 常命令 SMIT 工具:
    usressbinclusterutilitiescllscf Show Cluster Topology
    2usressbinclusterutilitiescllsclstr Show Cluster Definitions
    3usressbinclusterutilitiescllsnode Show Topology Information by Node
    4usressbinclusterutilitiescllsnw Show Topology Information by
    Network Name
    5usressbinclusterutilitiescllsif Show Topology Information by
    Network Adapter
    6usressbinclusterutilitiesclshowres g'sxptt_con_rg'
    Show Resource Information by Resource Group
    7usressbinclusterutilitiesclshowres n's85a'
    Show Resource Information by Node
    1查 Cluster 运行情况:
    # usrsbinclusterclinfo – a
    # usrsbinclusterclstat
    usrsbinclusterclstat 帮助查前 HACMP 节点状态
    屏幕会显示:
    clstat HACMP for AIX Cluster Status Monitor

    Cluster cluster1 (1) Tue Jul 20 095203 CDT 1999
    State UP Nodes 2
    SubState STABLE

    Node j50a State UP <节点 A 状态
    Interface j50_a_srv (0) Address 19292001 < 服务 IP 址
    State UP <服务 IP 状态
    Interface j50_a_tty1 (1) Address 0000
    IBM SVC 牛新庄 HACMP安装配置理诊断分析

    IBM SVC 25页 第15页 牛新庄
    State UP <心跳线状态

    Node j50b State UP <节点 B 状态
    Interface j50_b_srv (0) Address 19292002 < 服务 IP 址
    State UP <服务 IP 状态
    Interface j50_b_tty1 (1) Address 0000
    State UP <心跳线状态
    2启动 HACMP:
    # smitty clstart
    注:两种启动 HACMP 方式:
    now:手工启动 HACMP
    restartboth:系统启动时动启动 HACMP
    3停止 HACMP:
    # smitty clstop
    注:三种停止方式:
    graceful:停止节点 HACMP 运行释放节点理资源
    允许节点接
    graceful with takeover:停止节点 HACMP 运行释放资源节
    点接
    forced:停止节点 HACMP 运行释放资源

    4查 Cluster 进程状态:
    # ps – ef | grep cluster
    注:应三 HACMP 进程:clstrmgrclinfoclsnuxpd

    5查 Cluster 日志错误信息:
    # more tmphacmpout
    # more varadmclusterlog
    注:启动 HACMP 时 # tail – f tmphacmpout 命令查 HACMP
    IBM SVC 牛新庄 HACMP安装配置理诊断分析

    IBM SVC 25页 第16页 牛新庄
    启动否正常踪启动时错误信息

    6查 Cluster 运行历史记录:
    # cd usrsbinclusterhistory
    注:目录存放着天 Cluster 运行记录

    7查 Cluster 运行时网络情况资源组情况:
    HACMP 启动前:
    # netstat – i
    时应 boot standby 址
    # lsvg – o
    时 VG
    HACMP 启动:
    # netstat – i
    时应 service standby 址
    # lsvg – o
    时应 VG 享 VG

    8存储恢复 Cluster 配置:
    存储 cluster 配置:
    #smitty hacmp
    选择:Cluster Configuration→Cluster Snapshots→Add a Cluster Snapshot
    键入 Snapshot 文件名(Cluster Snapshot Name)
    恢复 cluster 配置:
    # smitty hacmp
    选择:Cluster Configuration→Cluster Snapshots→Apply a Cluster Snapshot
    键入 Snapshot 文件名(Cluster Snapshot Name)

    注:菜单中项意义:
    IBM SVC 牛新庄 HACMP安装配置理诊断分析

    IBM SVC 25页 第17页 牛新庄
    Cluster Snapshot Name:指定 Cluster Snapshot 文件名
    Cluster Snapshot Des cription: Cluster Snapshot 描述
    UnConfigure Cluster Resource:否重新配置 Cluster 资源
    Force Apply if verify fails: Cluster 校验失败时否强制恢复配置

    9注意: HACMP 理享 VG 中增加 FS 时具体步骤:
    1)# smitty
    选择:System storage management
    File systems
    Addchangeshowdelete file systems
    Journaled file systems
    Add a journaled file system
    Add a standard journaled file system
    选择享 VG
    指定 FS Mount point
    2)# smitty clstop
    停止 HACMP 运行
    3)增加 FS 节点作:
    # varyoffvg SHARE_VG_NAME
    # exportvg SHARE_VG_NAME
    节点作:
    # importvg – y SHARE_VG_NAME – f hdiskX
    # varyonvg SHARE_VG_NAME
    作步目新加入 FS 定义取
    4)# smitty hacmp
    选择:cluster configuration
    cluster resources
    define resource group
    changeshow resources for a resource group
    IBM SVC 牛新庄 HACMP安装配置理诊断分析

    IBM SVC 25页 第18页 牛新庄
    增加 FS 加入 Cluster 资源组定义中
    5)# smitty hacmp
    选择:cluster configuration
    cluster resources
    synchronize cluster resources
    步 Cluster 资源组配置
    6)# smitty hacmp
    选择:cluster configuration
    cluster verification
    进行 Cluster 配置校验


    IBM SVC 牛新庄 HACMP安装配置理诊断分析

    IBM SVC 25页 第1页 牛新庄
    附录
    2 附录:HACMP 脚
    21 ha_start 文件(HACMP 启动脚)
    usrsbinclusteretcrccluster boot Nbi
    22 ha_list 文件(查 HACMP 状态脚)
    echo ' Cluster Processes ' > tmpha_listout
    ps ef | grep cluster | egrep v grep >> tmpha_listout

    echo >> tmpha_listout
    echo ' Network Status ' >> tmpha_listout
    netstat i >> tmpha_listout

    echo >> tmpha_listout
    echo ' VG Status ' >> tmpha_listout
    lsvg o >> tmpha_listout

    echo >> tmpha_listout
    echo ' Filesystems Mounted ' >> tmpha_listout
    mount >> tmpha_listout

    echo >> tmpha_listout
    echo ' Applications ' >> tmpha_listout
    ps ef | grep db2 | egrep v grep >> tmpha_listout
    ps ef | grep btp | egrep v grep >> tmpha_listout

    pg tmpha_listout
    rm tmpha_listout

    23 ha_stat 文件(查集群状态脚)
    usrsbinclusterclstat –a

    24 ha_stop 文件(HACMP 关闭脚)
    usrsbinclusterutilitiesclstop y –Ngr

    25 btpdb2_start(DB2BTP 启动脚)
    注:备份机应cp f btpetcbtppaswdrza btpetcbtppaswddat语
    句中btppaswdrza改btppaswdrzb
    ¾ 未安装理服务器(DAS)启动脚
    #binksh
    #
    IBM SVC 牛新庄 HACMP安装配置理诊断分析

    IBM SVC 25页 第2页 牛新庄
    # Start Db2 Instance
    #
    su db2inst1 c db2start
    #
    chown db2inst1db2iadm1 devrcontainer0[03]lv
    #
    # Start BTP
    #
    su btp c
    cominit s # Initial COMM module
    sleep 1
    comctrl s # Start COMM processes
    sleep 1
    cp f btpetcbtppaswdrza btpetcbtppaswddat # Get the BTP password file
    btpinit r `head 1 btpetcbtpdatesdat | cut f4 d' '` # Reinitialize the BTP
    system
    sleep 3
    btpctrl i # Start BTP processes

    exit 0

    ¾ 安装理服务器(DAS)启动脚
    #binksh
    #
    # Start Db2 Instance and DB2 Administrative Server
    #
    su db2inst1 c db2start
    db2admin start
    #
    chown db2inst1db2iadm1 devrcontainer0[03]lv
    #
    # Start BTP
    #
    su btp c
    cominit s # Initial COMM module
    sleep 1
    comctrl s # Start COMM processes
    sleep 1
    cp f btpetcbtppaswdrza btpetcbtppaswddat # Get the BTP password file
    btpinit r `head 1 btpetcbtpdatesdat | cut f4 d' '` # Reinitialize the BTP
    system
    sleep 3
    btpctrl i # Start BTP processes

    exit 0

    26 btpdb2_stop(DB2BTP 关闭脚)
    ¾ 未安装理服务器(DAS)关闭脚
    IBM SVC 牛新庄 HACMP安装配置理诊断分析

    IBM SVC 25页 第3页 牛新庄
    #binksh
    #
    # Stop BTP system
    #
    su btp c
    btpctrl e # Stop all the BTP processes
    sleep 3
    echo y | btpinit c `head 1 btpetcbtpdatesdat | cut f4 d' '` #Clear the
    BTP environment
    sleep 1
    comctrl c # Stop all the COM processes
    sleep 1
    cominit c # Clear COMM environment

    #
    # Stop DB2 Instance
    #
    su db2inst1 c
    db2 force application all
    db2stop

    echo '********** Applications Shutdown Completed **********'

    exit 0

    ¾ 安装理服务器(DAS)关闭脚
    #binksh
    #
    # Stop BTP system
    #
    su btp c
    btpctrl e # Stop all the BTP processes
    sleep 3
    echo y | btpinit c `head 1 btpetcbtpdatesdat | cut f4 d' '` #Clear the
    BTP environment
    sleep 1
    comctrl c # Stop all the COM processes
    sleep 1
    cominit c # Clear COMM environment
    #
    # Stop DB2 Instance and DB2 Administrative Server
    #
    su db2inst1 c db2admin stop
    db2 force application all
    db2stop
    echo '********** Applications Shutdown Completed **********'

    exit 0


    《香当网》用户分享的内容,不代表《香当网》观点或立场,请自行判断内容的真实性和可靠性!
    该内容是文档的文本内容,更好的格式请下载文档

    下载pdf到电脑,查找使用更方便

    pdf的实际排版效果,会与网站的显示效果略有不同!!

    需要 3 香币 [ 分享pdf获得香币 ]

    下载pdf

    相关文档

    ISO 20000与CMMI配置管理的比较分析

    ISO 20000与CMMI配置管理的比较分析  ISO20000配置管理与CMMI配置管理的比较分析  ISO9000是一个公司级的管理标准,CMMI是研发活动的管理模型,ISO20000是...

    11年前   
    681    0

    No6_Array_SPX工程安装配置手册_Portal Theme配置部分

    Array SPX工程安装配置手册Portal Theme配置部分 SPX可以让用户通过一个Portal页面方便,安全的访问到被保护的资源。在用户经过登陆页面正确的认证后,他将会看到一个欢迎页...

    3年前   
    600    0

    快速离线安装配置Android 开发环境

    首先在这里下载离线安装包,然后我以android-sdk_r16-windows为例介绍安装过程。1. 安装JDK:运行jdk-7u3-windows-i586.exe;这里在“开发工具“和“...

    6个月前   
    187    0

    No7_Array_SPX工程安装配置手册_设备管理及排错部分

    Array SPX工程安装配置手册设备管理及排错部分Syslog设置:命令行为:log {on | off}log host <ip-address> [dest-port] [tcp | u...

    3年前   
    569    0

    人资源管理诊断分析

    人资源管理诊断分析 以下,将列出一些在企业人力资源诊断中会出现的较为有意思和重要的问题。 一、可笑的面试   很有必要专门来讨论面试不要做什么。如果你曾经当过老板,你会知道面试时会...

    7年前   
    29988    0

    企业诊断管理_销售管理诊断_年度报告分析表

    年度报告分析表主要问题、争议或关心的事情写下可能的产品或服务方案目标未来计划根据年度报告来看,你的机会 □大有多大? ...

    11年前   
    558    0

    配置管理

     配置管理 文件编号: NP601100 ...

    10年前   
    12021    0

    No1_Array_SPX工程安装配置手册_简介和基本功能配置部分

    Array SPX工程安装配置手册简介和基本功能配置部分一、 (一)概述 21. 前言 22. SSL VPN简介 23. SSL VPN 网络拓扑 24. Array SPX设备配置概述 4...

    3年前   
    518    0

    No2_Array_SPX工程安装配置手册_虚拟站点配置部分

    Array SPX工程安装配置手册虚拟站点配置部分一、 SSL VPN门户(Virtual Site)的建立 11. 增加Virtual Site 12. 配置virtual site 的SS...

    3年前   
    577    0

    机电安装工程进度管理分析

    机电安装工程进度管理分析   摘  要:机电安装工程项目管理包括合同管理、采购管理、资源管理、质量管理、进度管理等内容,其中进度管理占有比较重要的地位。本文首先简单介绍了机电安装工程的进度...

    9年前   
    6476    0

    配置库管理报告

       配置库管理报告 来自:http://www.chinaspis.com 作者:林锐 电子工业出版社出版发行 { 项目名称 } 配置库管理报告 文件状态: [√] 草稿...

    14年前   
    12893    0

    企业诊断管理_经营管理诊断_预备诊断表(三)

    预 备 诊 断 表(三)(预-3)(种类)标准品特殊品生产形态计划生产 %订货生产 %多种少量生产少种多量生产每种产品的月平均生产量营业形态(独立经营型) (加...

    9年前   
    545    0

    企业诊断管理_经营管理诊断_预备诊断表(四)

    预 备 诊 断 表(四)区分调 查 检 讨 事 项记 事诊断动机1.对实际问题合理化的期望2.遭遇重大困难应予诊断3.以诱劝的方式期能改进4.接受授诊工厂的...

    10年前   
    697    0

    企业诊断管理_经营管理诊断_预备诊断表(二)

    预 备 诊 断 表(二) 1.公司的沿革及经理经历 2.资本结构 3.产品(加工技术)特征 4.销售状况变化的特征 5.生产状况变化的特征 6.采购状况与持征 7.劳务管理状况与特征 8.经营的特征与困难点

    9年前   
    595    0

    企业诊断管理_经营管理诊断_预备诊断表(一)

    预备诊断表(一) 工厂名称地 址电 话...

    10年前   
    634    0

    Netapp存储基本安装配置指导书

    华 为 数 据 中 心N E T A P P 存 储 基 本 安 装 配 置 指 导 书©2023 Network Appliance All rights reserved本文档介绍 Net...

    1年前   
    273    0

    基于Linux的FTP服务器的安装与配置课程设计

    1 引言1.1课程设计目的 自从有了网络以来,通过网络来传输文件一直是一项很重要的工作,不但可以实现文件的下载和上传,而且可以设置不同的用户访问权限,并支持大文件的断点续传功能。采用F...

    1年前   
    313    0

    配置管理计划

       配置管理计划 来自:http://www.chinaspis.com 作者:林锐 电子工业出版社出版发行 { 项目名称 } 配置管理计划 文件状态: [√] 草稿 ...

    7年前   
    10687    0

    软件配置管理计划

    水利工程建设注册造价工程师继续教育系统软件配置管理计划二零壹零年伍月份目 录1 引言 11.1 目的 11.2 定义 11.3 参考资料 12 管理 22.1 机构 22.2任务 22.3职责...

    1年前   
    301    0

    配置管理规范

     配置管理规范 文件编号: NW601103 ...

    15年前   
    28062    0