VCS维护手册

news/2024/7/8 6:05:50 标签: service, system, 集群, 图形, user, windows

1        常用命令介绍

对VCS的常用命令进行介绍,便于工程师进行日常维护。本手册描述的命令仅供参考,具体描述请以Veritas公司提供的相关资料为准。

VCS的安装和命令都在下列目录下:sbin, /usr/sbin, /opt/VRTS/bin,和/opt/VRTSvcs/bin

,如果没有设置VCS的环境变量,请在/etc/profile文件中增加蓝色信息PATH=/opt/VRTSvcs/bin:/sbin:/usr/sbin:/usr/local/sbin:$PATH

修改完毕后需执行source /etc/profile,或者重新登陆。

1.1       基本命令

使用/etc/rc.d/llt {start|stop|restart|condrestart|status}命令可以启动、停止、重启llt及查看llt状态;

使用/etc/rc.d/gab{start|stop|restart|condrestart|status}命令可以启动、停止、重启gab及查看gab状态;

使用/etc/rc.d/vcs {start|stop|restart|condrestart|status}命令可以启动、停止、重启VCS及查看VCS状态;也可使用hastart [-stale|-force]来启动VCS;

使用下列命令来查看集群状态:hastatus或者hastat -sum

启动单节点集群hastart –onenode

以时间共享方式启动VCS:hastart –ts

关闭整个集群服务:hastop -all [-force]

关闭集群中一台主机上的集群服务:hastop -local

只关闭VCS相关进程,而不停止VCS所保护的服务进程:hastop -sys system [-force | -evacuate]

使配置文件可读写:haconf –makerw

使配置文件只读:haconf -dump –makero

1.2       VCS的用户管理:

增加用户,用户默认有观察员身份:hauser -add user

将用户提升为集群管理员:haclus -modifyAdministrators -add user

将用户提升为集群操作员:haclus -modify Operators-add user

将用户提升为服务组管理员:hagrp  -modify service_group Adminstrators -add user

将用户提升为服务组操作员:hagrp  -modify service_group Operators -add user

删除用户:hauser -delete user

显示所有用户:hauser -display

查询集群日志:

hamsg-list

hamsg-info [-path path_name] LDF

1.3       对服务组的基本管理操作:

查询service_group状态:hagrp  -state [service_group]-sys [system];

查询节点之间依赖关系:hagrp -dep [service_group]

查询资源表:

hagrp  -resources [service_group] ;

hagrp-display [service_group] [-attribute attribute] [-sys system]

hares-display [resource]

hares-display -attribute [attribute]

hares-display -group [service_group]

hares-display -type [resource_type]

hares-display -sys [system]

启动服务组及使服务联机:hagrp  –online service_group –sys system

关闭服务组及使服务脱机:hagrp  –offline service_group –sys system

将服务组切换到另一个系统上:(只对failover组有效,且当服务组中服务部分或全部联机时):

hagrp  -switch service_group -to system

冻结服务组(disableonlining, offlining, and failover),option -persistent 是使cluster重启时freeze:

hagrp  -freeze service_group [-persistent]

解冻被冻结的服务组(reenable onlining, offlining, and failover)

hagrp  -unfreeze service_group [-persistent]

激活服务组:(服务组激活后才能进行联机操作)hagrp  -enable service_group [-sys system]

禁用服务组:(服务组禁用后不能进行联机或切换操作)hagrp  -disable service_group [-sys system]

激活服务组中资源:hagrp -enableresources service_group

禁用服务组中资源:(如资源为disable时agents不监控资源组)hagrp  -disableresourcesservice_group

清除故障状态:hagrp  -clear [service_group] -sys [system]

1.4       管理资源操作:

查询资源代理列表:

hatype-list

hatype-resources resource_type

hatype-display [resource_type]

haagent-display [agent]

使资源联机:hares -online resource -sys system

使资源脱机:hares -offline resource -sys system

使资源脱机并将命令传播给子节点:hares -offprop resource-sys system

提示资源代理(agent)监控指定系统上的资源:(命令可能立即返回,但监控的进程可能还没结束)hares -probe resource -syssystem

清洗资源,使状态从RESOURCE_FAULTED转为RESOURCE_OFFLINE:

hares-clear resource [-sys system]

1.5       管理主机:

查询主机列表:

hasys-list

hasys-display [system]

haclus-value attribute

haclus–display

在ADMIN_WAIT状态下强制主机加载集群,此命令会覆盖正在使用的集群配置,使用前请确认准备使用的主机的集群配置文件是否有效:

hacf –verify /etc/VRTSvcs/conf/concig

hasys -force system

修改主机的属性,一些属性是VCS的内部属性,不能修改:

hasys -modify modify_options

查询主机ID,主机ID定义在文件/etc/llttab中:hasys –nodeid node_ID

冻结主机 (防止主机进行联机或切换操作):hasys -freeze [-persistent][-evacuate] system

解冻被冻结的主机 (使主机可以进行联机或切换操作):hasys -unfreeze [-persistent] system

1.6       VCS的license的管理操作:

安装VCS的License(root用户下执行):halic <key>或者vxlicinst –k  <key>

查询license:vxlicrep

2        使用图形界面管理VCS

使用图形界面来管理VCS,必须保证VCS已经启动,否则不能访问,如果在本机上使用图形界面管理VCS,必须保证VCS图形界面的rpm包已经安装好了,使用rpm –qa |grep VRTS查询,结果中存在以下两个rpm包则说明可以使用

VRTSjre-1.4-GA1

VRTScscm-4.4.00.10-GA_GENERIC

如果是在window终端上使用图形界面,在光盘中找到/windows/WindowsClusterManager这个目录,点击安装,按照提示完成安装,安装完成之后直接可以使用。

2.1       登录Cluster Manager

2.1.1       启动Cluster Manager

Cluster Manager有两种版本:Windows版本和Linux版本。建议使用Windows版本来远程管理Cluster。Windows版本安装后通过开始菜单或者桌面图标即可启动。

Linux版本启动方式如下:

启动图形界面的VeritasCluster Monitor

# hagui &

启动后将显示ClusterMonitor界面

                                                                                                                                               图1 启动Cluster Monitor界面

第一次登陆,ClusterMonitor界面上可能没有上图中的cluster_HA-test,需要新增一个要管理的Cluster:点击Cluster Monitor的File->New Cluster菜单,会出来如下界面:

                                                                                                                             图2 在cluter monitor中增加cluster的界面

其中Host name使用任一接点的IP即可,Port使用缺省值。

增加要管理的cluster后,Cluster Monitor中就会出现如图1中的cluster列表,显示为未登陆状态,点击Cluster Monitor中的cluster列表区,将弹出登陆界面,如下图所示:

                                                                                                                                                                     图3 登陆界面

输入用户名和密码(默认情况下用户为admin,密码为password),点击OK。

3        常见问题案例

编号

问题描述

解决办法

 

 

 

1

重启机器后,需要重新start llt,gab.机器reboot之后,gab异常:

# lsmod |grep gab

gab  253244   0

llt  139680   0  [gab]

这个是SuSe linux 8操作系统默认不加载网卡驱动导致的问题。解决办法:   在文件 /etc/modules.conf中加入如下内容,ethX对应具体的心跳网卡

       alias  ethX  e1000

 

 

 

2

在/etc/modules.conf文件中添加了“alias eth5 e1000”之后,心跳线使用正常;但如果用户使用yast配置其他网卡的IP,eth5将不可用,系统显示eth5的驱动没有加载

因为yast配置网卡时会将没有配置文件的网卡去激活,要确保yast对心跳线无影响,必须同时给心跳线网卡写配置文件

在/etc/modules.conf文件中添加了“alias eth5 e1000”之后,同时给心跳线的网卡加入配置文件,在/etc/sysconfig/network/中加入ifcfg-ethX文件,内容如下:

BOOTPROTO='static'

STARTMODE='onboot'

 

 

3

备用机与主服务器之间只有一条线跳线时,服务不会FailOver到备用机。有没有参数可以控制?

集群中只剩下一条心跳线的情况下,如果LLT收不到心跳线信号,VCS将无法判断是主机损坏还是仅是心跳线故障。所以在集群中只剩下一条心跳线的情况下,不会FailOver。

4

在提供服务组的主机上使用yast给其他网卡配置IP后,浮动IP会报错,导致服务发生切换

因为yast配置网卡时会将没有配置文件的网卡去激活,浮动IP是没有配置文件的,所以会被yast干掉,导致浮动IP不可用,引发切换,这是yast的固有bug,只能避免使用yast配置网卡信息,如果需要配置,请直接修改网卡的配置文件

5

使用命令hastatus -sum 查看状态是下面两种状态

STALE_ADMIN_WAIT: ADMIN_WAIT:

在STALE_ADMIN_WAIT 和ADMIN_WAIT状态下强制主机加载集群,此命令会覆盖正在使用的集群配置,使用前请确认准备使用的主机的集群配置文件是否有效:

hacf –verify /etc/VRTSvcs/conf/concig

hasys -force system

 


http://www.niftyadmin.cn/n/1552393.html

相关文章

便捷的日志收集和分析工具TFA

转自https://blogs.oracle.com/database4cn/tfa 1. 便捷的日志收集和分析工具Trace File Analyzer 客户在和技术支持的工程师解决GI&#xff08;RAC&#xff09;问题的时候&#xff0c;一个最大的问题就是及时的收集各个节点上和问题相关的日志和诊断数据&#xff0c;特别是收集…

RHCS 排错常用命令

1.1. 群集状态查看(clustat) The clustat command displays the status of the cluster. It shows membership information, quorum view, and the state of all configured user services. The clustat command displays cluster status only from the viewpoint of the clus…

跳过数据文件与跳过表空间

您有一个数据库&#xff0c;其中有一个或多个数据文件处于脱机状态&#xff0c;并且无法recovery&#xff0c;因为归档日志所需的文件不再存在。 当您使用rman resotre和recovery此类数据库时&#xff0c;Rman恢复会要求提供脱机文件所需的归档日志&#xff0c;因为目前Rman没有…

解决SendMail启动缓慢问题

sendmail启动慢的原因&#xff1a;Linux主机搜索DNS服务器不能进行域名解析的原因 解决方法&#xff1a;用vi 打开/etc/hosts文件。在127.0.0.1 localhost localhost.localdomain 后面加上Linux的主机名即可

analyze和dbms_stats相互作用和准确度

analyze和dbms_stats可以删除对方手机的统计信息吗&#xff1f;验证可以。 SQL> analyze table WORKER compute statistics for table;Table analyzed.SQL> select table_name, blocks, empty_blocks, num_rows2 from dba_tables3 where owner TEST4 and table_name …

Oracle数据库中的坏块

一 什么是数据库的坏块首先我们来大概看一下数据库块的格式和结构——数据库的数据块有固定的格式和结构&#xff0c;分三层 cache layer&#xff0c;transaction layer&#xff0c;data layer。在我们对数据块进行读取写入操作的时候&#xff0c;数据库会对要读写的数据块做一…

CRS无法启动的解决过程

一客户报RAC一节点的CRS无法启动&#xff0c;通过VPN远端连过去检查crs&#xff0c;如下&#xff1a; # crsctl check crs Failure 1 contacting CSS daemon Cannot communicate with CRS Cannot communicate with EVM 检查crs进程&#xff1a; # ps -ef | grep css root …

Linux常用命令之vmstat

1.vmstat vmstat是Virtual Meomory Statistics&#xff08;虚拟内存统计&#xff09;的缩写&#xff0c;可用来纪录 processes, memory, paging, block IO, traps, 与 cpu activity [rootraclinux1 ~]# vmstat –help usage: vmstat [-V] [-n] [delay [count]] -V prints versi…