beget-交际英语
Gridview2.0
安装维护手册
Gridview2.0
安装维护手册
目
录
1
、
系统安装
.
..................................................
............
0
1-1
、
安装条件
.
..................................................
................ 0
1-2
、
GRIDVIEW2.0
安装前设置
..................................................
... 0
1-3
、
GRIDVIEW2.0
安装
...
..................................................
...... 5
1-3-
?
-1<
/p>
、
管理节点安装
..........
........................................... 5
1-3-
?
-2
、
p>
计算节点安装
..................................................
... 7
1-4
、
安装后的验证
.
................................................ .............. 8
1-4-
?
-1
、
管理节点验证
..........
........................................... 8
1-4-
?
-2
、
p>
计算节点验证
..................................................
... 9
2
、
系统卸载
.
..................................................
...........
10
2-1
、
管理节点卸载
.
................................................ ............. 10
2-1-
?
-1
、
卸载步骤—计算中心版
......
...................................... 10
< br>2-1-
?
-2
、
卸载步骤—数据中心版
............................
错误!未定义书签。
2-2
、
计算节点卸载
.
................................................ ............. 10
2-2-
?
-1
、
批量卸载—计算中心版
............................
错误!未定义书签。
2-2-
?
-2
、
手动卸载—计算中心版
............................
错误!未定义书签。
2-2-
?
-3
、
批量卸载—数据中心版
............................
错误!未定义书签。
2-2-
?
-4
、
手动卸载—数据中心版
............................
错误!未定义书签。
3
、
系统维护
.
..................................................
...........
11
3-1
、
配置文件
.
..................................................
............... 11
3-1-
?
-1
、
安装配置文件
..........
.......................................... 11
3-1-
?
-2
、
p>
PORTAL
相关配置文件
......
........................................ 12
3-1-
?
-3
、
告警预处理相关配置文件
< br>.......................................... 12 < /p>
3-1-
?
-4
、
LOG
配置文件
........
............................................. 13 <
/p>
3-1-
?
-5
、
采集相关配置文件
.............................................
... 13
3-1-
?
-6
、
HIBERNATE
配置文件
............................................ ... 16
3-1-
?
-7
、
作业调度管理进程配置文件
....
.................................... 18
3-2
、
设备信息导入及参数设置
.
...........................................
........ 19
3-2-
?
-1
、
设备信息导入
..........
.......................................... 20
3-2-
?
-2
、
p>
采集参数设置
..................................................
.. 22
3-2-
?
-3
、
告警参数设置
<
/p>
........................................
............ 22
3-2-
?
-4
、
设备使用配置
..........
.......................................... 23
3-3
、
运行状态检查
.
................................................ ............. 24
3-3-
?
-1
、
采集器运行状态检查
.......
....................................... 24
3-3-
?
-2
、
告警预处理服务运行状态检查
......................................
25
3-3-
?
-3
、
TOMCAT
服务运行状态检查
< br>.......................................... 25 < /p>
3-3-
?
-4
、
作业调度管理进程状态检查
p>
........................................
25
3-4
、
故障处理
.
..................................................
............... 25
3-4-
?
-1
、
网络故障
............
............................................ 25
p>
3-4-
?
-2
、
应用程序故障
................................................ .... 25
3-5
、
系统日志
.
..................................................
............... 26
3-5-
?
-1
、
采集系统日志
..........
.......................................... 27
3-5-
?
-2
、
p>
告警预处理系统日志
< br>.............................................. 28
Gridview2.0
安装维护手册
3-5
-
?
-3
、
作业调度管理进程系统日志
....
.................................... 28
1
、系统安装
1-1
、安装条件
设备
服务器
盘阵
型号
A620
、
A950
< br>、
TC2600
、
IPMI
p>
机器等
DS3140
、
DS8340
、
DS8342<
/p>
、
DS8348
、
DS6310
华为
3com
p>
:
S3900
、
S
5100
、
S5600
Cisco:
cisco2950
、
cisco2960
Foundry:
superx800
、
superx-fe
Brocade: silkworm
24000
、
silkworm 48000
TC2600
备注
63
10
获取信息不完善,
没有主机通道、
状态告
警等信息
< br>Brocade
系
列
指
的
是
san
交换机
p>
交换机
刀片机箱
?
本软件支持的操作系统
操作系统
具体版本号
RedHat
AS
系列
AS4.6
、
AS5.1
CentOs
CentOs4.6
SUSE
SUSE10.2
备注
1-2
、
Gridview2.0
安装前设置
?
?
?
确定集群各个节点的
ip
地址配置正确,确定集群各个节点的
/etc/
hosts
文件内容完整并且
正确。
解压缩源程序安装包,并进入解压缩后产生的文件夹
进入
tools/deploy_tool
目录
,运行命令
make,
将会出现如图
1
.1
的界面:
Gridview2.0
安装维护手册
图
1.1
make
程序主页面
里面包含
make
程序的所有功能。
make
程
序的功能包含集群节点设置、集群
ssh
无密码访问、
系统时间设置、重起服务、帮助等
用户输入
1
并输入回车时,将进入集群节点设置的子程序,如图
1.2
所示。该程序包含
2
个功
能,
功能一是察看集群所包含节点的名称,
即要配置
ssh
无密码访问和系统时间的节点的名
称;
功能二是设置集群所包含节点的名称,即要配置
ssh
p>
无密码访问和系统时间的节点的名称。此
时输入
1
并且输入回车键时,将进入功能一,输入
2
并输入回车键时,将进入功能
2
。设置完
成后,输入
3
并输入回车时,将退出到
make
程序主目录。注意:节点名称要跟
/et
c/host
的
ip
地址设置保持一致
。功能二设置节点名称时,程序调用了
vi
编辑器,编写集群节
点完成后,
请用
vi
命令的保存方式保
存数据。
?
?
图
1.2
集群节点设置界面
设置好集群所包含
的节点并返回到
make
程序主目录后,用户可以设置
ssh
无密码访问和系统
时间。用户输入
2
并且输入回车时,将进入
ssh
无密码访问功能的界面,如图
1.3
所示。
ssh
无密码访问功能包含
2
个子功能,功能一为检查某个用户的
ssh
访问是否不
需要密码,此时输
入
1
便进入了功能一
,如图
1.4
所示,功能一将提示请输入待检查的用户名称,输
入用户名称
后该功能将会自动检查
ssh
无密码访问,
检查结束后将返回检查结果,
出现
bad_connect
:
none
时,
此时表明指定用户在该集群的指定节点上已经实现了
ssh
无密码访问。
如果出现
bac
_connect:
node1->node2
的提示或者类似的提示,
则表明从
node1
连接
node2
时,
该用户无法实现无密码
1
Gridview2.0
安装维护手册
访问;
在设置
ssh
无密码访问界面中输入
2
时,将进入设置
ssh
无密码程序,如
图
1.5
所示。
根据提示,输入用户名
和密码,如果输入的用户为普通用户时,还会提示是否共享了
home
< br>目
录,
如果共享了
home
p>
目录,
这输入
y
或
者
yes,
否则输入
n
或者
no,
此时该程序将自动设置好指
定用户的
ssh
无密码访问。注意:集群的所有节点的
用户密码必须跟管理节点的密码一致。
图
1.3
ssh
无密码访问功能的界面
图
1.4
检查
ssh
无密码访问界面
2
Gridview2.0
安装维护手册
图
1.5
设置
ssh
无密码访问界面
?
进入
make
程序主页面后,输入<
/p>
3
并输入回车时,将进入时间设置的界面,如图
< br>1.6
所示。输
入
1
时将进入检查集群的系统时间的程序,如图
1.7
所示;输入
2
时将进入设置系统时间的程序,
< br>如图
1.8
所示。注意:检查集群的系统时间时,只能精
确到年月日,设置系统时间时,是设置成服
务器的一个时刻的时间。
图
1.6
时间设置界面
3
Gridview2.0
安装维护手册
图
1.7
检查集群的系统时间
图
1.8
设置集群的系统时间
?
在
gri
dview
部署完成后,我们提供了重启服务的功能。进入
ma
ke
程序主页面后,输入
4
并输
p>
入回车时,将进入重启服务的界面,如图
1.9
所示。在该界面下输入
1
并输入回车键,将重启作业
调度服务;在改界面下输入
2
并输入回车键,
将重起整个
gridview
的服务。
4
Gridview2.0
安装维护手册
图
1.9
重起服务界面
?
在
mak
e
程序主界面,输入
5
后,将进入帮助
界面,包含使用该软件的介绍。
?
在
make
程序主界面,输入
6
后,将退出
make
程序。
注意:建议将该
make<
/p>
软件放在管理节点上,并且将其拷贝到管理员的私人文件夹下。
1-3
、
G
ridview2.0
安装
安装计算
中心版的
gridview
,请配好集群的
ssh
无密码访问和
/etc/hosts
文件以及操作系统的系
统时间。
1-3--1
、管理节点安装
1-3--
1-1
、安装步骤
按如下步骤安装:
1
.
加压安装包
gridview_2_
2
.
进入解压目录
gridview_2_0
3
.
修改配
置文件
,具体含义见
3-1
节配置文件
4
.
执行安装脚本
install_gridview_
5
.
等待脚本执行完成,则完成安装
1-3--
1-2
、目录结构
|----/opt/gridview/
程序根目录
|
|
|----collector
采集程序主目录
|
|----alarm
告警引擎主目录
|
5
Gridview2.0
安装维护手册
|--- jobmanager
作业调度管理程序主目录
|
|---conf
节点采集配置目录
|
|---mysql5.1
数据库目录
|
|----java
jre
目录
|
|----ldd_patch
程序所需动态库目录
|
|----tomcat
tomcat
目录
|
|----tools
一些必
要的
rpm
包等
|
|----pbs/
dispatcher
作业调度资源管理器服务节点主目录
|
|----pbs/
dispatcher-sched
作业调度调度器主目录
|
|---- uninstall
卸载脚本目录
6
Gridview2.0
安装维护手册
1-3--1-3
、异常处理
安装过程中可能出现的异常:
1
.
gmond
程序未启动
检查
/etc/init.d/gmond
脚本是否
存在,是否有可执行权限;如果文件存在并且可执行,则手
动执行脚本
< br>/etc/init.d/gmond start
;如果文件不存在,则从
p>
/opt/gridview/conf
下拷贝至
< br>/etc/init.d
下,如果是
suse
,则拷贝文件
gmond_suse
,并使用
p>
chkconfig
–
add
将
gmond
做成
服务
2
.
tomcatd
未启动
检查
/etc/init.d/gridview_tomcatd
脚本是否存在,是否有可执行权限;如果文件存在并且
可
执
行
,
则
手
动
执
行
脚
本
/etc/init.d/gridview_tomca
td
start
;
如
果
文
件
不
存
在
,
则
从
/opt/gridview/conf
下拷贝到
/etc/init.d/
下,并使用
chkco
nfig
–
add gridview_tomcatd
p>
命令
将
tomcat
做成服务
如
果
经
过
上
述
步
骤
无
法
启<
/p>
动
,
查
看
java
环
境
是
p>
否
正
确
。
程
序
的
java
目
录
在
/opt/g
ridview/java/jre1.6.0_13
3
.
安装完成后,导入配置文件失败
检查
配置文件各项,如果配置了需要监控的设备类型,检查该设备类型所有属性是否均设置,
如有遗漏,则将其补全。
如果上一步无法解决问题。检查后台
mysql
数据库是否启动,详见
my
sql
无法启动一节。
4
.
Mysql
未启动
< br>检查
/
etc/init.d/gridview_my
sqld
脚本是否存在,是否有可执行权限;如果文件存在且可以
执行,则手动执行
/etc/init.d/gridview_mysqld
p>
start
,如果无法启动,查看后台日志,日志文件在
/opt/gridview/mysql5.1/data/
,其中
p>
nodename
为被安装节点的节点名。可能出现的问题
有:
无法创建
/tm
p/
目录下临时文件,检查磁盘空间是否够用
5
.
Mysql
已启动,数据库无法连接
进入
mysql
安装目录,
/opt/gridview/mysql5.1,
执行命令
bin/mysql
–
uroot
–
pdawning123
,
进入
mysql
控制台后,执行命令
use gridview_local
看能否执行成功,如果被告知没
有这个数据库,则退
出
mysql
环境
,手动执行
sql/init_
创建数据库。
< br>
1-3--
2
、计算节点安装
1-3--2-1
、安装步骤
1.
2.
3.
4.
所有计算节点配置好
ssh
或
rsh
,确保登
陆计算节点无需输入密码
加压安装包
gridview_2_
进入解压目录
gridview_2_0
补全
node_list
安装列表,修改
< br>
具体含义见
3-1-1
节
7
Gridview2.0
安装维护手册
5.
执行批量安装脚本
install_gridview_all_
1-3--
2-2
、目录结构
|----/opt/gridview/
程序根目录
|
|
|----collector
采集程序主目录
|
|----conf
节点采集配置目录
|
|----java
jre
目录
|
|----ldd_patch
程序所需动态库目录
|
|----tools
一些必
要的
rpm
包等
|
|----pbs/dispatcher
作业调度资源管理器执行程序安装目录
|
|---- uninstall
卸载脚本目录
1-3--
2-3
、异常处理
1-4
、安装后的验证
1-4--1
、管理节点验证
1-4--1-1
、
Portal
p>
启动
使用
web
浏
览器登
陆管
理节
点,
在浏览
器输
< br>入
http://
如
http://192.168.0.1:808
0/gridview_portal
,可以看到如下界面,则表示
portal
安装成功。
1-4
--1-2
、相关进程启动
验证目标
确认
gridview
安装成
功
确认
gridview
服务安
装成功
操作步骤
检查
/opt/gridview
执行
chkconfig
–
list |grep
gridview
详细说明
异常
处理
可以看到
alarm
、
collector
、
conf
、
java
、
tomcat
、
tools
几个目录
可以看到有
gridview_alarm
gridview_collector
gridview_mysqld
预期结果
8
Gridview2.0
安装维护手册
确认<
/p>
gridview
服务启
动
ps
–
ef
|grep java
gri
dview_tomcatd
四个服务
根据用户选择不同,
最多可以看到如
下几个进程
MainManager
—
采集管理进程
BladeChassisCtrl---<
/p>
刀片采集进程
ServerCtrl-
--
服务器采集进程
SwitchC
trl---
交换机采集进程
Arr
ayCtrl---
盘阵采集进程
IpmiCtrl---
ipmi
采集进程
JobManag
erCtrl---
作业调度管理进程
AgentCtrl
---
服务器采集代理
Startup---
告警预处理
1-4
--2
、计算节点验证
验证目标
确认
gridview
计算节
点安装成
功
确认
gridview
代理服
务安装成功
操作步骤
检查
/opt/gridview
chkconfig
–
list
|grep gmond
chkconfig
–
list
|grep
dcas_server
Ps
–
ef |grep
gmond
Ps
–
ef |grep
dcas
Ps
–
ef |grep
AgentCtrl
详细说明
可以看到
有
gmond
与
dcas_server
两个服务
可以看到
三个进程
预期结果
可以看到
< br>collector
、
conf
、
java
、
tools
几个目录
可以看到有
gm
ond
与
dcas_server
两<
/p>
个服务
异常
处理
确认
gridview
代理服
务启动
可以看到三
个进程,分别是
gmond
、
、
AgentCtrl
9
Gridview2.0
安装维护手册
2
、系统卸载
2-1
、管理节点卸载
卸载步骤:
1.
进入管理节点安装包解压目录或
者安装目录
/opt/gridview/uninstall
2.
执行卸载脚本
uninstall_gridview_
2-2
、计算节点卸载
卸载步骤:
1.
进入管理节点安装包解压目录或
者安装目录
/opt/gridview/uninstall
2.
配置好需要卸载的节点列表文件
node_list
3.
执行脚本
uninstall_manager_all_
10
Gridview2.0
安装维护手册
3
、系统维护
3-1
、配置文件
这里的配置文件分为安装配置文件及各个功能模块的配置文件。
3-1--
1
、安装配置文件
?
管理节点安装配置文件
参数
JOB_MANAGER_NAME=node1
含义
MON_MANAGER_IP=192.168.1.1
MYSQL_LISTEN_PORT=3306
START_SERVER=y
START_IPMI=n
START_ARRAY=n
START_SWITCH=n
START_BLADECHASSIS=n
作业调度管理节点节点
名
gridview
管理节点
ip
< br>
mysql
监听端口
是否启动服务器信息采
集,
y
为启动
,n
为不启动
是否启动
ipmi
信息采集,
y
为启,
n
为不启动
是否启动盘阵信息采集,
y
< br>为启动,
n
为不启动
是否启动交换机信息采
集,
y
< br>为启动,
n
为不启
动
是否启动刀片机箱信息
采集,
< br>y
为启动,
n
为不
启动
单位
/
备注
?
计算节点安装配置文件
参数
含义
JOB_MANAGER_IP=192.168.1.6
MON_MANAGER_IP=192.168.1.1
JOB_MANAGER_NAME=node6
JOB_COMPUTE_NAME=
作业调度管理节点节点
名
gridview
管理节点
ip
< br>
作业调度管理节点节点
名
计算节点节点名
单位
/
备注
如果批
量安装计算
节点,该变量设为
空,如果安装单个
节点,写入计算节
点的名称
11
Gridview2.0
安装维护手册
?
计算节点名列表
node_list
例如
node2
、
node3
、
node4
为计算节
点,这
node_list
的内容是:
node2
node3
node4
如果计算网节点名与管理网不一致,则写两列,第二列为计算
网节点名
,
如下:
node2
bnode2
node3
bnode3
node4
bnode4
3-1--2
、
Portal
相关配置文件
<
/p>
Portal
一
般
需
要
修
改
的
是
数
据
库
p>
连
接
的
配
置
文
件
,
它
的
路
径
是
/opt/gridview/tomcat/apa
che-tomcat-6.0.16
/webapps/gridview_port
al/WEB-INF/classes/spring
具体配置属性如下:
class=
数据库连接字符串
value=
数据库登录的用户名和密码
注意:此文件只有在所用数据库的
用户名、密码改变的情况下才需要手动修改;
Portal
配置
文件修
改后需要重新启动
TOMCAT
容器
3-1--
3
、告警预处理相关配置文件
告
p>
警
预
处
理
的
配
置
文
件
主
要
是
< br>连
接
数
据
库
的
配
置
文
件
,
文
件
p>
为
/opt/gridview/alarm/spring/
12
beget-交际英语
beget-交际英语
beget-交际英语
beget-交际英语
beget-交际英语
beget-交际英语
beget-交际英语
beget-交际英语
-
上一篇:墓库之象——盲派中级命理学
下一篇:圣经里最经典的句子100句