-
软
件
系
p>
统
运
维
指
导
手
册
WEIHUA system
office room
【
WEIHUA
16H-WEIHUA
系统日常维护
指导手册
目录
1
、目的
网
e
通宽带网络运营支撑系统使用的服
务器中,服务器均采用
red hat linux
as 4
操作系统
,
数据库版本为:
oracle 10g
,随着业务的开展,
oracle
数据库中存
储的数据量也不断增大,这样操作系统和数据库的日常维护就显得十分重
要。
本手册详细描述了程序模块,
l
inux
操作系统,
DHCP
双机热备
、负载平衡
及
oracle
数据库等日
常检查的主要步骤,指导现场工程师对其进行监控和维
护。
2
、适用范围
使用者为网
e
通宽带网络运营支撑系统维护工程师
3
、服务器及数据库概述
服务器概述
服务器数量:
4
台,基本信息如下:
服务器
机器型号
操作系统
主服务
DELL PC
RedHat
linux
AS
器
安装的模
主机名
Ip
地址
块
Cm
鉴权数
oracle01
eth0:
据库
业务支撑
从服务
DELL PC
RedHat
linux
AS
器
数据库
主
DHCP
服务
从
DHCP
服务
oracle02
eth0:
数据库概述
数据库软件分别安装在主服务器上。
/dev/mapper/VolGroup00-LogVol00
逻辑卷上
ORACLE_BASE=/opt/oracle
ORACLE_HOME=/opt/oracle/product/ 10.2.0
ORACLE_SID=oracmts
4
、系统服务程序的详细说明
系统服务程序的构成
DHCP
主程序:
所在服务器
程序名称
所在目录
DHCP
从程序:
所在服务器
程序名称
所在目录
从服务器(
ip:
)
Dhcpd
/opt/dpcp
主服务器(
ip:
)
Dhcpd
/opt/dpcp
系统服务程序的启动、关闭及维护管理
4.2.1 dhcp
主服务
4.2.1.1 dhcp
主服务说明
所在目录
程序名称
程序简要说明
/opt/dpcp
/etc/
/var/state/dhcp/
Dhcpd
Dhcp
主程序
主程序的配置文件
租约数据库
4.2.1.2
dhcp
启动、关闭及进程查看方法
1
、启动方法:
输入
:
cd /opt/dpcp
./dhcpd
即可
注意:请首先确认数据库服务正常,数据库监听正常。
输出
:
[root@localhost dhcp]$$ ./dhcpd
Internet Systems Consortium DHCP Server
V3.0.4
Copyright 2004-2006 Internet
Systems Consortium.
All rights
reserved.
For info, please visit 1
leases to leases file.
Listening
on
LPF/eth0/00:0c:29:fb:d4:32/
on
LPF/eth0/00:0c:29:fb:d4:32/
Socket/fallback/fallback-net
说明
:
dhcp
启动时,会启动
p>
1
个进程,正常情况下,
dhcp
启动的进程数为
1
个。
2
、关闭方法
on
输入:
kill pid
说明
:
pid
为进程号,可使用进程查看获得。如
|-dhcpd(4665)
,则进程
id
为
4665
,则
kill
4665
就可关闭
dhcp
。
3
、进程查看
输入:
[root@localhost dhcp]#
pstree -p | grep dhcp
输出
:
|-dhcpd(4665)
4.2.1.3
配置说明
启动配置文件:
etc/
可使用
more
或者
tail
命令查看
配置服务配置,更改后需要重新启动才能生效,该配置文件的设置需要与从服
务器的配置文件吻合。配置文件全文如下:
#
# DHCP Server Configuration file.
# see /usr/share/doc/dhcp*/
#
ddns-update-style none;
failover peer
{
primary;
address port
519;
peer address peer
port 520;
max-response-delay
60;
max-unacked-updates 10;
mclt 600;
split 128;
load balance max
seconds 3;
}
subnet netmask
}
#---------------cisico1_cm
---------------------------
subnet
netmask option routers filename
next-server
default-lease-time 3600;
pool
{
failover peer
deny
dynamic bootp clients;
range }
}
#--------
-------cisico1_iad---------------------------
shared-network cisico1_iad{
subnet netmask
option routers
servers
default-lease-time 3600;
pool
{
failover peer
option domain-
name-
deny dynamic bootp clients;
range
}
}
}
#------------
---cisico1_cpe---------------------------
shared-network cisico1_cpe{
subnet netmask option routers
option domain-name-servers
default-lease-time 3600;
pool
{
failover peer
deny dynamic bootp clients;
range }
}
}
租约数据库
/var/state/dhcp/
可使用
more
或者
tail
命令查看
记录当前服务器与对方服务
器的服务状态与分配的
ip
租约。
示例如下:
lease {
starts 2 2007/11/27 13:15:22;
ends 3 2007/11/28 13:15:22;
tstp 3 2007/11/28 13:15:22;
binding state active;
next binding state free;
hardware
ethernet 00:11:1a:07:2e:8e;
uid
option 0:11:1a:7:2e:8e;
}
Dhcp
状态如下:
failover peer
my
state
normal
at
2007/11/27 13:15:22
peer state
normal
at
2007/11/27
13:15:22
}
4.2.2
dhcp
从服务
4.2.2.1
dhcp
从服务说明
所在目录
/opt/dpcp
/etc/
/var/state/dhcp/
所在目录
/opt/dpcp
/etc/
/var/state/dhcp/
程序名称
Dhcpd
程序名称
Dhcpd
程序简要说明
Dhcp
主程序
主程序的配置文件
租约数据库
程序简要说明
Dhcp
主程序
主程序的配置文件
租约数据库
4.2.2.2
dhcp
启动、关闭及进程查看方法
1
、启动方法:
输入
:
cd /opt/dpcp
./dhcpd
即可
注意:请首先确认数据库服务正常,数据库监听正常。
输出
:
[root@localhost dhcp]$$ ./dhcpd
Internet Systems Consortium DHCP Server
V3.0.4
Copyright 2004-2006 Internet
Systems Consortium.
All rights
reserved.
For info, please visit 1
leases to leases file.
Listening
on
LPF/eth0/00:0c:29:fb:d4:32/
on
LPF/eth0/00:0c:29:fb:d4:32/
Socket/fallback/fallback-net
说明
:
dhcp
启动时,会启动
p>
1
个进程,正常情况下,
dhcp
启动的进程数为
1
个。
2
、关闭方法
on
输入:
kill pid
说明
:
pid
为进程号,可使用进程查看获得。如
|-dhcpd(4665)
,则进程
id
为
4665
,则
kill
4665
就可关闭
dhcp
。
3
、进程查看
输入:
[root@localhost dhcp]#
pstree -p | grep dhcp
输出
:
|-dhcpd(4665)
4.2.2.3
配置说明
启动配置文件:
etc/
可使用
more
或者
tail
命令查看
.
配置服务配置,更改后需
要重新启动才能生效,该配置文件的设置需要与主服
务器的配置文件吻合。配置文件全文
如下:
#
# DHCP
Server Configuration file.
# see
/usr/share/doc/dhcp*/
#
ddns-update-style none;
failover peer
{
secondary;
address port
520;
peer address peer
port 519;
max-response-delay
60;
max-unacked-updates 10;
mclt 600;
#split 128;
load balance max
seconds 3;
}
subnet netmask
}
#---------------cisico1_cm
---------------------------
subnet
netmask option routers filename
next-server
default-lease-time 3600;
pool
{
failover peer
deny dynamic bootp
clients;
range
}
}
#---------------cisico1_
iad---------------------------
shared-
network cisico1_iad{
subnet
netmask
option routers
option domain-name-
servers
default-lease-time 3600;
pool
{
failover peer
deny dynamic bootp clients;
range
}
}
}
#---------------cisico1_cpe------------
---------------
shared-network
cisico1_cpe{
subnet netmask
option routers option domain-name-
servers
default-
lease-time 3600;
pool
{
failover peer
deny dynamic bootp clients;
range }
}
}
租约数据库
/var/state/dhcp/
记录当前服务器与对方服务器的服务状态与分配的
ip
租约。
示例如下:
lease {
starts 2
2007/11/27 13:15:22;
ends 3
2007/11/28 13:15:22;
tstp 3
2007/11/28 13:15:22;
binding state
active;
next binding state free;
hardware
ethernet 00:11:1a:07:2e:8e;
uid
option 0:11:1a:7:2e:8e;
}
Dhcp
状态如下:
failover peer
my
state
normal
at
2007/11/27 13:15:22
peer state
normal
at
2007/11/27
13:15:22
}
4.2.3 web
管理模块
4.2.3.1
web
管理模块中主要目录说明
/o
pt/apache-2.0.52
为
apache
模块所在目录
/opt/taiyuan
为
web
程序存储目录
4.2.5.2
web
管理模块中各程序说明
命令所在目录:
/opt/apache/bin
命令
apachectl
httpd
ab
apxs
dbmmanage
htdigest
htpasswd
logresolve
rotatelogs
命令说明
Apache
HTTP
服务器控制接口
Apache
超文本传输协议服务器
Apache
HTTP
服务器性能测试工具
APache
功能扩展工具
建立和更新
DBM
形式的基本认证文件
建立和更新摘要认证文件
建立和更新基本认证文件
将
Apache
日志文件中的
IP
地址解析为主机名
滚动
Ap
ache
日志而无须终止服务器
4.2.5.3
web
站点启动、关闭及进程查看方法
命令所在目录
/opt/apache/bin
/opt/apache/bin
/opt/apache/bin
命令
./apachectl
start
./apachectl startssl
./apachectl stop
命令说明
启动
httpd
启动
httpd
并加载
SSL
p>
服务
关闭
apache
/opt/apache/bin
./apachectl
status
查看
apache
的状
态
4.2.5.4
web
日志说明
Log
存放目录为:
/opt/apache/logs
/opt/apache/logs/access_log
为所有访问网站的日志
p>
/opt/apache/logs/error_log
为错误信息日志
/opt/apache/
log
为主进程的
pid
号
/opt/apache/logs/ssl_engine_log
为
ssl
引擎日志,即
ssl
的运行日志,可以通过
查看此日志了解运行状态
及错误。
/opt/apache/logs/ssl_request_log
为
ssl
请求日志
即是哪个
ip
使用
h
ttps ssi
协议登录
web
站点
,请求的时间,内容,访问的页
面等。
4.2.5.5
日常维护
维护分为:业务维护及系统维护
业务维护就是,利用系统管理员的身份,查看操作日志
系统维护是:定期查看系统日志,
apache
日志等,看是否有运行错误,并定期
备份日志。
5
、服务器硬件维护(略)
6
、
linux
系统的
日常维护
定期检查磁盘空间
使用
df
显示磁盘空间
输入:
[oracle@localhost server]$$ df
输出:
Filesystem
1K-blocks Used Available Use% Mounted on
/dev/cciss/c0d0p2 6 7612144 8%
/
/dev/cciss/c0d0p1 101086
12308 83559 13% /boot
none
2073908 4 2073904 1% /dev/shm
/dev/cciss/c0d0p5 185056 1%
/home
说明:
这里显示了
p>
/
、
/boot
、
/home
分区
< br>挂载的系统分区使用的大小,磁盘空间
以
k
为单位。
可以加参数
-h
[oracle@localhost server]$$ df -h
Filesystem Size Used Avail
Use% Mounted on
/dev/cciss/c0d0p2
103G 7.3G 91G 8% /
/dev/cciss/c0d0p1 99M 13M 82M
13% /boot
none 2.0G
2.0G 1% /dev/shm
/dev/cciss/c0d0p5
30G 181M 28G 1% /home
注意:
当某空间使用率超过
85
%时,通过
du
查
看是哪些文件占用的空间比较大
例如
/home
使用了
85
%
cd /home
以
root
用户查看
< br>
su
输入
root
用户密码
[root@localhost
/]# du -m --max-depth=1
-m
是以
M
大小显示
--max-depth=1
表示只是一级子目录的大小,如果
想查看二级的就写为
2
找出占用很大的文件,经判断后决定删除或转移。
使用
top
工具监视
cpu
及内存的使用率
p>
每隔
5
秒,
top
工具确定哪些进程消耗最多的
cpu
时
间,并按递减顺序在屏
幕显示。
输入:
[oracle@localhost /]$$ top
输出:
top -
10:52:46 up 6 days, 39 min, 2 users, load
average: , ,
Tasks: 123 total, 1
running, 122 sleeping, 0 stopped, 0 zombie
Cpu(s): % us, % sy, % ni, % id, %
wa, % hi, % si
Mem: 8247956k total,
1828612k used, 6419344k free, 119476k buffers
Swap: 8385920k total, 0k used,
8385920k free, 1526064k cached
PID
USER PR NI VIRT RES SHR S %CPU %MEM TIME+
COMMAND
1 root 16 0 3004 552 472 S
0: init
2 root RT 0 0 0 0 S
0: migration/0
3 root 34 19 0 0 0 S
0: ksoftirqd/0
4 root RT 0 0 0 0 S
0: migration/1
5 root 34 19 0 0 0 S
0: ksoftirqd/1
6 root RT 0 0 0 0 S
0: migration/2
说明:
当发现个别进程占用率很高,可以通过用“
ps
–
axj | grep
进程名”查
看这个
进程在进行什么操作,如果发现这个进程持续的时间很长,而且非系统必要进
p>
程;可以通过“
kill
–
9
”
p>
进程的
PID
号,将进程杀死。(不确定情
况下,请不要
使用);
退出
top
用
ctrl+c
。
定期查看
root
邮件
输入:
[oracle@localhost log]$$ su -l
Password:
[root@localhost
root]# mail
输出:
1 Fri Sep 8 16:23 18/704
N 2
Fri Sep 8 16:23 18/684
N 3 Fri
Sep 8 16:23 19/748
说明:
<
/p>
前面为
N
的表示新邮件
< br>
可以在
&
后面输入
1
,代表看第一封信,
ctrl+c
表示退出查看这封信,
h
显
示所有的
如果都看过的邮件,就可以通过
< br>d
来删除
如果删除
1
-
10
就用
&d 1-10
这样就会删除
< br>1-10
的信。
定期查看系统日志
系统的日志存储于
/var/log
目录下,需要定期查看,常用日志说明如下:
:
该文件记录了系统在引导过程中发
生的事件,就是
Linux
系统开机自检过程
< br>显示的信息
maillog:
该日志文件记录了每一个发送到系统或从系统发出的电子邮件的活动
messages:
该日志文件是许多进程日志文件的汇总,
从该文件可以看出任何入
侵企图或成功的入侵
lastlog:
该日志文件记录最近成功登录的事件和最后
一次不成功的登录事件,
由
login
生成
wtmp:
该日志文件永久记
录每个用户登录、注销及系统的启动、停机的事件
xferlog:
该日志文件记录
F
TP
会话,可以显示出用户向
FTP
服
务器或从服务器
拷贝了什么文件
cron:
该日志文件记录
cron
tab
守护进程
crond
所派生的子
进程的动作,前面加
上用户、登录时间和
PID
,以及派生出的进程的动作
7
、备份策略
备份方式
为了保证数据库的高安全性,目前我们采用的数据库备份方式为物理备份
和逻辑备份相结
合的方式,数据库归档模式为自动归档模式。这样当数据库出
-
-
-
-
-
-
-
-
-
上一篇:泰语中文翻译100句
下一篇:韩语日常用语中文谐音版-常用韩语中文谐音