-
高可用性
(
HA
)集群
实现不间断
应用
2006-02-24 09:32:01
高可
用性(
HA
)集群通过一组计算机系统提供透明的冗余
处理能力,从而实现不间断应用的目标。
高可用性(
High Availability
,简称
HA
)集群是共同为客户
机提供网络资源的一组计算机系统
。其中每一台提供服务的计算机称为节点
< br>(Node)
。当一
个节点不可用或者不能处理客户的请
求时,该请求会及时转到
另外的可用节点来处理,而这些对于客户端是透明的,客户不<
/p>
必关心要使用资源的具体位置,集群系统会自动完成。
HA
集群系统硬件拓扑形式
基于共享磁盘的
HA
集群系统通过共享盘柜实现集群中各
节点的数据共
享,包含主服务器、从服务器、存储阵列三种主
要设备,以及设备间的心跳连接线。
p>
而基于磁盘
镜像的
HA
集群系统不包含存储阵列。
集群中两
种服务器的本地
硬盘
通过数据
镜像技术,实现集群中各节点之
间的数据同步,从而实现集群的功能。
< br>
实际应用中,
将节点
1
配置成
“
主服务器
”
,
节点
2<
/p>
配置成
“
从
服务
器
”
,
主从服务器有各自的
IP
地址,
通过
HA
p>
集群软件控制,
主从服务器有一个共同的虚拟
IP
地址,
客户端仅需使用这个虚
拟
IP
,
而不需要分别使用主从
IP
地址。
这种措施是
HA
集群的
首要技术保证,
该技术确保
集群服务的切换不会影响客户
IP
层
的
访问。
公网(
Public Network
)是应用系统实际提供服务的网络,
私网(
Private N
etwork
)是集群系统内部通过心跳线连接成的
网络。
p>
心跳线是
HA
集群系统中主从节点通信的物理通道,通过
HA
集群软件控制确保服务数据和状态同步。
不同
HA
p>
集群软件
对于心跳线的处理有各自的技巧,有的采用专用板卡和专用
的
连接线,有的采用串并口或
USB
口
处理,有的采用
TCP/IP
网
络处理
,其可靠性和成本都有所不同。近几年,基于
TCP/IP
技术
的心跳线因其成本低、性能优异而被广泛采用。具体实现
中主从服务器上至少各需配置两
块网卡。
HA
集群软件体系结构
HA
集群软件是架构在
操作系统
之上的程序,
其主要由守护
进程、应用程序代理、管理工具、开发脚本等四部分构成,应
用服务系统是为客
户服务的应用系统程序,比如
MS SQL
Server
p>
,
Oracle
,
Sybase
,
DB2 UDB
,
p>
Exchange
,
Lotus
Notes
等应用系统软件。
p>
不是每一个应用程序都能够实现
HA
集群管
理,
也不是每一
个
HA
集群软件可以管理所有的应用程序,这是因为其代理模
块
(Agent)
有不同的功能。
HA
软件的代理模块一般支持使用频
度最高的软件,如上述所列举的
数据库
系统和邮件系统,但为
了能够支持更多应用实现
HA
集群,有的
HA
软
件开放二次开
发接口。
主从节点资源配置
HA
集群软件的本质是当主服务器出现故障时,
从服务
器及
时接管主服务器的资源,这些资源包括处理器、内存进程和磁
盘数据。接管进程意味着接管该服务进程的内存数据列表,采
用共享磁盘技术方式的集
群无需做存储数据接管,采用磁盘镜
像技术方式的集群则使用本机的存储数据。
主从服务器的资源(处理器、内存、磁盘)
配置具有科学
性和技巧性。系统物理内存过低,会使系统频繁使用效率低下
的
“
虚拟内存
”
,
导致系统反应迟钝,
也使得客户端响应缓慢,<
/p>
甚
至出现
“
系统
服务超时(
Timeout
)
”
形态的系统报错,没有达到
高可靠的目的。
所
以,
HA
集群系统要求从服务器
(故障
切换节
点)的内存容量应不小于主服务器的内存容量,其内存配置应
该至少为应用系统对内存的基本需求。
从节点服务器需要的
CPU
数量应以不间断客户服务为
目
的。其
CPU
处理能力应不小于主服
务器的
CPU
处理能力,若
板卡、
p>
CPU
等型号相同,从服务器的
CPU
p>
个数应不少于主服
务器的
CPU
个数。
采取磁盘镜像
的从服务器存储空间应不小于主服务器存储
空间。
总之,从节点资源的各项指标应该不低于主节点资源的各
p>
项指标。若系统采用多个主节点向一个从节点容灾时(
N+1
模
式),从节点资源的配置策略需要依据系统管理员对整个系统
定义的容灾安全级别来确定。假如主节点的个数为
M
< br>,从节点
的个数为
1
,系统管理
员定义允许同时容忍
N
(
N≤M
)个主节
点宕机,那么从节点的资源配置应为最大前
< br>N
个主节点资源的
各项指标之和。
HA
集群部署模式
主
/
主
p>
英文名称
“Active/Active”
,这是最常用的集群模型。
它提供了高可用性,并且在只有一个节点在线时提供可以接受
的性能。该模型允许最大程度利用硬件资源。每个节点都通过
网
络对客户机提供资源,每个节点的容量被定义好,使得性能
达到最优,并且每个节点都可
以在故障转移时临时接管另一个
节点的工作。所有的服务在故障转移后仍保持可用,但是
性能
通常都会下降。
-
-
-
-
-
-
-
-
-
上一篇:midas一些名词解释
下一篇:通俗易懂的讲解:二叉树是什么_华清远见