实施Windows群集服务
规划的执行情况群集服务
有一些因素来确定当您计划您的群集服务的实施。 几个项目,您应该包括在您的规划阶段这里列出:
- 确定哪些应用程序和网络服务是关键任务应用的组织,需要高可用性。
- 确定哪些集群技术来执行,以确保高可用性的关键任务应用先前确定。 在这里,您应该查明这些申请应使用群集服务,而这些应用程序应使用的NLB 。
- 在您决定了集群技术,你必须确定服务器容量的要求。
- 确定网络的风险。
- 确定所有潜在的点故障和网络连接问题。
- 确定是否是首选节点配置为支持某一特定资源。
- 时间确定故障性质和故障恢复时间,这对你将要执行。
- 确定每台服务器的作用范围内的应用和服务将运行。 服务器可以配置为成员服务器或域控制器。
- 确定群集配置模型符合本组织的要求。
- 在您决定了集群技术和集群配置模式,你必须确定服务器的硬件要求。
- 确定如何在群集服务器将得到保障。
- 确定你要备份数据的聚类。
- 当创建一个新组,您需要提供以下信息:
- 主机名来指定的群集。
- IP地址设置为群集。
- 域名将主办集群。
- 的名称和密码的群集服务帐户。
- 当确定应用集群和故障转移,请考虑以下几点:
- 应用程序使用传输控制协议/ Internet协议( TCP / IP ) ,或者分布式组件对象模型( DCOM )和命名管道,或远程过程调用( RPC ) TCP / IP上的群集功能。
- NTLM验证必须支持该应用程序。
- 应用程序必须能够存储的数据的磁盘连接到共享总线如果要列入容错进程。
要求安装群集服务
有几个要求安装群集服务分列如下:
- 管理权限,需要在每个节点上的群集。
- 应当有足够的磁盘空间系统驱动器上,并共享设备群集服务安装。
- 适当的网络适配器驱动程序必须使用。
- 网络适配器必须有适当的TCP / IP配置。
- 文件和打印共享Microsoft网络已经成为一个节点上安装群集服务配置。
- 节点应该配置相同的硬件和设备驱动程序。
- 每个节点必须属于相同的域。
- 域帐户使用相同的应在每个群集节点。
- 该系统的分页文件必须有足够的空间,以防止性能下降。 当文件没有足够的空间,它可以导致系统锁死。
- 这是良好的做法,审查制度和事件日志之前,并在安装群集服务。
- 然后再安装任何额外的节点群集,首先确保以前安装的节点正在运行。
- 您可以使用系统监视器来解决虚拟内存的问题。
有几个共享磁盘,硬件和网络的具体考虑执行群集服务这里列出:
- 共享驱动器必须实际附加到节点属于群集。
- NTFS文件系统应采用格式的分区的共享磁盘
- 共享磁盘必须配置为基本磁盘。
- 的SCSI驱动器和适配器必须都有唯一的SCSI标识符( ID ) 。
- 每个服务器必须有两个的PCI网卡。
- 存储主机适配器的SCSI或光纤通道必须是独立的。
- 外部驱动器已多重RAID配置驱动器必须连接到服务器的群集。
- 一组必须有一个独特的NetBIOS名称。
- 这些节点的群集的一部分,必须属于相同的域。
规划资源组群集
硬件和软件组件的集群称为资源。 这包括服务和应用的cluster.Resources可分为形成一个资源组。 具体性能的资源组和应用程序或服务确定的方式,资源组转移到离线状态的群集服务。
资源一般包括在资源组是:
- 应用托管
- IP地址
- 网络名称
- 物理磁盘
考虑的因素时,规划资源组为您的集群,以及一些建议,这里列出:
- 资源必须分为基于功能和资源的依赖。
- 当一个资源依赖于另外一个资源,该资源必须居住在同一资源组。
- 资源的相互依存也必须驻留在相同的网域。
- 考虑制定一种依赖树图,以协助时,你正计划资源集团群集。 的依赖树应包含资源集团及其相关相依。
- 您可以使用下面的过程作为准则在规划资源组:
- 确定申请将被设在群集。
- 确定这些资源的群体,需要容错能力。
- 确定相依为每个应用程序。
- 哪些其他资源,如文件共享(而不是应用程序)将列入集群。
所有服务器群集的默认群集组。 默认群集组有以下资源:
- 仲裁磁盘。
- 群集IP地址
- 群集名称
规划容错政策集群
作为规划的一组执行,你必须确定故障政策群集。 容错政策资源集团决定如何处理群集服务的资源启动时故障。
这些选项可以配置来确定故障的政策资源组是:
- 故障时间 ;群集服务启动时的故障恢复过程的资源集团已是一个失败。 资源组,然后转移到花药节点群集。 您可以配置群集服务,试图重新启动的资源,没有资源组收到移动组到其它节点。
- 故障恢复时间 ;失败的资源组移回主节点组的资源时,再次上线。 您可以配置故障恢复只发生在非繁忙时间。
- 推荐节点 ;设置首选节点资源集团确保资源集团是自动搬回到指定的首选节点。
规划安全群集
这一事实本身集群主机关键任务应用和服务,即表明您已经确保群集。
有几个策略,以确保群集这里列出:
- 身体安全的节点群集。
- 限制实际存取集群的基础设施。
- 确保所有的DNS , WINS和DHCP服务器。
- 所有关键任务服务器集群应放在防火墙。
- 使用防火墙配置来控制流量,是针对群集。
- 您应该避免结合集群心跳信息与其他网络流量。
- 只使用几个节点管理服务器群集。
- 安全功能的Windows 2000 , Windows Server 2003和Active Directory的可用于安全应用托管在丛集。
- 分配NTFS文件系统权限的服务器群集,以确保数据。
- 通过配置NTFS文件系统权限,确保只有管理员组的成员和群集服务帐户访问群集仲裁磁盘。
- 群集服务帐户不应该被用来运行应用软件。
- 你应该使用一个独特的群集服务帐户管理每个群集。 这将确保,如果一个帐户受到损害,但不能用在所有的集群。
- 使用domainlets如果你想更好控制的安全边界的服务器群集。
- 您应该定期审计活动的群集。
如何创建新的群集
- 确认只有一个节点相连。
- 确保该节点可以访问共享存储设备。
- 确保网络接口的名称和IP地址。
- 登录到域。
- 单击开始,管理工具,然后单击Active Directory用户和计算机,打开Active Directory用户和计算机管理控制台。
- 导航到用户容器。
- 创建一个群集服务的用户帐户。
- 关闭Active Directory用户和计算机。
- 单击开始,管理工具,然后单击群集管理器,打开群集管理器管理控制台。
- 在打开连接到群集对话框中,单击创建新群集命令在操作菜单上。 单击确定。
- 新的服务器群集向导启动。
- 单击下一步在新的服务器群集向导欢迎屏幕。
- 在群集名称和域网页,提供的名称群集在群集名称文本框中,并指定域的域下拉列表框中。 单击下一步
- 在选择计算机网页,提供的名称,第一台计算机将初始节点在新的集群。 单击下一步。
- 在分析配置页,使用的按钮,可确定哪些活动向导进行核实节点。 单击下一步。
- 在IP地址页面上,输入IP地址为新的群集的IP地址框中,然后单击下一步。
- 当群集服务帐户页面,输入用户名,密码和域详细的群集服务帐户。 单击下一步。
- 现在显示的向导配置为新的组就拟议的群集配置页。
- 按一下按钮选择法定人数仲裁磁盘。 单击确定。
- 精灵明年开始创建新的服务器群集。
- 当创建群集页面时,单击下一步。
- 单击完成以关闭向导。
- 群集管理器的管理工具打开。
- 新的分组显示在群集管理器的管理工具。
- 要配置新的属性组,右键单击群集,然后选择属性从快捷菜单。
集群管理
下列机制可用于管理集群:
- 群集管理器( GUI工具) :群集管理的主要工具是用来管理和排查群集。 群集管理器安装在每个节点上的群集。 您也可以安装群集管理器的电脑上,不属于集束如果你想远程管理群集。
- Cluster.exe (命令行实用程序) :如果您想执行管理任务的组从命令行,那么你可以使用Cluster.exe 。
的行政任务,您可以执行群集通过群集管理器这里列出:
- 查看资料 , 该国的群集 。
- 查看属性的默认群集组,并且默认磁盘组 。
- 名称变更的群集 。 对于群集名称变更,以反映,虽然有你第一次把群集名称资源脱机,然后在线上。
- 创建群集资源 ,并指定资源的依赖性。
- 删除资源 。 您可以删除但只有当所有资源分配给它的依赖性将被删除。
- 创建新的资源组的集群,并配置故障转移和故障恢复政策资源组。
- 删除资源集团群集。 资源的资源组中删除时,一组被删除。
- 应用程序添加到组 :您可以启动群集应用程序向导从丛集系统管理员如果您想应用程序添加到群集。
- 改变所有权的资源组 。 资源可以从一个资源组,另一组,您可以将资源组从一个节点到另一个群集节点的群集。 您通常会改变所有权的资源组维护任务时,必须履行的群集。
- 改变性质的现有资源和资源组 。 您也可以重新命名现有的资源和资源组。
- 改变现状的资源组 。 当你改变现状的资源组,以在线或离线,那么资源的特别小组将自动更新,以反映修改国家的变化。
- 配置的位置法定人数资源和更改默认大小的法定人数日志文件 。
- 您可以发起一个失败的群集 。 这通常会做测试配置故障转移的政策,并测试资源如何重新启动。
如何创建新的资源组
- 单击开始,管理工具,然后单击群集管理器。
- 当打开连接组对话框打开,输入的名称,集群要添加一个新的集团。
- 单击打开。
- 右键单击组,然后选择新建,然后组的快捷菜单。
- 新建组向导启动。
- 在名称框中,输入一个名称为新的组。
- 在说明框中,提供了一个简短的描述为新的组。 单击下一步。
- 输入节点是首选所有者为新的组中的首选所有者列表框中。
- 点击完成创建新组。
如何将资源组到另一个节点
- 单击开始,管理工具,然后单击群集管理器。
- 展开的节点,其中包含资源组要移动。
- 单击Active组。
- 双击组。
- 右键单击资源组要移动,然后选择移动组从快捷菜单。
如何创建一个文件共享资源
- 单击开始,管理工具,然后单击群集管理器。
- 扩大集团的文件夹中。
- 右键单击群集打印机,并选择新建,然后资源从快捷菜单。
- 当新的资源对话框打开,提供了一个名称,说明,资源型和组。 单击下一步。
- 输入适当的节点可能的所有者列表。 单击下一步。
- 新增的依赖资源的资源依存关系列表中,然后单击下一步。
- 当文件共享参数对话框打开,提供共享名称,路径和评论信息。
- 单击完成。
如何创建一个虚拟服务器
- 单击开始,管理工具,然后单击群集管理器。
- 当打开连接组对话框打开,输入的名称群集,然后单击打开。
- 右键单击组,然后选择新建,然后组的快捷菜单。
- 新建组向导启动。
- 在名称框中,输入一个名称为新的组。
- 在说明框中,提供了一个简短的描述为新的组。 单击下一步。
- 输入节点是首选业主的首选所有者列表框中。
- 点击完成创建新组。
- 要创建一个IP地址资源,在群集管理器中,展开组文件夹
- 右键单击虚拟服务器,并选择新建,然后资源从快捷菜单。
- 当新的资源对话框打开,提供了一个名称,说明,资源型和组。 单击下一步。
- 输入适当的节点可能的所有者列表。 单击下一步。
- 确保资源依存关系列表中不包含任何信息。 单击下一步。
- 在TCP / IP地址参数对话框中,提供的地址,子网掩码和网络信息。
- 单击完成。
- 要创建一个网络名称资源在群集管理器中,展开组文件夹。
- 右键单击虚拟服务器,并选择新建,然后资源从快捷菜单。
- 当新的资源对话框打开,提供了一个名称,说明,资源型和组。 单击下一步。
- 输入适当的节点可能的所有者列表。 单击下一步。
- 在资源依存关系列表中,添加的IP地址资源。 单击下一步。
- 进入信息网络名称参数对话框。
- 单击完成。
如何创建一个用户帐户,用于管理集群
- 单击开始,管理工具,然后单击Active Directory用户和计算机,打开Active Directory用户和计算机管理控制台。
- 导航到用户容器。
- 右键单击用户,并选择新建,然后用户从快捷菜单。
- 提供必要的资料的名字,姓氏和用户登录名的文本框。 单击下一步。
- 在密码和确认密码文本框,提供的密码新的集群用户帐户。
- 使用户不能更改密码复选框。
- 启用密码永不过期复选框。
- 单击下一步。 单击完成。
如何暂停和恢复一个节点
- 单击开始,管理工具,然后单击群集管理器。
- 在左窗格中,选择节点要暂停。
- 选择暂停节点命令从文件菜单中的项目。
- 恢复被暂停的节点上,单击开始,管理工具,然后单击群集管理器。
- 在左窗格中,选择的节点是暂停。
- 选择恢复节点命令从文件菜单中的项目。
如何执行维护节点上没有驱逐的节点
- 单击开始,管理工具,然后单击群集管理器。
- 在左窗格中,选择节点要执行维护任务。
- 选择暂停节点命令从文件菜单中的项目。
- 在详细信息窗格中,双击主动组,然后每组执行下列:选择组,选择文件菜单,然后选择移动组命令。
- 着手做了必要的维修节点被暂停。
- 完成后,打开群集管理。
- 在左窗格中,选择的节点。
- 选择恢复节点命令从文件菜单中的项目。
如何执行维护节点上的节点与驱逐
- 单击开始,管理工具,然后单击群集管理器。
- 停止群集服务运行。
- 选择退出节点命令从文件菜单中的项目。
- 删除节点从共享总线。
- 卸载群集服务。
- 着手做了必要的维修任务。
- 完成后,连接的节点的共享总线。
- 安装群集服务,然后加入群集。
如何更改大小的法定人数日志
- 单击开始,管理工具,然后单击群集管理器。
- 在左窗格中,右键单击群集名称,然后选择属性从快捷菜单。
- 开关法定人数标签。
- 变更大小的法定人数登录重置法定人数登录框。
- 单击确定。
群集服务日志文件
当群集服务活动,如当一个新的资源集团是创建发生,事件写入日志文件组。 群集日志包含的信息对每个群集服务活动所发生的群集。 测井是由默认。
群集日志文件的最大大小8MB的,是位于% windir % \集束\ cluster.log目录。 当最大日志文件大小达到事件条目从日志文件中的顺序,他们补充说。
所有群集日志条目有下列资料:
- 进程ID和线程ID导致入境。
- 时间戳
- 事件描述。
由于群集服务包含了若干部分,每个执行特定功能的集群的一个组成部分事件日志条目中包含的信息的互操作的群集服务的组成部分。 A 资源DLL的日志条目另一方面包含的信息是特定于资源群体群集。
中所载资料的一个组成部分事件日志项包括以下内容:
- 该部分结果在事件被记录在案。
- 节点的状态时,活动记录。
- 合并后组成部分和国家。
这里还有一些群集日志条目有一个状态码,错误代码,或国家代码。 一个国家代码与以下类型的对象:
- 网络接口
- 网络
- 节点
- 资源组
- 资源
疑难解答群集服务
有几个策略,您可以使用排查群集服务和服务器群集问题是本节中详细的规定。
群集服务的运作;共享SCSI总线必须存在和必要的SCSI设备必须连接。 一个设备必须存在仲裁磁盘上的共享总线。 有一些系统事件日志错误有关集束SCSI设备的问题。
当故障排除SCSI设备事件日志错误 ,您可以使用下面的清单作为一项准则。
- 内部终端的BIOS中的控制器应禁用。
- 自动SCSI总线重置选项应该禁用。
- 总电缆长度的巴士不得大于最大的SCSI长度确定的制造商。
- 检查是否电缆及连接器引脚身体受损。
- 检查是否有任何松动的连接。
- 检查驱动程序和固件版本是相同的每台服务器驻留在群集。
- 确认SCSI汇流排已正确终止。 检查重复终止。
- 检查是否有重复的SCSI总线上的ID 。
- 如果其中一个群集节点可以连接到群集驱动器和另一个节点不能:
- 确保有问题的节点连接到的群集驱动器。
- 检查的SCSI ID是独一无二的。
- 检查SCSI控制器的正确配置。 他们应该传输数据以同样的速度。
- 相同的驱动器字母应指派的驱动器的每个节点上的群集。
当客户无法访问资源的群集 ,验证以下事项:
- 对于每个群集节点上,研究中的错误系统事件日志中。
- 对于每个资源组无法访问,确保该集团有一个IP地址资源和网络名称资源。
- 对于客户端连接到一个资源组, IP地址资源和网络名称资源应上网。
- 确保网络连接存在的特定节点谁是所有者的资源,因此无法访问。
- 确保客户使用的是正确的IP地址或网络名称连接到该资源在群集。
您可以查看该国的网络接口,和国家的私营和公共网络 , 通过群集管理器 :
网络接口可在以下国家:
- 行动;表明,该接口可以与其他的网络接口。
- 无法使用;表明,该节点的界面了。
- 无法访问;表明,该接口无法与其他接口的网络,是在状态。
- 失败;表明,该接口无法与任何其他的网络接口。 通常情况下造成的网络适配器和驱动器故障,或电缆故障。
私营和公共网络可以在以下国家:
- 行动;表明,界面上的群集可以沟通。
- 降低;表明,界面上的群集不能彼此间的沟通,以及与其他主机。
- 分割;表明,一个或多个接口上的集群是在无法到达的国家,但至少有两个接口的群集可以沟通。
- 无法使用;表明,界面上的群集不可用。
当故障排除仲裁磁盘的问题 ,使用的战略如下:
- 如果仲裁磁盘失败,您无法启动群集服务,然后重新启动群集服务,没有法定人数资源。 一旦启动群集服务指定一个新的仲裁资源。
- 如果仲裁资源无法启动:
- 确保所有的连接和电缆连接。
- 确保SCSI设备得到妥善终止。
- 确保设备的SCSI总线连接,并投入使用。
- 如果法定人数记录已损坏,群集服务首次尝试自动重置日志。 如果群集服务无法启动,因为腐败的法定人数日志中,您必须手动重置法定人数日志。
当故障节点的问题 ,使用的战略如下:
- 如果群集下降,第一次尝试,使一个节点网络。 下一步,检查日志信息以获取更多信息的问题。
- 如果一个节点是下跌,试图使一个节点在线然后检查日志信息供参考。 您应该首先确保尽管资源的失败节点失败到另一个节点的群集。
- 如果一个节点失败后,经营不善,检查是否正在运行的CPU接近百分之百。 您可能已经超载的CPU 。
- 如果群集服务无法启动故障时,节点失败,检查是否正在执行群集服务的更新。 当更新正在执行,群集服务将不会启动故障转移过程。
- 如果资源不回的时间,同时所有的节点业务,检查是否电源失败。 建议您使用不间断电源( UPS ) 。
- 如果一个节点不能访问所有驱动器:
- 检查驱动器之间的布线和节点。
- 检查共享驱动器从另一个节点。
- 检查配置群集。
- 检查您是否可以访问该驱动器从一个不同的节点。
- 如果您无法连接到一个节点使用群集管理器,检查是否群集服务, RPC服务和节点的运行。
当故障排除资源组的问题 ,使用的战略如下:
- 如果你不能把一个资源组在线:
- 确保该磁盘可以被访问。
- 检查是否硬件问题或配置问题存在的磁盘资源的问题组。
- 检查是否所有的依赖资源已经明确。
- 移动资源组到另一个节点,然后检查是否可以联机。
- 企图使每项资源集团在线一次。
- 如果一个资源组不容错到另一个节点的群集:
- 确保资源的影响组选项已被选中。
- 确保节点中指定可能的所有者名单资源。
- 如果一个资源组未能超过,但没有重新启动:
- 检查节点在线。
- 检查中的信息可能所有者列表组和资源。
- 试图查明的资源,是个大问题,使每项资源在线一次。
- 如果一个资源组不失败回:
- 确认您期望的节点的资源不能回的定义是首选所有者的资源组。
- 确认允许故障恢复选项已被选中。
- 确认防止故障恢复复选框是明确的。
当故障排除资源问题 ,使用的战略如下:
- 如果你不能把一个资源在线:
- 检查是否已安装的应用程序。
- 检查是否正确配置资源。
- 确认资源的可运行群集服务。
- 如果某一特定资源并不故障:
- 请检查设备的配置是否正确。
- 请检查设备和电缆业务。
- 如果资源没有失败回:
- 检查硬件工作正常。
- 验证网络连接的业务。
- 检查配置的故障恢复的政策。
- 如果没有资源不会再次上线:
- 检查不重新启动选项的资源处于未选中状态。
- 检查是否没有门槛的资源已达到
- 检查是否有任何依赖的资源是离线。
- 检查所有相依的资源已被正确配置。
- 当你的IP地址资源的问题,确保IP地址是独一无二的。 下一步,确保子网掩码定义是正确的。 您可以使用Ping实用工具来测试IP地址资源。
- 当你有网络名称资源的问题,验证IP地址资源的依赖网络名称资源配置正确。 IP地址资源的依赖应该线上。
- 当您打印后台处理程序资源的问题,验证物理磁盘资源和网络名称资源相依的打印后台处理程序资源的正确配置和在线。 检查是否有任何NTFS权限阻止访问。 这个问题也可能是由于充分后台打印目录的磁盘。
- 当你有文件共享资源的问题,确保网络名称资源和物理磁盘资源依存关系和所有其他相依的业务。 确保该文件共享的目录已创建,它可以访问。 检查是否有任何NTFS权限,这是防止对文件共享的访问。
|
书签实施Windows群集服务

