跳到主要内容

高可用 (HA)

高可用(HA)是太一云 0.11.0 版本新增的核心功能,用于提升集群的可靠性和业务连续性。当启用高可用后,系统可以在节点故障时自动迁移云主机,确保业务不中断。

高可用概述

基于后端存储,当计算资源池 HA 开关打开后,如果某台宿主机突然挂了或者断网,计算资源池会自动把它承载的云主机迁移到正常节点上拉起,尽量保障业务不中断。

ha-config

启用高可用

要启用高可用功能,需要按照以下步骤操作:

  1. 进入「集群管理」>「资源池」页面
  2. 选择要修改的资源池,点击「修改配置」
  3. 在「启用高可用」选项中,将开关切换为开启状态
  4. 确保资源池已关联后端存储(高可用功能依赖后端存储实现)
  5. 点击「提交修改」完成配置

高可用工作原理

当启用高可用后,系统会持续监控资源池中的节点状态。如果检测到节点故障(如宕机、网络中断等),系统会自动执行以下操作:

  1. 识别故障节点上运行的云主机
  2. 在资源池中的正常节点上重新创建这些云主机
  3. 通过后端存储恢复云主机的磁盘数据
  4. 启动云主机,恢复业务运行

注意事项

  • 高可用功能依赖后端存储,确保已正确配置后端存储
  • 为了保证高可用效果,建议资源池中有多个节点
  • 启用高可用后,系统会增加一定的资源消耗,用于监控和故障转移
  • 云主机的迁移和重启可能会导致短暂的业务中断,建议在业务低峰期进行相关操作

验证高可用

要验证高可用功能是否正常工作,可以进行以下测试:

  1. 在启用了高可用的资源池中创建一台云主机
  2. 模拟节点故障(如关闭节点服务器或断开网络连接)
  3. 观察系统是否自动将云主机迁移到其他正常节点
  4. 检查云主机是否成功启动并恢复服务

通过高可用功能,太一云集群可以提供更高的可靠性和业务连续性,适合对服务可用性要求较高的生产环境。