高可用 (HA)
高可用(HA)是太一云 0.11.0 版本新增的核心功能,用于提升集群的可靠性和业务连续性。当启用高可用后,系统可以在节点故障时自动迁移云主机,确保业务不中断。
高可用概述
基于后端存储,当计算资源池 HA 开关打开后,如果某台宿主机突然挂了或者断网,计算资源池会自动把它承载的云主机迁移到正常节点上拉起,尽量保障业务不中断。

启用高可用
要启用高可用功能,需要按照以下步骤操作:
- 进入「集群管理」>「资源池」页面
- 选择要修改的资源池,点击「修改配置」
- 在「启用高可用」选项中,将开关切换为开启状态
- 确保资源池已关联后端存储(高可用功能依赖后端存储实现)
- 点击「提交修改」完成配置
高可用工作原理
当启用高可用后,系统会持续监控资源池中的节点状态。如果检测到节点故障(如宕机、网络中断等),系统会自动执行以下操作:
- 识别故障节点上运行的云主机
- 在资源池中的正常节点上重新创建这些云主机
- 通过后端存储恢复云主机的磁盘数据
- 启动云主机,恢复业务运行
注意事项
- 高可用功能依赖后端存储,确保已正确配置后端存储
- 为了保证高可用效果,建议资源池中有多个节点
- 启用高可用后,系统会增加一定的资源消耗,用于监控和故障转移
- 云主机的迁移和重启可能会导致短暂的业务中断,建议在业务低峰期进行相关操作
验证高可用
要验证高可用功能是否正常工作,可以进行以下测试:
- 在启用了高可用的资源池中创建一台云主机
- 模拟节点故障(如关闭节点服务器或断开网络连接)
- 观察系统是否自动将云主机迁移到其他正常节点
- 检查云主机是否成功启动并恢复服务
通过高可用功能,太一云集群可以提供更高的可靠性和业务连续性,适合对服务可用性要求较高的生产环境。