减少停机时间升级
What’s New in vSphere 8 Update 2?
https://core.vmware.com/resource/whats-new-vsphere-8-update-2#section2
从vSphere 7 Update3 版本开始,VMware 官方开始将用于VMC on AWS 公有云环境中,版本更新和升级机制尝试落地,也就是由Project Arctic 专案所演化而来的API-Driven 技术,套用至企业和组织的地端资料中心内,推出vCenter Server Reduced Downtime Upgrade(RDU)特色功能,让vCenter 管理平台,在执行安全性更新或版本升级时,能够将停机时间最大化缩短,在最新的vSphere 8 Update 2 版本中,甚至能将版本更新或升级作业程序的停机时间限缩在5 分钟之内。
RDU 运作机制
那么新版RDU 运作机制,如何改善过往版本更新或升级的工作流程,有效降低vCenter 管理平台停机时间呢?
首先,在阶段1 工作程序时,系统将会基于管理人员挂载的新版本vCenter ISO 映像档,建立和部署新版本vCenter 虚拟主机并Power On 开机(如图1 所示)。
图1、vCenter RDU 更新升级版本工作流程– 阶段 1
当系统顺利部署新版本vCenter 虚拟主机并开机完成后,便会进入阶段2 工作程序,系统将会自动为旧版本vCenter 管理平台,开启SSH Service(Port 22)之后,传送现有vCenter 资料库和相关组态设定档至新版本vCenter 主机内(如图2 所示)。
图2、vCenter RDU 更新升级版本工作流程– 阶段 2
当资料传输作业完成并且通过系统检查程序后,将会进入阶段3 工作程序,系统显示「切换」(Switchover)钮可以执行。请注意,更新升级版本工作流程至此都未发生任何停机时间,只有当管理人员按下切换钮,并且新版本vCenter 主机接手完成的这段期间(通常在5 分钟内),才会发生停机时间(如图3 所示)。
图3、vCenter RDU 更新升级版本工作流程– 阶段 3
一旦新版本vCenter 主机接手完成后,正式取代旧版本vCenter 的FQDN 及IP 位址……等,此时便进入阶段4 工作程序,系统将会自动将旧版本vCenter 主机关机,并且清除过程中产生的暂存资料(如图4 所示)。值得注意的是,在RDU 版本更新升级机制的帮助下,确实能有效避免vCenter 管理平台,在执行版本更新或版本升级时可能导致系统损坏的情况,并有效减少过程中产生的停机时间,然而它并不能够取代企业或组织原有的vCenter 备份机制,这是管理人员最容易忽略的地方。
图4、vCenter RDU 更新升级版本工作流程– 阶段 4
云端环境的vSphere+ 更新机制重点为「迁移」(Migration-Base),在版本更新或升级动作执行之前,预先部署新版本的vCenter 管理平台,并将旧版本vCenter 资料库和组态设定等资料,传输复写至新版本vCenter 主机内,届时只要进行新旧版本的vCenter 管理平台切换作业即可。
然而,和过往版本更新升级工作流程最主要的差别在于,新旧版本vCenter 管理平台之间,在vCenter 资料库和组态设定资料复写期间,旧版本的vCenter 管理平台仍然能够正常运作,执行相关进阶特色功能并管理虚拟化基础架构,整个版本更新升级工作流程中,唯一会产生停机时间的部份,就是在vCenter 资料库和组态设定复写程序完成后,管理人员正式触发切换工作任务,将旧版本vCenter 停止系统服务,由新版本vCenter 接手后启动系统服务的这段期间,原则上来说会在五分钟之内完成,这和过往版本更新升级的停机时间相比减少许多。
新式RDU 版本更新升级机制,如下所条列共有五个步骤(如图5 所示),管理人员也可以在实际操作期间,查看每个工作任务的执行进度:
1. 挂载ISO 映像档: 将准备部署新版本的vCenter ISO 映像档进行挂载。值得注意的是,这个vCenter ISO 映像档必须是完整的安装ISO 映像档,而非仅是含有安全性更新或修补臭虫的ISO 映像档。
2. 检查备份: 系统将会进行检查和确认,运作中的旧版本vCenter 管理平台,是否已经执行过备份的工作任务,倘若发现vCenter 管理平台未定期执行备份,或未包含最新的备份时,将会提醒管理人员必须执行备份工作任务后,再回到此页面继续版本更新升级流程。
3. 更新LCM Plugin 外挂程式: 系统将会在旧版本vCenter 管理平台中,更新vCenter LCM 生命周期服务的Plugin,以便后续部署新版本vCenter 管理平台时,能够在LCM Plugin 方面保持一致,一旦LCM Plugin 外挂程式更新完毕后,系统将会自动重新整理vCenter 管理介面,管理人员可以轻易发现管理介面有些许不同。
4. 组态设定新的vCenter: 针对部署的新版本vCenter 主机进行组态设定作业,包括,vCenter 虚拟主机名称、临时的root 管理帐号和密码、临时的vNetwork 虚拟网路设定……等,管理人员可以选择继承旧版本vCenter 原有的组态设定,也可以选择自行变更组态设定内容。在预设情况下,部署的新版本vCenter 主机,将会继承旧版本vCenter 主机中,FQDN、IP 位址、root 管理帐号密码和网路身份验证……等。
5. 升级与执行切换: 一旦部署的新版本vCenter 主机复写资料和组态设定完毕,并且两台vCenter 主机都保持正常运作状态时,管理人员便能决定何时执行切换作业,原则上可以立即执行切换vCenter 管理平台的工作任务,也可以排程设定一天后或一周后都可以。值得注意的是,切换期间原有vCenter 停止服务,新部署的vCenter 接手并启动服务,通常还是未产生五分钟之内的停机时间。
图5、RDU 版本更新或升级运作流程示意图