<trans-title>Research on Cross-domain Resource Scheduling and Disaster Tolerance Model for Large Enterprise Cloud Stratagy

Xiang HUANG; Guocong FENG; Yunkui SONG; Jianfeng MO; Lei ZHAO

doi:10.16516/j.gedi.issn2095-8676.2020.S2.002

Introduction Traditional large-scale enterprises are geographically dispersed， and information investment is insufficient with high security risks. Cloud computing technology effectively integrates enterprise information resources and builds a large enterprise-level cloud platform. It has become the core supporting platform for the digital transformation of traditional large enterprises. Cross-domain resource scheduling and disaster recovery are key technologies. Method Based on the comprehensive application of cloud computing， big data and traditional disaster recovery technology， this paper explored the implementation model of cloud management requirements such as cross-domain resource scheduling and backup disaster recovery in large-scale cross-regional and hierarchical enterprise cloud platforms. Result After the practice test， the construction goal of unified management of multi-site resources of large enterprise cloud platform， unified use of IT resources， and intelligent completion of global resource balance and disaster tolerance was initially realized. Conclusion The cross-domain resource scheduling and disaster tolerance model recommended in this paper has important guiding role for the construction and management of large enterprise cloud platform.

HTML

随着全球经济产业链中配置分工的变化，我国经济的升级转型正从农业和低端制造业向制造业强国、创新型经济迈进，并制定了“中国制造2025”的宏大蓝图^［1］。传统大型企业作为国家经济的主体，信息化技术是提升企业经营水平、创新企业经营方式，攻坚领域核心技术，提升企业的竞争力的重要助力。

为了解决企业数字化转型、精益化管理等迫切的生存压力，国内企业非常重视云计算技术的研究和应用，建设企业私有云平台，充分发挥资源整合、高效共享、弹性供给、便捷服务的云计算特性，有效实现公司信息化基础架构的革新，进一步提升信息化服务创新的能力，快速响应多元化业务发展的需要。

当前企业私有云案例更多地局限于局部、小范围、一级集中的简单模式。对于地域分布广、资产管理复杂、数字化业务需求庞大的大型企业而言，建立多层级管理、跨域资源调度、具备备份容灾能力的私有云平台，仍是极具挑战性的工作。

本文着重讨论大型企业级云平台的顶层架构设计。结合企业的信息化资源现状和投资渠道，大型企业级云平台应采用多级云架构模式进行建设，由总部主节点和按需建设的多个区域分节点组成，如图1所示。总部主节点建设在总部数据中心，由总部投资兴建，承载一级部署类业务；各分节点建设在各分支的本地数据中心，由分支公司整合利旧资源，遵从总部的云产品体系进行升级改造，承载二级部署类业务。

主节点与分节点之间进行交互，分节点之间不进行交互。主节点与分节点通过云运营管控中心的跨域资源调度和备份容灾体系，形成逻辑上的“大型企业级云平台”。主节点与分节点的云产品体系保持一致，避免多种混合技术带来的集成和调度的困难和工期延误。因此云产品必须具备足够的弹性和兼容性。弹性指云产品需要适应不同的部署资源规模，从研发测试的个位数服务器到上千台的大规模集群；兼容性指云产品要适配主流的服务器、网络产品，同时兼容分节点早期型号的利旧服务器，避免现有投资的浪费。

在规划实施上，大型企业级云平台还面临如下挑战：（1）云平台部署规模的弹性和兼容性；（2）主节点与分节点的数据链路设计；（3）跨域环境的容灾设计。

3 大型企业级云平台的效益分析

长期以来，传统大型企业在信息化基础设施建设方面存在明显短板，如数据中心分散（总部和每个分支独立建设，没有统一的建设和运行标准）、机房空间有限（部分只能租用公有云，存在信息安全及数据风险，难以融合公司本地化IT资源）、机房环境不达标（基建投入不足，部分采用办公空调，恒温恒湿不达标）、安全防护低（受限于信息化支出和本地信息化团队的技能，安全水平参差不齐）等，信息系统的安全稳定运行存在较多隐患，数字化转型的新业务开展困难（数据不流通、属地定制化开发部署、软硬件绑定导致成本高企），制约业务发展。

对于大型企业级云平台的生产效益，本文认为可以从提升业务服务水平、业务创新、成本控制三大角度去考虑。首先，大型企业级云平台整合了大型企业内部分散的资源，做到了应用部署的全局化视角，可以立足本地，在全企业内部实现业务的多活、容灾和数据备份，对于物联网等新形态业务也可以做到就近部署和访问，大大提升了业务的服务水平。例如：云平台镜像的容灾恢复方式比传统备份方式少了数据恢复的过程，将RTO从1 h缩短到10 min，并且容灾的跨度从局部地区到了全国。其次，业务创新对于信息化资源的同构的依赖性，产生了对大型企业级云平台的强需求。业务创新对于需求的变化敏感，如果每个分支机构的修改化需求都需要定制化软件和差异化硬件来实现，对于业务创新来说是巨大的桎枯。大型企业级云平台实现了各地差异化的硬件的标准化、服务化，通过配置化来实现创新业务的快捷部署。例如：以微服务架构开发创新业务，以DevOps模式根据需求滚动更新版本，以配置管理适应各分支的业务定制，可以简化创新应用的落地。最后，大型企业级云平台从以下方面加强了信息化系统的成本控制：（1）大规模云降低了云的建设成本；（2）云运维的自动化程度高，降低了云的运维成本；（3）业务应用的部署在云的各个分支节点趋同，甚至可以从主节点统一下发，降低了应用的部署成本；（4）云业务的弹性伸缩、故障自愈，降低了业务的运营成本；（5）全局统一的“监管控”，增强了企业数据信息的透明度。

4 结论

本文分析了建设大规模、跨地域的全局统一的企业云关键技术的前瞻性研究。并以此为基础提出了大型企业云跨域资源调度与容灾模型的顶层设计、总体架构、技术选型。重点说明了三项企业云跨域资源调度与容灾的关键技术，包括云平台部署规模的弹性和兼容性、主节点与分节点的数据链路设计、跨域环境的容灾设计等。最后，验证了企业云跨域资源调度与容灾模型的应用场景，对于大型企业云平台的建设和管理有重要的指导作用。在模型验证中需要综合云计算、大数据与传统灾备软件，技术实现较为复杂，用户体验一致性不高，完整性有待进一步增强。

Reference (9)

[1]	中华人民共和国工业和信息化部. 《中国制造2025》“1＋X”规划体系［J］. 机械工业标准化与质量，2017（3）：4-4.	Ministry of Industry and Information Technology. Made in China 2025 “1＋X” planning system ［J］. Machinery Industry Standardization & Quality，2017（3）：4-4.
[2]	欧伟新，陈国忠. 云计算及其分布式架构［J］. 电信快报，2012（1）：30-33.	CHEN G Z, 2012: Distributed architecture of cloud computing[J]. Telecom Express, , 30-33.
[3]	刘颖. 基于分布式系统的微服务架构演进［J］. 通讯世界，2018（7）：97-98.	LIU Y, 2018: Evolution of micro-service architecture based on distributed system[J]. World of Communication, , 97-98.
[4]	蒋穗，梁勇，诸旻. 云计算数据中心SDN引入研究［J］. 中国新通信，2016，18（9）：18-19.	JIANG S, LIANG Y, ZHU W, 2016: Study on the SDN in cloud computing centers[J]. China New Communications, 18, 18-19.
[5]	黄红远，李高明，欧阳为年. 一种新型时序数据库在大型配电网自动化系统数据中心中的应用［J］. 中国电业（技术版），2014（7）：35-37.	HUANG H Y, LI G M, OUYANG W N, 2014: Application of a new time series database in data center of large distribution network automation system[J]. China Electricity Industry （Technical Edition）, , 35-37.
[6]	张静妙，高双喜. 商业智能（BI）市场的应用和发展趋势分析［J］. 集团经济研究，2007（22）：69-70.	ZHANG J M, GAO S X, 2007: Trend analysis of business intelligence （BI） market[J]. Group Economic Research, , 69-70.
[7]	王剑鸿. 基于SAN的LANFree集中备份和恢复系统［J］. 电力信息化，2008，6（12）：36-40.	WANG J H, 2008: SAN-based LAN free centralized backup and recovery system[J]. Power Information, 6, 36-40.
[8]	张崟，熊祥鸿，刘建清. 数据容灾技术比较及在电力系统数据中心建设中的应用［J］. 华东电力，2012，40（12）：2249-2252.	ZHANG Y, XIONG X H, LIU J Q, 2012: Comparison of data disaster recovery technology in the construction of power system data center[J]. East China Electric Power, 40, 2249-2252.
[9]	陈亮，陈远斌，姚尧. 高校“双活”架构的虚拟化数据中心［J］. 科学技术创新，2017（21）：150-151.	CHEN L, CHEN Y B, YAO Y, 2017: Virtualized data center of "double live" architecture in universities[J]. Science and Technology Innovation, , 150-151.

Research on Cross-domain Resource Scheduling and Disaster Tolerance Model for Large Enterprise Cloud Stratagy

doi: 10.16516/j.gedi.issn2095-8676.2020.S2.002

Abstract

References

通讯作者: 陈斌, bchen63@163.com

Article Metrics

Related

Research on Cross-domain Resource Scheduling and Disaster Tolerance Model for Large Enterprise Cloud Stratagy

doi: 10.16516/j.gedi.issn2095-8676.2020.S2.002

Digital Grid Research Institute， China Southern Power Grid Co.， Ltd.， Guangzhou 510663， China

HTML

1.1　分布式架构

1.2　集群化架构

1.3　控制执行分离的兼容性架构

2.1　技术难点

2.2　设计模型

2.2.1　统一监控

2.2.2　统一管理

2.2.3　统一控制

3.1　技术难点

3.2　设计模型

3.2.1　统一监控

3.2.2　镜像同步容灾

3.2.3　云平台容灾

1）应用数据的备份与恢复

2）云平台数据的备份与恢复

3）云平台数据的容灾

Catalog

Research on Cross-domain Resource Scheduling and Disaster Tolerance Model for Large Enterprise Cloud Stratagy

doi: 10.16516/j.gedi.issn2095-8676.2020.S2.002

Abstract

References

通讯作者: 陈斌, bchen63@163.com

Article Metrics

Related

Research on Cross-domain Resource Scheduling and Disaster Tolerance Model for Large Enterprise Cloud Stratagy

doi: 10.16516/j.gedi.issn2095-8676.2020.S2.002

Digital Grid Research Institute， China Southern Power Grid Co.， Ltd.， Guangzhou 510663， China

HTML

1.1 分布式架构

1.2 集群化架构

1.3 控制执行分离的兼容性架构

2.1 技术难点

2.2 设计模型

2.2.1 统一监控

2.2.2 统一管理

2.2.3 统一控制

3.1 技术难点

3.2 设计模型

3.2.1 统一监控

3.2.2 镜像同步容灾

3.2.3 云平台容灾

1）应用数据的备份与恢复

2）云平台数据的备份与恢复

3）云平台数据的容灾

Catalog

Export File

Citation

Format

Content

1.1　分布式架构

1.2　集群化架构

1.3　控制执行分离的兼容性架构

2.1　技术难点

2.2　设计模型

2.2.1　统一监控

2.2.2　统一管理

2.2.3　统一控制

3.1　技术难点

3.2　设计模型

3.2.1　统一监控

3.2.2　镜像同步容灾

3.2.3　云平台容灾