研究意义
工业物联网数据管理与数字中国基础设施建设紧密相关,是支撑提取工业大数据价值的基础。由于工业物联网数据源于设备, 工业物联网数据管理系统面临着数据量、数据到达速度、负载多样性等更严峻的大数据挑战。为了应对这些挑战, 工业物联网数据管理系统必须进行负载均衡, 以充分利用可扩展的计算资源、提升系统性能。
工业物联网数据管理系统所接受的读写负载分布与均匀分布相差甚远,使用经典的静态负载均衡方法如一致性哈希, 容易导致对系统计算资源利用的不均衡、不充分, 降低计算资源利用率, 浪费计算资源, 难以解决工业物联网时序数据管理的根本挑战。近年来的一些研究工作虽然提出了细粒度的启发式动态负载均衡方法,但已有工作都未充分考虑工业物联网时序数据应用的典型负载特性,即:数据写入存在明显的时间排序关系, 且写入以追加为主, 而查询则以近期数据为主, 从而导致相关研究工作应用到工业物联网数据管理场景会在负载均衡和数据迁移过程中引入不必要的代价。
本文工作
为有效应对工业物联网数据管理中的大数据挑战,本文根据清华大学获日内瓦国际发明展金奖的开源时序数据管理系统项目IginX中对时序应用负载的深入分析结果,基于面向时序数据负载读写分离特性设计的存储计算分层架构及数据空间模型(如图2所示),以读写差异化均衡为约束,建模了负载均衡最优化问题,以匹配工业物联网数据的读写分离特性;提出了负载均衡方案TsLBOpt, 集成了简化系统架构的非侵入式负载统计与估算方法, 利用分片细分与自适应复制以扩充解空间的整数规划最优化求解方法, 以及基于贪心策略最小化数据迁移代价的数据重分布方法, 形成如图1所示的高效的负载均衡过程。
本文的主要创新点为:
(1)针对物联网时序数据库写入和查询发起端一般不同的典型特点, 基于存储/计算分层的物联网数据管理系统高效架构, 提出了以非侵入方式利用计算层的观测值来逼近存储层的负载和性能分布, 支持负载均衡决策, 免去对部署环境条件的强要求, 扩展了系统应用范围。
(2)利用工业物联网时序应用负载写入的有序性和无穷性, 结合开源系统IginX(https://iginx-thu.github.io/IGinX)可解决传感器测点数目剧增挑战的二维无穷平面数据空间模型, 建模了以读写独立均衡为约束条件的时序数据负载动态均衡最优化问题, 引入整数线性规划算法求解, 并针对不适合直接求解的情况, 给出了分片细分与自适应复制结合的启发式解决方案。
(3) 基于负载均衡最优化问题的求解结果, 提出了支持不同数据分布方案切换的迁移算法, 面向迁移成本最小化的目标, 构建了贪心策略的求解方法。
实验结果
本文提出的TsLBOpt方法基于开源系统IginX进行了实现和集成, 利用知名测试基准TSBS在真实物理集群上, 进行了大规模的测试. 真实负载测试表明, 本文提出的TsLBOpt相比常用的哈希方法、经典的热数据优先迁移启发式方法、前沿工作DynaHash分别可提升系统整体性能达2倍、10倍、4倍以上。
负载均衡方法对于集群系统的弹性支持具有重要作用, 好的负载均衡方法可使系统在资源规模增加或减少后, 依然能保证系统对资源的高效利用. 在系统弹性伸缩的实验中, TsLBOpt方法使得系统性能随资源增加得到相应提升, 在系统资源减少时也能将移除节点上的数据和负载迁移到在线节点上, 使得集群保持正常运行。
基于计算、存储资源异构, 以及基于存储组件异构的集群测试表明, 以非侵入方式利用计算层的观测值来逼近存储层的负载和性能分布的方法, 可有效支持负载均衡决策, 这使得TsLBOpt不仅可有效应用于同构集群系统中, 同时, 还适用于资源异构、组件异构的异构集群系统中, 匹配工业物联网典型的云、边、端互联的异构应用场景需求。
实验结果证明, 本文提出的方案适用于物联网时序数据管理集群系统, 且相较于现有相关工作, 可使系统具备显著的性能优势, 能够有效解决工业物联网云、边、端数据管理复杂应用场景的典型挑战。
研究团队
张凌哲, 朱妤晴, 安彦哲, 訾源, 王建民: 清华大学
文章下载
张凌哲, 朱妤晴, 安彦哲, 訾源, 王建民. 工业物联网数据管理中的系统负载均衡最优化问题及其求解. Sci China Inf Sci, 2024, doi:10.1360/SSI-2023-0211
版权声明:本文内容转自互联网,本文观点仅代表作者本人。本站仅提供信息存储空间服务,所有权归原作者所有。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至1393616908@qq.com 举报,一经查实,本站将立刻删除。