全面解析云智慧数据中心统一运管解决方案

云智慧 AIOps 社区是由云智慧发起,针对运维业务场景,提供算法、算力、数据集整体的服务体系及智能运维业务场景的解决方案交流社区。该社区致力于传播 AIOps 技术,旨在与各行业客户、用户、研究者和开发者们共同解决智能运维行业技术难题,推动 AIOps 技术在企业中落地,建设健康共赢的AIOps 开发者生态。

引言

2020年,数据中心建设被中央正式列入新基建战略,与此同时,疫情下数字经济及IT国产化的高速发展也催生了各行各业对数据中心的新需求,即在加大建设投入的同时,更要保证其运行稳定及服务可用。此外,我国当前数据中心建设仍面临着布局结构性失衡、能耗水平居高不下等问题。因此,推动企业数据中心朝着绿色、安全、高效的方向进一步发展以及解决能耗、需求匹配等难题是当前数据中心的的首要任务。

趋势解读

从企业内部运营目标来看:管理数字化、流程规范化、人员专业化、技术标准化、运维自动化都会成为核心诉求。此外,在Gartner最新发布分析报告中,通过对全球400多位 I&O 领导者调研总结,给出了以下三条DCIM(Data Center Infrastructure Management)领域发展建议:

需求与挑战

通过持续地落地实施与走访调研,大多数企业会以提高数据中心 ROI 为最终目标来开展建维工作。因此,保障数据中心业务连续性也会被当作当前阶段重要目标,并且会以场景关联人员周期、资产生命周期、管理周期三环,提供“人、事、物”综合管理的能力。

此外,当前阶段数据中心管理仍面临以下三大类问题:

整体业务发展问题:涵盖范围广、扩张速度快、运维成本高;运维技术(数据+工具)问题:设备定位难、工具智能化不高、数据利用率低;精细化管理支撑问题:资产盘点慢、资源规划难、安全管控难。

解决方案与功能场景介绍

基于以上需求及挑战,云智慧为企业提供数据中心统一运管解决方案,帮助企业实现对数据中心基础设施层面人、事、物的全面智能化管控。

整个解决方案包括软件和IoT智能硬件两部分。其中软件平台部分帮助用户实现数据中心业务管理智能化,为企业赋能多样化能力:如多平台整合、大数据运维、自动化运维、规划设计、决策支撑等; 而IoT智能硬件部分则是帮助用户重点实现数据中心资产管理智能化,以及通过丰富的感知器从数据源头控制资产生命周期的时效性与准确性。

此外,通过众多落地案例,云智慧总结了数据中心运维过程中最有代表性的六大场景,包含全资源管理、运维监控、统一调度、全景可视、智能分析、方案推荐。下面我们将对相关场景做详细介绍:

针对新形态数据中心资产管理的创新型需求,通过“软件+硬件+流程引擎”为一体的资产管理解决方案,实现资产管理的智能化、自动化全生命周期管控,帮助客户有效降低资产总体拥有成本:

•通过资产库存管理功能,为客户降低IT资产的追踪成本,减少资产销账。

•通过利用率分析,帮助客户快速检索闲置资产,提高资产利用率

•通过资产安全管理,降低资产损坏以及由于数据丢失而导致的额外费用,降低资产缩水风险

•通过保养和配置管理,帮助客户降低保养、维修和召回的费用,减少汇报的需求

•最后协助客户提升操作的合规性。

统一营维平台是将数据中心内包含的资产、容量、线缆、供电、制冷、能耗、环境、微环境、运算等资源进行了有效整合与利用,实现了跨专业、跨区域、跨范围的资源整合与管理。 此外,结合自有精确到U级定位硬件,通过灵活可配的流程管理引擎,对各形态资产从验收到报废全运维生命周期的状态及位置进行实时评估和跟踪,从而实现资产管理的精细化、标准化、无纸化,以此保证资产数据的持续准确有效,降低人为操作风险。

统一运维平台是在上述资产全生命周期管理的基础上提供了基础环境的全覆盖监控,包括机房环境、机柜微环境以及基础资源。

下图展示了云智慧可以监控的典型资源与对应的告警类别。特别是对于机柜级微环境的温湿度的实时监控能力,弥补了当前绝大部分数据中心管理的空白。例如:云智慧可以监控每个机柜的局部制冷量,避免过度制冷或者局部过热导致的IT设备运行故障。

此外,云智慧还结合了基于“规则+算法+LED定位”的自动预警、告警功能为运维人员提供更快速、更准确的故障发现与处置手段,从而提升了整个业务系统的可用性。如:当发生温度预警/告警时,云智慧统一运管平台可通过LED灯的闪烁或高亮给予运维人员直观的指示;此外,系统还可以通过3D可视化、2D图表等人机交互界面,对数据中心内的全部资源及子系统进行集中管理智慧资产管理,以及利用数据处理引擎对数据进行多维度的处理与分析,不断对故障预警的时效性和准确性进行提升;最后,还可以通过友好的交互界面、集中统一管理、集中告警呈现、多维信息融合、问题快速溯源、故障影响判断等能力,真正做到统一平台界面的综合类监控交付。

数据中心的安保级别通常较高,监控不到位就会导致非法入侵、人员违规行为等危险行为,若未及时纠正规范,就会对数据中心安全可能造成严重威胁。

云智慧方案通过监控视频、红外遥感、人脸识别、门禁系统等功能对园区各进出场景跟踪记录,针对异常人员行为分析及跟踪警告。系统通过巡查人员的手持设备记录每个巡查点的准确时间和数据,从而使得巡查人员按照手持设备中的巡查计划依序巡查每个巡查点,得到数据采集后再把手持设备的信息录入到系统,从而得到准确全面的巡查数据。

下图为云智慧具有代表性的案例截图。 在实际企业落地过程中,以下功能可以进行组合分拆,以满足企业对安全管理的个性化要求。

云智慧为企业提供了内容完整、流程标准的运维服务功能,以实现数据中心日常运维的流程化、标准化、精细化。此外,云智慧通过帮助企业建立快速响应并适应企业业务环境及发展的基础设施运维模式,实现类比 ITIL 的流程框架、运维自动化管理,从而转变企业基础设施运维的环境,使得基础设施运维各部门和IT运维部门领导者能够拥有统一的语言、统一的界面来面对各项挑战以及理解新变化所带来的影响。 与此同时,云智慧会为企业提供丰富的移动端应用,实现多渠道协同办公。云智慧的移动应用可以兼容市面上绝大多数的移动平台——无论是操作系统还是终端设备类型,给企业带来更便捷的使用体验。

云智慧利用强大的可视化引擎,将多维度动态数据融入到数据中心园区、楼宇、设备、设施、管路、桥架等实物3D之中,实现全元素三维可视化。此外,云智慧提供了强大的2D/3D 可视化自动切换展现、自定义路线巡游、第一视角参观功能,并且可通过鼠标、键盘的简单操作即可实现数据的查询、检索、分类、定位等功能智慧资产管理,大幅地改善了普通静态界面的单调、交互性差、操作和信息传递效率低、决策和响应度慢等问题,让运维工作变得简单、直观、灵活、高效。

正如行业趋势分析中提到的“数据中心面临日益增长的资源和电力需求”,电力效率以及功率密度方面的问题已成为影响企业可持续发展的重要因素,因此容量管理成为数据中心运营的重要关注点。

云智慧解决方案通过外部采集设备、设施进行数据整合,并通过后台AI算法计算出数据中心实时的PUE、CLF、PLF、WUE等能耗指标;此外,还可以按设备类型、机房区域等方式进行分类统计分析,必要时可形成热度图、趋势图。与此同时,系统能够将能耗成本、能耗组成情况进行ECC大屏等多种形式展现,同时可根据变化趋势及时地进行信息预判,结合特定的算法模型分析效率损失的原因,协助企业从整体上改善效能。

云智慧通过“数据+算法+报告”相结合的形式,为决策提供有力依据。例如:云智慧支持对资源的统筹、规划与管理,实现现有资源的充分评估、利用。此外,还可通过丰富的筛选条件,快速、准确定位业务可用区域,提高资源利用率。在资源规划设计或割接环节中,云智慧可进行资源预调配(演练),模拟构建方案,根据算法引擎进行预部署的自动演算,生成计划方案与分析报告,还可模拟故障影响范围,实现关键设备影响分析的快速判断,并生成影响方案与分析报告。通过上述这些手段可以帮助企业提高SLA、规避风险、提供可靠的决策依据。

案例介绍

中移物联网智慧资产管理系统基于二维码、RFID技术,结合资产的“价值管理”与“实物管理”的核心需求,实现对资产全生命周期流程管理、实地极速盘点、资产实地视频及物理指标(温度、湿度等)监控及告警。同时基于OneNET提供的出色数据处理能力,实现资产数据的智慧分析与处理。

本系统全面、准确、动态掌握各单位(部门)固定资产的总量、构成、分布、变动等信息,解决资产管理中存在的实物资产与账面资产脱节的问题、实物资产的清查盘点瓶颈问题,提高固定资产的利用率,节省资产的投资,进而提高资产的规范化和科学化管理水平。

项目框架

以OneNET设备云的泛连接和海量数据为分析基础,通过大数据分析引擎,为企业资产管理、资产评估、决策提供更为可靠的依据。采用B/S架构,软件全部固化,免除了用户复杂的软件安装配置操作,使用标准的浏览器即可对机房环境和机房设备实施远程监控智慧资产管理,方便,可靠,安全!

具体实现

物联网终端设备:支持市场上常见的二维码扫读器、RFID读写器、RFID门禁、RFID远距离读卡器等终端,方便用户接入系统,提高资产管理效率;

物联网设备接入协议:支持常见的2G/3G/4G/WIFI等无线网络接入方式,方便终端设备与系统连接;

基础服务OneNET:结合OneNET设备云的泛连接、海量存储、大数据分析、可信云等优势,提高系统的实用性和可靠性;

智慧资产管理:全面、准确、动态(及时)掌握各单位(部门)固定资产的总量、构成、分布、变动等信息智慧资产管理,解决资产管理中存在的实物资产与账面资产脱节的问题、实物资产的清查盘点瓶颈问题,提高固定资产的利用率,节省资产的投资,进而提高资产的规范化和科学化管理水平。

引入目前国际流行的企业资产管理 (EAM: Enterprise Asset Management)理念,对本企业的资产进行全生命周期管理(ALM: Asset Lifecycle Management),建立起从资产采购、资产验收、资产入库、资产使用与变动、资产租赁、资产维护,到资产退役等资产整个生命周期的管理。

平台价值

采用先进的物联网技术,提高资产盘点效率,解决资产“帐、卡、物”不一致问题。以优化企业资产投资回报率(ROA: Return On Assets)为核心,借助信息化手段,合理整合资产管理流程及相关资源,从而提高企业的经济效益和企业的核心竞争力。

通过企业现有的信息资源和管理机制,在资产设备的管理部门、使用部门与维护部门之间加快信息的响应速度,缩短维修响应时间和维修工作时间,减少设备宕机率、降低设备故障率、维修工作量和成本。以可靠性维修(RCM: Reliability Centered Maintenance)策略为基础,用最少的维护成本获得更长的设备运行寿命。 提高库存储备的合理性,建立对资产成本数据的统计分析KPI(Key Performance Indicator)指标,从而增强企业持续盈利能力。


本文内容整理收集与网络,仅供学习交流使用,不代表CRM论坛观点。如有侵权,请联系我们,我们将会及时删除处理。
云呐固定资产管理系统是专业销售和研发各种固定资产管理系统,固定资产管理软件,企业条码固定资产管理系统等软件产品,产品作用功能优势明显欢迎来选购!咨询电话:13157126221

相关阅读