·测量数据中心的可用冗余能力

Jay Hartley先生是Modius的首席科学家,负责该公司的产品规划、开发、销售工程、安装和客户支持。
  
  我经常发现客户要求的最关键的用电量指标是可用冗余能力(ARC)。但他们可能并不总是确切的知道其准确的叫法。他们会更简单地说:“我在哪里可以安全地添加新的IT设备设施,同时又不会超载,也不会使设备的安全运行能力下降?”
  
  当我们从机架、行、空间或数据中心的建筑水平状况,甚至超越数据中心而从整个企业级别的网络来看待这个问题时,我们就会发现,ARC提供了一种非常简单的方法来回答上述问题。
  
  通常情况下,大多数数据中心不明确计算ARC。取而代之的是,运营商会在每个设备的实际负载上设置一个简单的报警阈值。例如,如果电力负荷达到设备的50%以上时(通常在降额情况下会设置成40%以上),设备或监控系统将引发报警。
  
  然而,这种简单的通过设置阈值的方法是基于设备的电源使用情况,但其并不能有效地捕捉到更广泛的配电系统中的所有条件。有些隐藏的能力是被安全故障转移所允许的,通过简单的设备级阈值并不能很好的反映其可用冗余能力。
  
  我在哪里可以增加负载?
  
  ARC系统的目标是识别您可以在不牺牲系统冗余的情况下处理额外增加的负载。在双端馈电情况下计算设备电源的ARC的计算公式其实很简单:
  
  ARC=(设备容量)/2-(实际负载})
  
  在大多数情况下,设备容量将降额,以便允许一定的余量。在发电能力情况下,视在功率(kVA)降额容量达到80%是很常见的。如果您知道或可以估算的负载功率因数,ARC也可以表现实际功率(kW)。更重要的是降额的情况下测量实际功率的能力,使得潜在的负载问题得以降低功率因数。
  
  对于运营警报,如果其超过了任何子系统,就会连续计算ARC并报警。选择在哪里安装新设备时,一定要随着时间的推移测量,使用最低ARC,或等价地计算出“实际负荷”取而代之ARC上面的“最大实际负荷。”
  
  如下是以ARC为基础的仪表板的运行状况:
  
  面板最上面显示6家不同的数据中心,以及一个冷却机组在同一个单位时间的ARC。较低的面板进一步显示了其中一家数据中心的运行状况。
  
  当在并行计算设备的整体ARC时,您可以为个别单位添加ARC。例如:
  
  UPS A有10千伏安的ARC  
  UPS B有8千伏安的ARC
  
  将它们加之一起就有18千伏安ARC。如果我们还有一个UPS能提供不同的负载,其ARC可以添加到这个集合,以便得到整个系统的ARC。总结并行系统ARC的规则并不依赖于系统是多余的。
  
  通过这种计算单个设备ARC之和来计算系统ARC的方法,必须假设两个平行的组件的能力是相同的。这较为常见,但也有特别的事例,这样你必须通过计算总设备的实际负荷,并比较其较小的设备(降额)容量。这保证了最有限的设备可以处理整个负载。
  
  有趣的是,可能有一个安全的冗余系统,但其个别设备却具有负ARC。
  
  例如:
  
  UPS A有3千伏安ARC  
  UPS B有-2千伏安ARC
  
  该系统的净ARC很小而只有正1千伏安。在这种情况下,根据简单的单器件阈值计算方法,其中一台UPS名义上已经重载,如果不降低负载的话,两台UPS都可能运行失败。需要注意的简单的单器件阈值计算报警方法将显示UPS B在报警,并引发潜在的成本昂贵的负载平衡​​。
  
  精确冗余配置的必要性
  
  为了评估负的部件的ARC,您必须要知道确切的冗余配置。因此,重要的是要评估每个子系统的ARC,然后把它整合整个数据中心。
  
  纵观整个电源链来看,与任何容量的测量一样,整个系统都是被整个链中最薄弱的环节所限制着的。该组件,或者更准确的说是并行组件的集合中最小的ARC将限制整个系统ARC大小。在上述情况下,哪怕UPS的PDU的下游有一个20千伏安组建集合ARC,负载仍然受限于这个仅为1千伏安的UPS。
  
  还有一些关于可能在UPS上面出现的负荷不平衡的问题的例子。这种不平衡的出现可能是因为负载部分未配置冗余。我们希望通过平衡两者之间的电源路径本身,而不是通过负荷开关。ARC的计算不依赖于知道所有这些细节。当然,如果失去了电源,任何非冗余负载将被丢弃。但是,只要整个系统的ARC是正的,任何多余的负荷将得到保护,无论其电源是否丢失。
  
  综上所述,系统ARC的目标是识别,您如何在不牺牲系统冗余的情况下处理额外的负载?如果它们具有相同的能力等级,就可以利用并行设备,将所有组件的ARC加在一起。而如果通过电源链来看ARC,正确的系统值将是系统中设置最低的那个组件的ARC。 
 

 
站长特效网欢迎您
   
js QQ在线客服代码
js QQ在线客服代码