案例研究
CSI的圣骑士监控保存了一个客户的主要电子邮件中断,并允许我们主动处理另一个的电子邮件中断问题
CSI的 圣骑士远程监控 解决方案在周三的一个小时内发现了两个主要的Exchange 2010电子邮件危机. 其中一个影响不到700名用户,另一个影响约1350名用户.
第一个事件是圣骑士给了我们一个叫做“背压”的交换警报. 这就是Exchange认为它将无法根据所消耗的服务器资源(RAM和磁盘空间)的速率来完成其工作的地方. 交换然后试图保护核心. 它通常首先关闭进出Exchange服务器的电子邮件流. 这就引出了这样的问题:“你怎么知道你发送的邮件没有收到?? 你怎么知道你发送的邮件是否没有收到? 圣骑士 知道. 因为CSI主动观察警报控制台,而不是仅仅依赖于自动报警给我们的客户, 我们采取了“老办法”,拿起电话和合适的人交谈,但他们并不知道他们没有得到
电子邮件. 我们和他们一起解决了这个问题. 只需对其虚拟环境进行简单的资源分配更改,并快速重启,这700名用户就可以继续做他们所做的事情,而无需担心, “og体育开户电子邮件没了??”
当我们结合 圣骑士的监控 与 圣骑士邮件国防我们可以做得更好. 圣骑士邮件国防 为我们提供24x7x365短信文本警报时,邮件流进出电子邮件服务器停止和启动. 如果停电是由于真正的灾难情况, 圣骑士邮件国防 立即切换到灾难恢复模式,在这种模式下,无法通过web发送到其邮件服务器的客户端电子邮件立即可用. 邮件服务器可能已经死亡或建筑物被摧毁, 但如果你能在哪儿找到上网的地方, 你仍然能够发送和接收重要的电子邮件,直到任何糟糕的事情被解决. 如果情况是暂时的, 圣骑士邮件国防 一旦连接重新建立,就会自动重启入站和出站邮件流,然后通过SMS通知每个人正常的邮件流再次工作.
第二次Exchange事件发生在第一次事件的一个小时后. 不幸的是,一个Exchange服务器提供对大约1个服务器的访问,350个用户有一个高CPU条件. 这会导致用户性能下降. 没有任何警告. 前一分钟还很正常. 下一分钟,它就在一个糟糕的地方. 圣骑士 提醒我们. 当客户打来电话报告Exchange中出现奇怪的性能问题时,我们已经在调查中断了. 在本例中,我们无法阻止性能的下降. 没有人能一直这么做. 然而,在我们的客户知道有一个紧急问题之前,我们就知道了. 我们积极地努力尽快解决问题,尽量减少停机时间. 活动开始大约20分钟后,我们解决了问题,大家都回去工作了. 从警报到紧急警报的响应时间大约是三分钟.
你不可能知道你的社交网络中正在发生或即将发生的一切. 通过覆盖24 x7x365 圣骑士远程监控 我们可以为您提供了解您的网络的能力,这是您自己无法了解的. 通过覆盖 圣骑士邮件国防 我们可以为您的关键电子邮件通信提供一个额外的灾难恢复保护层. 你是如何知道你所不知道的人脉的?
CSI的圣骑士监控使另一个客户免于过多的停机时间
CSI的 圣骑士远程监控 解决方案在过去几天有一个令人印象深刻的保存.
上周我们有一个ISP去了现场,几个小时后做了例行的硬件升级/交换. 中断是计划和预期的. 这是一个快速的进,出,回联机. 圣骑士 看到客户端站点离线(按计划). 然而,该网站再也没有回来. 时间过去了,它仍然没有回来. 小时过去了. 很明显,出了什么可怕的差错. 如果这种情况持续到早上,我们的客户就会遭殃. 有2,100名用户坐在这个连接后面——如果这个问题得不到解决,他们中的许多人会非常生气. 我们在几个小时后给合适的人打电话,晚上10:45左右,ISP重新访问了客户端,迅速解决了升级带来的连接问题. 最终用户甚至不知道已经发生了中断. 负责那个网站的人知道是因为 圣骑士 不管他们是否站在那里,他们是否在24x7x365地监视着那个地点. 我们知道,我们不只是依赖自动的“您挂了”警报,因为我们非常努力地与客户进行互动讨论,并努力让他们保持健康. 在这种情况下,是在下班后, 现场“人”监控-只是为了确保一切顺利. 你不可能知道你的社交网络中正在发生或即将发生的一切.
通过覆盖24 x7x365 圣骑士远程监控 我们可以为您提供了解您的网络的能力,这是您自己无法了解的. 有太多的数据需要筛选. 在这两种情况下,我们都能够发现实质性的问题,并在它们演变成大量不高兴的用户的重大危机之前进行处理.
你是如何知道你所不知道的人脉的?
CSI通过飓风艾琳监控我们客户的网络
当飓风艾琳逼近纽约时, CSI使用我们的24x7x365的圣骑士监控服务来帮助我们的客户准备他们的电脑和网络来应对即将到来的飓风. 我们能够快速识别管理下的所有不间断电源(即电池),其中有坏电池或其他硬件问题. 插入这些电池单元的设备受到的能量流比正常情况下要大.
一个客户站点打算在风暴期间关闭其所有业务. 在他们关闭设备之前,我们发现了一个服务器,它被RAID阵列中的坏驱动器和其他硬件问题破坏了. 我们担心的是,由于这个关键服务器已经有一个失败的冗余组件以及其他问题, 它可能会被关闭,永远不会重新上线.
意识到时间对修复服务器至关重要, 我们能够使用圣骑士的远程管理工具,在周六上午12点,当风暴逼近时,重新构建冗余驱动器,并在服务器实际关闭之前重新建立完全冗余. 客户从不需要起床. 没人会出现让我们进入大楼, 关闭警报并解锁进入服务器壁橱所需的多个门. 在我们的工作完成之后, 服务器按照客户的计划宕机了,但在风暴后恢复正常.
在风暴期间,我们主动监控客户的网络,当我们看到整个地区的建筑和服务器因停电而宕机时,我们提供了动态状态更新. 通过查看以前的警报并查询电源供应,我们能够识别“无电源”和实际设备故障之间的区别.
在周日风暴平息后,我们能够准确地确定该地区有哪些建筑物处于离线状态. 然后,当这些建筑重新上线时,我们能够准确地确定每个建筑内的哪些设备没有重新启动. 从那里我们得到了客户的og体育人员或CSI的人员可以调查的设备列表.
周日晚上,我亲自通过圣骑士监控控制台监视我们客户的网络. 在这中间,我家里停电了. 我走到外面,启动了发电机. 然后,我打开笔记本电脑上的Verizon无线网卡,一点也没错过.
CSI的办公室有一个足够的备用发电机和良好的互联网连接,所以我们的24x7x365监测持续不管风暴条件.
有一次,尽管洪水泛滥,星期一早上还是来了, 道路关闭和一些地区的大规模停电,我们的大多数客户回去工作时,他们的电脑网络的运行就像他们周五去度周末时那样.
这就是CSI的圣骑士监控所做的.