青岛新大地园林工程有限公司

多个机房光缆被挖断40%服务器停服26秒恢复?!

  互联网时代,服务器机房可谓心脏,大型机房出故障是小概率事件。但即便如此,依然可能出现自然灾害、断电、光缆被挖断等黑天鹅事件。

  据报道,在9月20日的云栖ATEC主论坛上,蚂蚁金服副CTO胡喜在现场特别模拟了剪断支付宝位于一个城市中两个房的光缆。

  蚂蚁金服正是这样做了这样一次尝试性实验,此次实验被差评君(ID:Chaping321)全程记录。

  现场在模拟支付宝转账的同时,程序员剪断了位于杭州一个房的光纤,当光纤被剪断后,这个房所负责区域的任何业务都不能处理。这就是转账失败的原因。

  然而,在真实环境下,如果支付宝部署在两个城市的两个机房同时出问题,据官方宣称,跑在这两个机房上的支付宝账户,恢复正常的速度是分钟级。精确地说,只需要26秒,模拟环境中的支付宝就能完全恢复正常。

  据悉,这是因为这一机房架构叫“三地五中心”,即在三座城市部署五个机房,一旦其中一个或两个机房发生故障,其底层技术系统会将故障城市的流量全部切换到运行正常的机房,并且能做到数据保持一致且零丢失。

  目前,互联网和金融科技行业普遍采用的是“两地三中心”部署架构,即在一个城市设两个机房,在另一个城市设一个冷备机房。

  而在这个实验中,城市A的两个机房是服务大众的,不管是转账、缴费还是查账全部都由这两个机房提供服务,而且两个机房是同步在处理数据且数据一致的。但在城市B的备份机房只是做备份而已,并不参与服务大众这一活动。

  一旦城市A的两个机房被自然灾害等毁坏就不能继续对外服务,那只能让程序员熬夜去切换另一个城市的备份数据。但是由于B城市的机房常年没有工作(提供服务),整个机器都处于“冷冻人”的状态,所以切换前还需要校验数据,再预热等等复杂的操作后才能让服务再次畅通。

  网络数据:这种方式是对生产系统的数据库数据和所需跟踪的重要目标文件的更新进行监控与跟踪,并将更新日志实时通过网络传送到备份系统,备份系统则根据日志对磁盘进行更新。

  远程镜像:通过高速光纤通道线路和磁盘控制技术将镜像磁盘延伸到远离生产机的地方,镜像磁盘数据与主磁盘数据完全一致,更新方式为同步或异步。

  这些措施能够在系统发生故障后进行系统恢复,但是这些措施一般只能处理计算机单点故障,对区域性、毁灭性灾难比如地震、火灾等则束手无策,也不具备灾难恢复能力。

  灾备场景涵盖面广,方案复杂,传统数据中心容灾方案存在CAPEX、OPEX高昂、数据同步策略复杂、灾难恢复效果有限等问题。企业有必要采用多云灾备策略,以保证业务连续性及关键数据可靠性。我们就需要建立异地容灾中心,做数据的远程备份,在灾难发生之后要确保原有的数据不会丢失或者遭到破坏。建立的异地容灾中心可以简单地把它理解成一个远程的数据备份中心。

  如今,数据中心相关行业越发重视灾备方案,业界已有许多优秀的灾备方案问世。7月,华为云Multi cloud混合云灾备解决方案;8月,浪潮推出并展示了基于Openstack的“同城双活、多云数据中心灾备解决方案”.期待,未来越来越多的灾备方案,能让数据更安全,用户更安心。

  为了减少数据中心的碳足迹,微软正在加大对太阳能的投资。2023 年的时候,其数据中心有望使用 70% 的可再生能源。亚利桑那数据中心的可持续发展项目,一直受到很多人的关注

  日前,英特尔公布了 2019 年第二季度的盈利报告,实现营收 165 亿美元,同比下降3%;净利润为 42 亿美元,同比下降 17%。报告称,下降主要出现在数据中心业务,而在客户计

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。