应对数据中心大流量方法


随着人们的工作生活越来越依赖于数据中心,这使得数据中心的流量增长迅速。2014年世界杯正进行得如火如荼,有关世界杯的视频和网络预计就会产生4.3EB的流量,世界杯的相关报道和视频通过全球各地数据中心迅速扩展和蔓延,让世界上任何一个角落都能感受到世界杯,当然这些数据也占用了大量的流量带宽,给全球的数据中心都带来了负担。如果说十年前谁掌握能源,谁就是世界之王,那么对于如今的信息时代,流量就是一切,谁能掌控流量,谁能拥有流量,谁就能掌控世界。所以很多国家将信息建设确定为国家战略,可见对信息建设的重视。数据中心作为信息高速公路上的最重要一环,不可缺少。

数据中心

即使网络设备有大缓存,也有可能被流量超越,毕竟一个10G端口通过缓存可以处理11G的流量,但是有时还是不够。当缓存已经被流量所塞满,再也没有能力转发更多流量,于是流控技术就出现了。流控技术用于防止在端口阻塞的情况下丢帧,这种方法是当发送或接收缓存区开始溢出时通过将阻塞信号发送回源地址实现的。源设备收到流控信号后,就知道了网络有拥塞,随后减缓发送速率,这样可以有效减轻网络拥塞程度。流控技术是数据中心内部广泛使用的一种应对突发流量的方法,当然这种方法只是将拥塞转移给了源设备,网络拥塞得到缓解。如果源设备无法临时存储这部分超带宽的流量,依然会出现丢包,所以源设备的缓存大小尤为重要,否则流控技术不能真正缓解拥塞状况,它只是将突发流量转移点转移。网络设备出现突发流量基本都是由于多端口流量向一个端口转发时出现的,所以很多时候源端口的带宽并没有满,这时流控技术适当降低源端口收到的流量速度,对于缓解突发流量还是非常有效的。流控技术是一种复杂技术,很多核心网络设备未必能够支持,所以需要了解设备支持流控的真实情况。

如果数据中心的网络带宽远大于数据中心业务最高峰时产生的突发流量,那么不用去管它,因为数据中心带宽容量还很充裕。当然按照正常的流量增长速度,数据中心迟早会面临着带宽不足的那一天,如果这一天到来了,我们有哪些缓解突发流量冲击的方法呢。很多的突发流量都是在短时间内流量突然增加的,如果在数据中心的设备上可以暂时将这部分流量存储下来,暂缓发送,那么就会减少丢包情况。现在的数据中心都要求使用大缓存的网络设备,一般的单端口缓存可达到10M~1G,这意味如果一个端口的带宽是10G,那么其可以全力转发11G的流量,有效应对了网络突发流量。那一定有人说,这样换成两个10G端口不就可以了,这样的确会解决突发流量问题,但是增加一个端口意味着要增加成本,一个10G光模块就要上千元,还要增加布线。而实际最大流量只有11G,绝大多数时间流量都在10G以下,增加一个10G在绝大多数时间内都处于空闲状态,造成了网络带宽的浪费。如果网络设备本身有大缓存功能,就可以解决这类突发问题。所以具有大缓存的网络设备是数据中心的首选,这将有效缓解数据中心突发流量问题。

如果网络设备和流量源设备都不能再有多余的缓存应对突发流量,还有一种方法解决这个问题,那就是流量调度功能。流量调度功能包括流量限速、流量监管、流量优先级映射等功能,通过流量映射功能将重要业务映射到高优先级队列,这样在出现突发流量时,确保重要业务流量优先转发,这种方法不能保证没有丢包,但可以确保重要业务不出现丢包。还可以通过流量限速将低优先级的流量进行丢弃,保证重要业务流量通过,减少突发流量出现。无论是流量限速还是优先级映射都是一种杀卒保帅的方法,低优先级业务会有丢包,保证高优先级业务正常。另外流量整形功能,其通过限制流出某一网络的某一连接的流量与突发,使这类报文以比较均匀的速度向外发送,这样就会使数据中心整体网络流量比较均匀,减少了网络设备的拥塞压力,流量整形是减少突发流量的有效方法,流量整形是一种无丢包的方法。

通过流控、大缓存、流量调度方法可以有效缓解突发流量对数据中心的冲击,但只能是缓解,这个不是彻底解决突发流量的根本方法,只有增加网络带宽才是终极解决方案。不过增加网络带宽意味着要对数据中心进行扩建,要增加运维成本,而且扩建还会中断数据中心业务,因此和三种缓解突发流量方法相比,投入成本过高,不到万不得已不会采用,这三种方法仍是解决突发流量的首要方法。