国内最大规模SDN商用网络现身——世纪互联“吃螃蟹”

  • 来源:中国计算机报
  • 关键字:SDN商用网络,世纪互联
  • 发布时间:2014-10-15 10:27

  在不到两年的时间里,SDN就度过了概念炒作期,进入了真正的商用实践阶段。近日,世纪互联通过与华为在SDN领域展开商业合作,构建了目前为止国内最大的SDN商用网络,成为首个敢于规模化尝试SDN的用户。

  “火箭式”发展带来的运维挑战

  世纪互联近年来的发展是“火箭式”的。在美国纳斯达克上市后完成了一连串的收购,已经让世纪互联成为目前国内实力超强的中立第三方互联网基础设施服务商,主营业务也从过去以集团托管服务为主,发展到现在形成了遍布全国的服务网络,以及云计算业务、运营体系服务。目前,世纪互联在全国40个城市有超过80个数据中心,容纳了1.5万个以上的基架,拥有超过500个网络节点,服务用户数量超过2000家。从互联网到传统的金融、政府、IT客户,世纪互联的用户覆盖了各行各业。

  经过多年的积累和建设,世纪互联已经构建起了一个环全国的骨干网络。其骨干网主要承载三大连接需求:与ISP进行交互,与世纪互联分布在全国各地的80多个机房进行连接,与全国500多个网络节点的互联互通。这是因为骨干网是世纪互联提供高质量服务,保障用户互联网访问质量,以及提供网络增值服务的核心保障。

  事实上,运维骨干网一直是世纪互联面临的一个巨大的挑战。世纪互联有一支百人规模的网络维护团队,这个团队的成员大多都是具有5~8年运维经验的资深运维工程师,工作起来非常高效。即便如此,在运维过程中,世纪互联网络产品总监矫毅和他的同事依旧遇到了很多问题,特别是难以保证运维工作达到“又快又好又省钱”的企业目标。在质量、成本和时间这三个维度上,世纪互联骨干网的运维一直难以找到最佳平衡点。

  此外,客户群体的多样性也对世纪互联的网络运维带来了不少挑战。特别是流量较大的视频网站常对骨干网造成冲击。一些处于业务成长期的互联网客户,也经常出现网络流量突增的现象。而游戏类客户对网络迟延的要求又非常高。在合理的成本下,能否保证面向各类客户的服务质量达标,是评估互联网基础设施服务商竞争力的标准。所以对世纪互联而言,流量增加所带来的网络调整压力要远远超过企业级的运维。

  DNS域名提供商在选择互联网基础设施服务商时向来非常谨慎,因为只要有一次运维解析出问题,就会对互联网造成巨大冲击。世纪互联获得DNS域名提供商信任的原因,主要是它们可以提供品质极高的网络、机房服务,服务质量可以和国际接轨。但从运维的角度看,这样的服务标准却会带来更大的压力。

  SDN解决了流量管理难题

  “现在产业整合的趋势越来越明显,跨行业用户之间的互联互通需求非常多,越来越多的客户、业务都通过互联网来进行交互,必然会带来更复杂的问题。比如,客户和客户之间的网络访问质量无法得到很好的保障,有时网络足够好,但迟延却不断变大;有时迟延要求满足了,但网络路径又不合理。”矫毅告诉记者,在进行网络资源投资的过程中,世纪互联一直在探索解决现有问题和释放未来运维压力的方法,最后他们决定,先把实现网络流量的科学管理和提升用户体验作为目标,并以此为切入点进行改造。

  对世纪互联而言,最有难度的工作恰恰是实现网络流量的科学管理。

  对于骨干网而言,带宽利用率提高,等于变相提高了公司利润。但是,把流量调度的力度尽量细化,同时还能让业务响应时延尽量小,却并不容易办到。“路径如何选择,如何有效利用资源,如何更好地满足业务调整的需求?如果把业务调度做细,最好的方法是逐条处理,这势必会导致运维时间拖得过长,不能满足网络流量调度的时延需求。如果做得粗一点,又怕不够精确,带来其他方面的问题。”矫毅直言,想做好网络流量管理并不简单,方方面面都需要他们考虑周到。

  不仅如此,在世纪互联的骨干网络中,用户的业务变化也很复杂,尤其是大量互联网用户经常带来不可预知的问题。“云计算网络使得整个骨干网内不确定流量出现的频率越来越高,如何适应新业务需求对流量带来的挑战,这也是我们需要解决的问题。”矫毅和他的同事们发现,只有把日常众多需要人工干预的工作通过自动化手段落实到整个网络运维工作中去,这些问题才能真正得到解决。

  最终,世纪互联将需求细化为两大目标:一是在网络运维中实现质量、成本和时间三个维度的平衡;二是最大化减少人工干预环节,提高整体运维效率,在运维灵活性和自动化上得到巨大提升。在对众多技术进行比较后,他们发现SDN可能是最佳方案。

  端到端“可视”的流量网络

  经过与多家技术供应商的互动和交流,世纪互联最终采用了华为的SDN方案,选用了8台华为的CE12800数据中心交换机和2套敏捷控制器(SDN管理平台),目前在华东、华北、华南地区8个城市完成部署,用于8个数据中心间的互联。通过双方的联合创新,还形成了能够满足世纪互联需求的agile TE SDN流量优化平台。

  对于矫毅和他的同事来说,SDN所带来的变化非常明显。例如,在从北京到广州的网络中选择一条合理的网络路径变成了一件非常轻松的事,利用端到端的视图就能灵活选择。世纪互联的带宽利用率也有所提升,过去很多需要人工干预的工作变成了自动化的工作,不必再经常加班以应对突发情况。矫毅和他的同事们,现在可以通过一些固定的策略实现自动化运维,自动化调整。

  此外,矫毅感觉网络的可靠性在大幅提升,通过自动探测整个链路的拥堵状况,可以在毫秒时间内进行链路的切换,保证服务质量。当数据通道发生故障时,业务连续性得到了很好的保障,造成的影响客户几乎“不可感知”。下一步,世纪互联将实现SDN平台接口方面的开放,开发更丰富的增值业务。

  “我们实现了很多过去难以实现的流量管理功能,随时能知道哪里出现了‘不合理’的状况。世纪互联的网络,在我们眼中已经变成了端到端的流量网络。”在矫毅看来,SDN带来的最大好处是实现了控制和转发的分离,轻松实现了整网路径的可视化和流量的可视化。因为在“可视”的前提下,运维人员才能真正实现对整网流量的调度和管理。基于此,世纪互联才可能去制定端到端的流量分级规则,基于流量路径实现多路径分担等自动化管理,从而提高资源利用率。网络的整体可靠性,才有可能得到极大提升。

  SDN商业网络的最佳实践范例将率先出自中国,这一预言很可能会由于华为与世纪互联的进一步合作而成为现实。目前,世纪互联已在广州、南京、武汉等8个数据中心,与华为展开了对SDN网络的探索。据悉,未来双方合作创新的SDN方案将推广到世纪互联遍布全国40个城市的80个大型数据中心。这样的应用规模,在世界范围内也非常少见。

  年内华为才发布基于SDN架构的敏捷数据中心网络解决方案。腾讯、SRP等企业已开始试用的消息陆续传出,但本质上SDN规模化应用在商用网络中的案例并未真正出现过。作为国内唯一敢于大规模应用SDN方案的用户,世纪互联的经验无疑会形成SDN商用网络的样板效应。

  本报记者 卜娜

……
关注读览天下微信, 100万篇深度好文, 等你来看……
阅读完整内容请先登录:
帐户:
密码: