从钉钉为什么没有崩说起

本文根据前资深IT管理员,现云网络产品经理李泉的文章改编而来

这几天,因为流量过大,一些热门的视频网站纷纷崩了。为什么钉钉没有崩?阿里云官微也回应了:
汇报一下这几天的主要工作,帮钉钉和大家扩容扩容扩容扩容扩容扩容扩容扩容扩容扩容扩容
从钉钉为什么没有崩说起

获悉,自春节以来,在家办公及在家上课的强需求,钉钉相关系统峰值流量暴增几百倍,超过1千万家企业组织的2亿上班族在线开工,近5千万学生通过钉钉在线课堂的方式学习。在阿里云上的钉钉从容扩容了几万台云服务器ECS,使钉钉成为使用最频繁最流畅的平台。其实,除了扩容本身,更需要企业IT管理人员考虑的是,如何应对这样的突发流量?如何构建高可用的业务系统?如何保证业务系统的安全?。。。我相信这些都是对企业IT管理人员的灵魂之问。小编作为曾经的IT管理员,现在的云产品经理,也在这里念叨几句。。。。。。

首先,要基于公有云构建业务系统,我想这点现在大家都有共识了。面对突发流量,公有云的弹性能力自然是最好的应对方式。对于第一天就在云上或者完全上云了的客户,这点不在话下,关键是要选择有充足资源的云服务商。对于在云下数据中心还部署了业务系统的,至少也要采用混合云的方式,先和公有云打通,一旦面对这样的情形,才能立即利用公有云的弹性能力。一般来说,公有云服务商都提供多种方式构建混合云,比如常用的专线和VPN,阿里云还提供智能接入网关这样的SDWAN方式上云。针对大流量场景,建议使用高速通道(专线)方式构建混合云,在突发流量来临的时候才能从容面对。

从钉钉为什么没有崩说起

其次,建议采用多地域部署业务系统。一方面当然是容灾,提升可靠性,其次,也能更充分的利用公有云更大的弹性资源池。有了公有云之后,多地域部署业务系统的成本和复杂性都大大降低了。在多个地域开通VPC,部署业务系统,并通过云企业网这样的产品打通多地域VPC,一旦流量增加,可以随时弹性增加云企业网的多地域互联带宽。可以说瞬间构建企业自己的核心网络并且随时弹性扩容,这在使用公有云之前,简直不敢想象。。。。。。对于多VPC打通后又需要进行访问控制的,也可以使用云企业网CEN的路由策略功能来实现。业务系统部署的内网通信问题解决了,还需要考虑的是大流量的处理和调度,这方面,负载均衡这样的产品自然是首选。

从钉钉为什么没有崩说起

采用多地域部署业务系统的复杂性主要在于数据同步或者数据一致性问题,这方面可以参考阿里大牛毕玄的相关文章,网上很多,搜索一下即可,比如 从冷备到多活,阿里毕玄谈数据中心的异地容灾 。考虑到异地多活的技术复杂性,小编个人其实建议IT管理人员结合自身的实际情况考虑,可能对大部分企业来说,对前端系统先实施多地域部署是更可行的方式,而前端系统往往是大流量的瓶颈。另外,还需要补充一点,除了多地域部署,在同地域也尽可能采用多可用区部署,也是容灾提升可靠性和扩大资源池的考虑。多可用区部署对复杂性增加不多,阿里云的VPC本身就是跨可用区具备跨可用区容灾能力的,负载均衡产品也支持在多可用区调度流量。可能需要多关注的是,虽然阿里云同地域不同可用区之间的延迟是非常低的,但如果前端系统和后端系统部署在不同可用区,并且多次跨可用区,还是会增加一定的延迟,绝大多数情况来说,这样的延迟增加是不会有问题的,但对于延迟极其敏感的业务还是要考虑这点,尽量避免多次跨可用区调用。对于大规模业务系统来说,VPC对于大规模业务系统来说,VPC容量还是一个需要考虑的点,可能一个VPC里需要能容纳几十万个实例,包括如云服务器ECS,弹性网卡,容器等等。

再次,从系统架构的角度来说,还需要考虑。。。。。

扯远了,怎么说到系统架构问题就没完没了了,看来小编的IT管理员的职业病又犯了,收不住。。。回到类似钉钉这样的办公应用来说,用户分布在世界各地,各地用户的网络状况也不一样,如何提升这些用户的访问质量就非常关键。尤其是对于需要视频互动这样的场景,更需要高可靠的网络质量。这个问题可以分成两个方面来考虑。一方面是选择公有云高质量公网带宽,也就是我们IT管理员都知道的BGP带宽。一般来说,公有云服务商都会宣传自己的BGP带宽具备N多线运营商接入,价格又便宜,支持95计费,弹性又好,简直不要太好了。但小编认为,有多少线运营商接入,质量多好,是需要全国人民访问之后觉得好才是真的好。

从钉钉为什么没有崩说起

试想一下,如果一个服务商本身的业务对网络质量都不敏感,本身都不具备高质量的BGP带宽,哪又怎么能对用户提供高质量的带宽呢?另外一点,必须考虑云服务商能不能提供大峰值的保障,说的再好,没有保障都是刷流氓。

据小编打听,这次钉钉扩容准备了超4Tbps 高质量BGP带宽,这些BGP带宽和淘宝,天猫是一样的。另外,还使用了共享带宽进行管理,共享带宽是大用户的带宽管理利器,一方面可以非常方便的管理海量的公网IP地址,另一方面,提供超大的峰值带宽保障。

又有点跑远了,刚说到对办公应用来说,一方面要选择靠谱云服务商的靠谱BGP带宽和产品,接下来要说的是,利用端进行加速或者选择一些加速产品也很关键。一般来说,有实力的公有云服务商有很大的资源优势,在全球都有Region布局,在世界各地提供服务,并通过网络将这些地域连接起来,构成一张覆盖全球的核心网络。在这个全球网络的基础上,利用自己的研发技术优势构建一些加速产品。企业办公服务商业可以较好的利用这样的产品,提供用户的访问质量。

从钉钉为什么没有崩说起

小编打听到,阿里云全球加速产品最近要发布新版本,据说有很多高科技,具体就先不剧透了,敬请期待吧。

最后,对于IT管理人员来说,远程运维和移动办公是一个刚需,小编这里也安利一下,带个货,阿里云智能接入网关(Smart Access Gateway)软件版,即SAP-APP是IT管理员可以考虑的解决方案。

智能接入网关APP支持终端(PC、手机)直接拨号内网加密安全上云,企业员工通过APP可以轻松实现安全的移动办公、远程运维。
了解更多

从钉钉为什么没有崩说起

近期,SAG-APP正在搞免费试用活动,2020.2.15-2020.3.30期间申请,前100个通过审核的的企业,可获得1个月免费试用。试用期间,我们将提供每个用户20个客户端账号,每个账号5GB/月流量套餐。为了保障给您的企业提供优质的网络服务,我们将按报名顺序优先提供支持。立即报名

小编打听到,SAG-APP近期将支持全平台(Windows/Android/IOS/MAC),并且将陆续上线很多高级功能。