顶级流量大考 京东云“三板斧”挑战极限资源下不同场景切换
春晚拥有世界最顶级的流量和曝光度,过去几年,国内最有实力的科技公司纷纷与其开展红包互动合作。只有成功扛住珠穆朗玛峰一样高的流量洪峰,才能展现卓越的科技硬实力。
今年,京东成为央视虎年春晚独家互动合作伙伴,打造了有史以来持续时间最长的互动体验。虎年春晚期间,全球参与京东APP红包累计互动量达691亿。京东还实现了连续第10年“春节也送货”,并启动首个“超级年货品牌月”。
“春晚互动”与“年货春运” 模式之间的十几次流畅切换,并且有序运转,其背后,是京东云在服务器资源零新增下,成为行业首次依靠资源切换,实现超大规模的计算资源变阵实践。
新型实体企业 春晚送出15亿红包和好礼
数据显示,今年春晚期间,通过京东APP“摇一摇”送出15亿元红包和实物好礼,售出超千万件优质农产品。除夕晚上10点06分,中央广播电视总台春晚正在火热进行中,家住贵州毕节市的李女士就收到京东快递送来的互动奖品,成为春晚互动活动实物好礼第一单。
除夕当晚,广东、北京、上海、江苏、山东的用户成为抢红包大赢家。京东超市年货礼盒商品搜索量超1.1亿次,其中71%的用户为80、90后,用户下单50%年礼送给远方亲人。
就在全国人民享受节日欢乐的春晚期间,有超过20万名京东物流小哥连夜值守,全力保障全国超300个城市、近1500个区县的消费者年货购物需求,即使在除夕、大年初一,也可以正常下单收货。此外,还有近万名京东客服值守一线。
不同与以往的春晚线上红包互动,今年京东红包加实物的形式,打造了“线上+线下”的长流程模式,创下691亿次累计互动量。京东在春节期间还需继续做物流的配送、采购,让老百姓在春节期间能正常保证自己的日常生活。
作为一家兼具实体企业属性和数字技术能力的新型实体企业,京东在激发消费活力,推动数字技术与实体经济深度融合上发挥了不容忽视价值。
支持春晚 京东云技术最好一次练兵机会
京东春晚红包项目,对于研发部门只有19天备战时间,涉及到跨多个职场、100多个虚拟团队,近万人研发的协同备战,以及数百万核资源的快速扩缩容,可以说是一场超大规模的研发协同作战。
京东云行云及devops产品负责人贺玉芝表示,红包项目面临两个巨大挑战,第一个是如何保证所有研发敏捷协同,快速落地;第二个是如何保证海量流量下系统的稳定性和性能。
两天内把600个需求消化,春晚项目可以说是京东最短时间内的一个研发协同项目。俗话说“将军不打无准备之战”,京东的行云平台在京东内部已经支撑几万人规模的研发协同开放平台,覆盖从需求、开发、测试、发布、运维、运营整个生命周期的一个工具的生态链。从春晚项目立项那一刻开始,近万人很快可以在平台上对齐目标、规划,以及重大的里程碑和交付物。
京东凭借多年沉淀下来的技术中台和低代码能力,得以在两三天的时间内,快速的以搭积木形式构建春晚红包应用场景。行云上有一个乐高的低代码平台,基于这个平台,所有不同场景多变的红包活动和营销策略,就像搭积木一样搭建出来。
贺玉芝指出,为了保证系统的稳定性和性能,京东云拥有“三大法宝”。首先是混沌工程,就是京东云下面一个子品牌云泰,它能模拟可能发生的一切故障,比如机房断电、宕机这种突发事故;其次是全链路压测平台;第三个法宝是JDOS(混合云操作系统云舰),京东依托JDOS平台,灵活运用离线算力支撑春晚黄金时段。
京东云全链路监控春晚支持负责人沈建林表示,红包活动应用开发完成后,研发会模拟用户的一个真实使用场景,进行全链路压力测试。
“在压力测试期间,全链路追踪能够精确分析用户产生的每一次调用消耗情况,包括在应用逻辑上、数据访问上、网络传输上等等,然后我们应用会有针对性的进行极致优化,去压榨每一个CPU的时间片计算资源。”沈建林说。
京东春晚项目IDC支持及资源运维管理负责人常亮认为,这次春晚,对京东云技术,特别是云厂商在面对国家层面的大型活动,或者跟国家民生相关的这些活动里,是最好的一次练兵和体验。
行业首次 极限资源下不同场景切换
值得注意的是,京东云首次在不加内部资源情况下,支持了红包项目,省去了巨额采购服务器成本。
在京东春晚项目组IDC基础保障负责人马晓越看来,照搬“堆砌资源”的传统思路是下策。第一,短期临时投入过大,与京东云长期追求的精细化研发资源管理理念相悖。第二,疫情导致的全球供应链紧张,让堆砌资源的客观路径变得行不通。
马晓越表示,京东云多年沉淀的积木化IT和全面容器化,让京东云实现底层基础设施的标准化,可以快速适应不同地域、不同设备的部署环境,京东云的云原生数字底座可以像乐高积木一样快速拆解,完成活动的楼层搭建和场景添加,从而极大提升项目的开发效率,这也是此次京东云能够在短时间内为春晚红包互动活动快速搭建一套超高弹性、高效敏捷的数字底座的核心原因之一。
相比以往与春晚合作的企业相比,京东面临着更大挑战,这体现在——京东要保证原来电商平台的长流程功能不坍塌,老百姓在春节期间买到自己想要东西。还要确保在春晚当天几千万人同时摇红包的时候,大家都能摇得上。
京东的应对做法是,抢红包时候,将资源向红包倾斜,抢完之后资源再向京东本身业务倾斜。具体而言,央视主持人口播之时,京东云快速将系统资源调整到“春晚互动”模式,从计算资源到网络资源,全面向春晚红包互动涉及的链路倾斜。
在口播结束一段时间,抢红包的洪峰退潮之后,再迅速切换为“年货春运”模式,支撑从前端App平台、订单、结算、支付、搜索、推荐,到后端的仓储、配送、客服、售后的年货春运相关业务系统。
此次春晚项目,京东云实现了秒级调度近300万个容器、超1000万核算力资源,在7轮红包互动过程中,犹如“变形金刚”一般在春晚互动模式与“年货春运”模式之间进行了16次无缝切换,保障用户的顺畅互动体验。
京东春晚项目组容器研发负责人赵建星指出,支撑不同场景切换的技术平台是云舰系统,集团底层所有资源全都通过云舰来进行保障和智能调度。云舰是京东推出的行业内首个混合云操作系统,已经在汽车、物流等行业落地实践。例如,京东云为北汽量身打造的混合运营平台,为其节省了50%的IT成本。
有专家认为,春晚红包一役,不仅仅展现了京东云自身的技术能力,也可以看作是中国云计算行业整体发展的一道重要分水岭,将春晚的作战理念从“拼资源”迭代为“拼架构”。
京东集团副总裁、京东云基础设施研发负责人符庆明评价:“首次在不增加新采资源情况下,依靠云原生数字基础设施、混合多云操作系统云舰,在央视春晚4小时红包互动过程中,实现京东交易模式与春晚红包互动模式的十多次切换,在世界顶级流量及超级复杂场景下,成功挑战极限资源不同场景的切换。”