欢迎您访问 最编程 本站为您分享编程语言代码,编程技术文章!
您现在的位置是: 首页

云端之上,猿辅导迎接 500 万中小学生的挑战

最编程 2024-05-04 19:36:30
...

为了在免费直播课带来的业务高峰中给中小学生连续、可靠的提供优质课程内容,全面保证疫情期间在线课程的内容质量和运行流畅,猿辅导内部启动线上办公的快速响应机制,对教学、服务、技术、平台、服务等多个业务端口进行重点工作部署,并动员了 356位主讲老师、412位助教老师、151位技术人员以及更多相关工作人员持续“作战”。


网络异常,图片无法展示
|


与此同时,猿辅导的技术团队全力投入到业务保障中来,从全链路监控,容量评估,在线容灾,故障演练等方面全面保障系统运行,并制定了四条业务高峰期的应对措施:


第一、建立全链路监控大盘,全面监控学生用户使用情况以及系统支撑情况,一旦报警,出发相关策略,动态扩容以及通过技术手段提升学生上课体验;


第二,构建容量评估模型,结合业务数据和系统压测结果,建立模型,充分评估资源,智能进行扩容;  


第三,全力确保在线容灾保证高可用。一旦发生服务大面积不可用,我们可以实现秒级切换,让问题用户无感知的快速切换到灾备服务;


第四,依靠在线课堂长期固定下来的故障模拟演练,模拟生产上业务高峰各种突发业务场景,保证系统高并发以及高可用。


但相比平时约10倍的业务流量峰值,仍然让猿辅导感受到了深深压力。因此,针对疫情高并发的流量,猿辅导技术团队决定,“把信任交给队友,把峰值交给云”,与已经合作了多年的阿里云支持团队沟通,针对业务系统以及在线课堂进行快速、大规模扩容,并通过云上全方位技术手段保障系统可用性、可靠性、安全以及稳定性。


一场与时间的赛跑就此展开。第一次云资源扩容发生在凌晨12点,猿辅导技术团队在向阿里云支持团队提出“盘点云资源库存”需求并快速得到计算、存储、网络资源存量盘点报告之后,立即决定对云服务器、存储、数据库和带宽进行紧急扩容。凌晨五点左右,阿里云的云资源紧急扩容完成,与猿辅导团队一起,迎接了当天全国百万中小学生在线听课的挑战。


截止到2月10日,猿辅导在阿里云上的资源已经进行了3次扩容,总体云资源的扩容规模和效率史无前例。与此同时,在阿里云支持团队的协助下,猿辅导技术团队梳理了包括直播课、小猿口算等业务全链路上存在的资源和性能瓶颈,并对系统架构进行了一定优化和调整,特别是针对与“学习强国”、人民日报新媒体、“央视频”平台等合作的对外公开课平台,构建了支持峰值流量的新架构体系。