多地疫情再起,健康码的“健康大考”如何过关?

发布者:Editor
发布于:2022-03-10 16:02

自疫情伊始,健康码就成为了出行必需品。健康码能保障疫情防控工作的高效开展,让技术应用更好地为社会“加码”护航。在关键时期,若健康码出现访问慢或者无法访问,有可能影响整个城市的生产生活。在健康码各项“健康”指标中,影响最大、最直接的是可用性在抗击疫情的关键时刻,为保障健康码的正常运作,发挥信息化、大数据的赋能作用,安恒信息特别推出重要民生系统安全保障服务,针对健康码系统自身“健康”状况进行检查和维护


容量规划与性能测试


安恒信息为客户现网进行把脉,首先根据当地人口规模等数据,评估出系统所需支持的最高并发连接、新建连接、并发请求等性能指标;其次是评估出现有系统所能达到的性能指标,帮助客户发现现有系统的瓶颈,给出整改建议,让系统能够应对峰值流量。 容量规划

这一步通常在系统建设之初就会设计,但是由于最初对高峰流量预测不准等问题,根据当前形势,往往容量规划需要根据人口重新分析。

容量规划的目的在于让每一个业务系统能够清晰地知道,什么时候应该加机器或者减机器,防疫健康码场景需要准备多少机器才能在保障系统稳定性的同时节约成本。 路压测

基于实际的生产业务场景和系统环境,模拟海量的用户请求和数据,对整个业务链路进行各种场景的测试验证,持续发现并进行瓶颈调优,保障系统稳定性的技术工程。


系统优化与持续监控


基于前一流程所得到的容量规划和性能测试报告,首先是有针对性地进行系统优化与扩容,其次是对新的系统进行持续监控,确保第一时间发现问题,防患于未然。 系统优化与扩容

从整个系统的视角,纵观整个链路,对防火墙、负载均衡、Web应用防火墙、源站等部件逐一进行优化或扩容。主要围绕三个方面:消除单点、支持弹性伸缩与提前扩容。

消除单点单点故障是指系统中一但失效,就会让整个系统无法运作的部件。比如,若整个系统中负载均衡设备只有一台,当负载均衡设备出现故障时,则会导致系统出现无法使用的情况。同理,其他的系统部件,也可能会存在类似的单点风险。消除单点主要是通过主备自动切换、水平负载扩展等技术方案,来将原本由一台设备承担的工作,交由多台设备负责,以此避免单台设备故障引起的全局不可用问题。

支持弹性伸缩弹性伸缩能根据业务需求和策略自动调整计算能力。在业务需求增长时,弹性伸缩自动增加指定类型的实例,来保证计算能力;在业务需求下降时,弹性伸缩自动减少指定类型的实例,来节约成本。例如,当没有疫情时,只需少量几个虚拟机即可满足业务需求;当疫情爆发时,可通过虚拟化、容器化、自动编排等技术,自动扩容到原本的几倍、几十倍的计算能力,以此应对突然到来的流量。

提前扩容:是指根据目标容量峰值的科学预测和现有设备实际的处理能力,提前进行设备的采购、部署,提升现有设备实际的处理能力,以应对未来的大流量威胁。持续监控

为确保系统的持续稳定运行,需要对系统进行实时的监控,一旦发现异常,需要通过告警来让技术人员紧急介入。安恒信息通过系统内部+外部双重监控体系,来确保及时发现系统的风险。系统内部主要是对系统的各种组件进行多维度的监控,主要监控进程、日志、网络、设备资源等;系统外部主要是通过安恒信息遍布全国各地的监控节点,周期性、高频率地探测系统是否可正常访问。双管齐下,可以保障技术人员随时掌握系统的运行情况,及时进行应急处理故障或者突破阈值的情况。

 

专业运营团队


健康码类的重点民生系统所面对的内、外部情况都异常复杂,为彻底保障其“健康”地运行,除了要有好的软/硬件,还需要由富有经验的专业运维与应急团队来保驾护航。

运营团队组建模式以安恒信息服务为例,安恒信息安全产品支持三种交付和服务方式:

本地模式:采用本地安装,结合本地驻场进行运维服务;

云上云下联动模式:采用本地安装,开通远程通道,采用云端运维服务。

云端模式:将重要业务系统接入安恒信息在本市的防护节点,有效解决访问时延问题,并由云端安全运营专家在线保障。

为减少生产环境故障的发生,在面临设备故障、网络故障、安全攻击等突发事件可以快速发现、快速响应、快速处置、快速恢复,降低故障带来的不良影响。安恒信息基于重要系统保障经验,沉淀了一套以人、流程和技术相结合的安全运营机制。通过主动的设计和配置、持续的系统状态监测、检测意外动作和非预期状态去保护防御下的业务系统,尽可能地降低不良影响造成的伤害。

安恒信息具备大量应急保障经验,积累了一套针对性能过载、负载均衡失效、系统遭受安全攻击等突发问题的应急响应预案。在发生相关问题之后,及时通报给各部门进行响应,快速解决发生的问题,损失可降到最低。

云端应急专家具备多地市健康码系统的实战保障经验,分两组人员进行7×24小时值守在线。


客户案例——杭州健康码


2020年,浙江省杭州市推出健康码模式,安恒信息紧急组建团队投入到杭州健康码专班工作中。通过本地防护设备+云端安全运营团队,云上云下联动的模式,安恒信息为杭州健康码的安全、稳定运营提供强有力的技术和人员支撑。为了应对不断上升的并发需求与安全威胁,安恒信息的安全运营团队与健康码建设专家联合进行3次性能评估与测试,测试完成后进行相应的系统优化与扩容。由安恒信息安全运营团队进行7x24小时安全值守,结合云端专家及联动云端威胁情报,持续对安全规则进行调优,实现全面精准拦截恶意攻击行为,实现从网络层、应用层、数据层等多层面安全防护。

2022年春节前夕,杭州突发新冠疫情,从1月27日凌晨开始,安恒信息驻杭州健康码专班接到了杭州市疫情防控指挥部的紧急需求,在赋码新规调整的72小时内,配合市数据资源管理局开展核酸检测报告读取和健康码自身性能压力测试,推进各节点扩容。在48小时内有效地将健康码性能从3000QPS提升至常驻人口的千分之一10000QPS, 进一步简化市民读取核酸报告的后台链路,在省一体化智能化公共数据平台支持下,保证了健康码的稳定性与兼容性。



本着务实与探索的精神,安恒信息通过信息化手段,结合技术与运营优势,全方位守护健康码安全,助力疫情防控工作高效有序进行。


声明:该文观点仅代表作者本人,转载请注明来自看雪