关于业务安全平台架构设计,顶象给“我”讲透了

发布者:顶象技术
发布于:2022-07-15 10:28

数字化时代,企业的业务安全面临更致命、更隐蔽的风险。


a.2021 年 10 月,某电商平台某官方店铺,运营同学在参与平台日常活动的优惠设置操作中出现失误,导致店铺所有商品出现超低价,损失或超千万; 


b.2020 年 3 月,有暗网用户对某社交平台 5 亿用户手机号数据以及近 2 亿账号基本信息进行售卖,售价仅为 1000 余美元;


c.2020 年 8 月,据外媒报道,Instagram、TikTok、YouTube由于一个不安全的数据库,导致超过 2 亿的用户资料泄露在网络上;


d.2019 年 11 月,某电商平台某旗舰店因标错价格被恶意下单,下单金额超过 700 万,最终导致店铺倒闭。


随着企业数字化转型的深入,随之面临的各类业务安全威胁也在不断加剧,团伙化、专业化的黑产侵入业务环节,动辄给企业造成数百万甚至千万的损失,同时次生灾难所造成的损失更加难以用金钱来衡量。业务安全风险已成为近年来企业需重点关注的运营风险之一。


一方面,线上经济与线下经济的结构性转变日趋加速,社交、长短视频、电商等线上流量迎来爆发式的增长;另一方面,非接触式的网络欺诈也日趋严峻,欺诈风险成为企业数字化转型和线上业务发展的重大挑战,虚假用户、薅羊毛、盗卡盗刷、电信诈骗等风险每年带来超千亿经济损失。其中,电商、出行、社交、游戏等行业成为欺诈流量的重灾区。


针对日益猖獗的黑产,国家有关部门也对网络安全愈发重视,对网络电信诈骗打击力度不断加强,监管政策的发布也愈加频繁。与此同时,企业在数字化建设过程中也愈发重视搭建自己的安全防线,不断加强业务、营销、内容风控能力,因此,构建一个业务安全的全链路风控中台在企业数字化发展过程中尤为重要。


7月7日下午17:00,顶象《业务安全大讲堂》系列直播课第二期正式开课,本期直播课顶象从业务安全技术对于企业的重要性以及搭建业务平台架构的必要性谈起,深度剖析了业务安全的重要性,就如何搭建业务安全平台架构提出了建议。



本期内容技术干货满满,我们特地为大家总结了本期直播内容重点。


企业面临哪些业务安全威胁?


谈及企业面临的业务安全风险,顶象CTO张晓科表示:“就企业面临的风险而言,大致可分为三方面的挑战。”


一是企业业务层面,诸如业务和场景多样化、渠道多样化带来的各种业务安全风险;


二是国家对于企业的数据合规、反洗钱管理、短信诈骗防范等方面的监管;


三是企业自身的业务安全建设层面带来的问题,诸如烟囱式建设造成资源浪费,单点防控方式导致各个业务间各自为战,且企业对于黑灰产的认知薄弱,风控能力参差不齐。


因此,就目前企业面临的挑战而言,企业部署业务安全已成为必要。一方面,业务状态的健康稳定不仅是企业营收的重要保障,另一方面业务安全也是企业信誉以及生存发展的关键要素。


业务安全技术的演进趋势


那么,业务安全的技术演变趋势又是怎样的呢?


在直播中,张晓科也为大家介绍了业务安全技术演进的三个阶段。需要注意的是,黑灰产的攻击手段也是随着业务安全的攻防技术不断更新迭代的。



例如,2014 年以前黑灰产的攻击手段主要以批量注册机、暴力破解器等为主,此时的业务安全技术则处在一个被动风险运营阶段,即事件触发被动型风险运营。


事件触发被动运营又分为具体业务级、通用接口级、平台级三个阶段。


具体业务级阶段,当风险发生时,用户通过客服反馈问题,再通过客服反馈给开发人员解决问题,处于被动修复业务漏洞阶段。



接口级别阶段,同样是被动风险运营,但相比于具体业务级阶段,可提供统一的安全接口服务,支持多业务风险识别。



发展到平台级阶段,已开始往专家团队主动风险运营方向演进,不仅从公司层面成立业务安全部门,而且还提供统一的业务安全平台,支持风险识别和策略制定。



2015 年之后,黑灰产的攻击手段更多转向了打码平台、猫池等,此时的业务安全技术走向了主动风险运营阶段,即专家团队主动型风险运营。


专家团队主动型风险运营又细分为两个阶段:平台发展阶段和平台成熟阶段。


平台发展阶段,业务安全平台持续建设,服务模块化、组件化,着手进行数据整理和分析沉淀,周边支撑模块增强、有专门运营/产品/技术团队。


平台成熟阶段,这个阶段有成熟的平台和完善的组织,业务线策略运营团队、数据分析和建模团队、审核和案件团队、客服团队、专家团队,并进行组织建设,完成业务安全工作闭环。



2018年之后,黑灰产的攻击手段也转向了设备智能化方向,诸如一些智能辅助工具(自动监控、抢单、锁单)、云手机设备等等。此时业务安全也转向了智能化、自助化风险运营。



智能化、自助化风险运营阶段业务安全技术对AI 能力进行了深度集成,并且可以做策略和运营的自助化管理,同时,还可以对风险验证等级自动化适配、业务安全情报自动推送、自助获取策略升级包。


如何设计一个业务安全平台架构?


正如前文所述,随着数字化进程的加快以及黑灰产逐渐专精化,对于企业而言构建一个业务安全的全链路风控中台在企业数字化发展过程中尤为重要。


那么,如何构建一个业务安全平台架构呢,晓科在直播中也做了详尽介绍。


针对面临的挑战和问题,结合业务安全技术的演进趋势,晓科认为当前业务安全平台架构应重点关注是否支持多场景覆盖、是否可以覆盖多环节,做到全链路防控。同时,在技术层面,要面向中台设计,避免烟囱式建设,紧贴监管方向,保证性能和稳定性,兼顾安全和运维,支持AI深度赋能,开放共享运营经验。


整体架构主要分为四个部分,第一部分是全链路的安全工具/应用;第二部分是底层支撑的服务和AI能力;第三部分是综合运营管理台;第四部分,也是最核心的一个部分——业务安全云,这是业务安全运营中持续积累的一个经验库,有最新的业务安全情报,也有智能防御的策略和运营过程中沉淀的风险数据库。



在功能设计上,需要把握以下几个重点。


就如何覆盖多场景方面,企业的业务场景很多,在设计业务安全平台架构时,首先要考虑是否可以覆盖多个场景,需要把控以下三点:



一是统一接入层,因为每个业务场景的业务字段是不一样的,因此这一层的功能设计在数据结构上提交松散的数据结构,比如KV 数据结构。


二是字段映射层,我们通过kv 数据结构提交到统一接入层后,字段映射层会进行字段的解析和归类。归类后,我们会把业务提交的字段分为两部分,一部分是通用字段,诸如IP地址、设备指纹、用户ID 、手机号等,一部分是具体业务场景的相关字段,诸如注册时间和注册商品相关、活动ID和营销活动相关、产品金额、交易金额和交易场景相关。


对字段进行解析分类后,接下来要做的就是如何针对业务线做针对性的防控,即第三点策略管理/规则执行层。


在策略管理/规则执行层,需要针对不同的场景涉及不同的策略包,不同的策略也会有不同的策略执行模式。在策略执行模式上又分为场景通用策略模式和交易和信贷场景策略模式。


就轻量、高效的规则引擎设计层面,需要把控以下几点:



首先我们来看最上层,数据+表达式+执行器这三个点在设计规则引擎里是最核心的三点。数据就是通过API来输入的数据,表达式就包含关系运算符、算数运算符、名单匹配等基础组件,执行器就是要将数据和表达式运算成最终想要的结果,在执行器里,不同的策略模式有不同的执行器,比如普通规则执行器或者传统模式执行器会把数据和表达式执行出最终结果,也就是对请求的风险识别结果。


另外,从数据层面来看,在API 请求这个环节,我们可以针对请求数据做处理,包括请求验签、参数校验、参数映射、数据统计、日志记录等。当然,这也要结合具体设计增加不同的拦截性或者过滤性。


基于以上三个核心点,基本可以排除掉 Drools、Activiti 或基于此进行的二次开发。


就安全和运维层面来看。



首先来看运维层,可以看到应用服务的云化和容器化是必然趋势,对于企业而言,无论是从企业的运营效率、还是从资源成本、人力投入来看,容器化是运维的一个方向,通过容器集群的管理,我们可以对应用服务做更好的服务编排,包括快速弹性化的伸缩,随时做快速的扩容缩容。


从功能上来看,包括加签/验签、变更审核、灰度观察、审计日志、请求快照、数据隔离、角色/权限、系统监控、版本管理、账密增强等,其中,请求快照是比较重要的一个模块,因为在业务运营过程中,用户会有反馈和投诉,我们可以通过请求快照来快速定位用户及请求过程,提高运营效率,提升用户体验。


在具体功能实践上,还需考虑以下几个关键问题:


一是实时计算技术,在业务安全场景里,滑动窗口更适合做实时性的数据统计。



在设计实时计算模块时需要考虑两点,一是满足场景需求(营销活动(高并发)、交易场景(高并发)和信贷场景(低并发)),比如营销活动就是高并发场景,在这样高并发的场景里我们要保证每个并发请求的风险识别,都需要实时更新和获取指标值(去除map/reduce编程模型、微批处理等过程,保证请求进来当下就完成计算,确保实时决策的准确性);二是减少内存占用和维护成本(用户数 * 指标数 * 窗口大小(部分指标)、集群。


在规则引擎设计的具体实践上,需要把握三个关键问题。



一是简单和应用性,这是最为基础的功能,规则引擎面向业务,面向策略分析人员,因此在规则策略的设计上要考虑可视化、配置化管理,不要依赖外部工具,二是轻量、高效、可扩展,要提升规则的执行速度就要尽可能使用开发语言的原生函数,尽可能避免引入外部函数和工具,同时也要考虑并行/串行权衡以及变量扩展(字段、指标、外部数据、模型服务等),三是影响性能的点有哪些,比如内存使用不应随着规则策略的数量增长而增长,在外部调用上考虑采用同步处理技术等。


最后是耗时问题。



业务处理的流程和耗时对于业务的影响是非常大的,从架构要求上来看需要保证足够好的性能和用户体验。


下期将由顶象研发总监兼人工智能专家管胜为大家带来主题为《业务安全实践—信贷评分模型实战演绎》的技术直播课程,敬请期待!



声明:该文观点仅代表作者本人,转载请注明来自看雪