聚焦创新性和实用性方法近千支队伍参与数字安全公开赛

发布者：Editor

发布于：2021-09-07 16:33

致力于打造计算智能与数字安全领域“奥林匹克竞赛”的数字安全公开赛正在火热进行中。截至9月7日，这场由中国计算机学会（CCF）主办，大数据协同安全技术国家工程实验室、中国计算机学会大数据与计算智能大赛（CCF BDCI）组委会联合组织的赛事，已吸引了946支队伍参赛，其中包括来自清华大学、北京大学、中国科学院大学、浙江大学、武汉大学、西安交通大学等高校的500余名学生，以及来自互联网、通信、信息系统、金融等行业的400余名企业在职人员、科研院所研究人员。

大赛共设置三道来源于应对真实业务风险的赛题，分别是基于人工智能的恶意软件家族分类、面向黑灰产治理的恶意短信变体字还原、工业安全生产环境违规使用手机。目前，三道赛题分别吸引了441支、237支和268支队伍参赛。

CCF大数据专家委员会副秘书长、中国人民大学教授、CCF大数据与计算智能大赛工作委员会主席窦志成表示，希望参赛选手能够勇于探索和创新，聚焦具有创新性和实用性的方法和技术。

大数据协同安全技术国家工程实验室常务副主任、三六零(601360.SH，下称“360”)集团副总裁、首席安全官杜跃进博士表示，对安全行业从业人员来说，数字时代的安全风险既是挑战，也是机会，希望参赛选手能够不断寻找大安全风险最优解。

441支战队出动用AI助力恶意软件识别

截至9月7日，共有441支队伍参加了基于人工智能的恶意软件家族分类赛题。

该赛题合作方为360高级威胁研究院，该研究院相关负责人指出，恶意软件是一类危害信息系统正常运行的计算机程序，包括计算机病毒、木马、后门、蠕虫、勒索软件等，黑客或网络犯罪团伙可利用这些恶意软件窃取用户隐私，监控用户操作，盗取账户、口令，加密用户重要数据，甚至是发起高级可持续威胁攻击（APT）。随着社会信息化的不断深入，其危害不断加深，小到个人隐私、财务安全损失，大到危机社会、国家安全。

以勒索攻击为例，近期，全球财富五百强、咨询行业巨头埃森哲遭受勒索攻击，6TB内部数据被窃取，2500台设备被加密，并被要求支付5000万美元的赎金。

360一直致力于发现、拦截和处理恶意软件。2020年，360安全大脑共截获移动端新增恶意程序样本450余万个，拦截钓鱼网站攻击1006亿次；手机卫士共为全国用户拦截恶意程序攻击约52.8亿次；360 反勒索服务共接收并处理了约3800 例勒索病毒攻击求助，其中超过3700例确认遭受勒索病毒攻击。最终帮助超过260 例反馈用户完成文件解密工作。

值得一提的是，在过去数年里，360累计发现了46个其他国家背景的APT组织，监测到3000多次对中国的国家级网络攻击。

但是，近年来，为逃避检测，恶意软件制作者在恶意软件组件中引入了多态性，使得原本隶属同一家族的文件看起来像许多不同的文件，降低了检测识别的准确性。这也是目前识别和拦截恶意软件面临的主要挑战。

本届数字安全公开赛正是基于此挑战设置任务，参赛团队将设计算法对恶意软件进行识别和家族分类，选手需要通过分析训练集中各家族恶意软件的特点，构建AI模型，对测试集中各个家族的恶意软件进行区分，以提升海量恶意软件分析的高效性。

237支队伍角力最难赛题变体字还原打击黑灰产

面向黑灰产治理的恶意短信变体字还原的赛题合作方为360手机卫士，目前，共有237支队伍参加该赛题比赛。

据360手机卫士方面介绍，恶意短信一直是黑灰产引流的重要渠道，信息中携带的微信号、QQ号、网址更是非法信息传播的主要入口。

针对恶意短信，业界通常做法是利用违法或不良信息检测引擎在手机终端实现自动拦截。据360手机卫士、天枢智库联合发布的《2021年上半年中国手机安全状况报告》显示，360 手机卫士上半年共拦截各类垃圾短信约 93.4 亿条，其中诈骗短信和违法短信分别占比 6.3%和0.1%。

360手机卫士通过长期的反诈实践研究发现，不法分子为逃避检测而使用变体字发送恶意短信绕过拦截规则的情况越来越多。据测算，360手机卫士平均每天拦截约300万诈骗短信，其中利用变体字生僻字实施短信诈骗的占比约为64%。

而由于变体字变换方式多，变换速度快，单纯通过规则进行变体词发现的效果有限，配套人工审核成本高且具有滞后性。

因此，如何精准和高效地还原变体字文本，提高非法信息的抽取能力，以及新型变体字还原的泛化性和时效性，就成为了解决这一难题的关键。

针对这一难题，本届数字安全公开赛要求参赛团队对训练集中的短信样本进行分析，采用深度学习建模的方法将测试集中新出现的短信变体字还原为正常信息文本，即不含有变体字、干扰字符，所有变体字部分应使用常见简体汉字、字符来表示，同时需要保证不包含变体字的正常文本不受影响，助力提升诈骗信息抽取率，进一步提升变体词短信的拦截能力。不仅如此，该赛题还对模型大小和单条短信推理耗时提出较高的竞争要求，堪称本届公开赛最难赛题。

安全生产是红线 159支队伍参与违规使用手机识别比赛

共有159支队伍参加了工业安全生产环境违规使用手机的识别赛题。

安全生产是工厂正常经营的基本红线。但在工业生产环境中，工作人员在作业区违规使用手机已成为引发安全生产事故的一大隐患。因此，基于工业安全生产和员工人身安全考虑，越来越多的工厂建立起员工手机使用管理规范

传统的管理手段主要是禁止将手机带入厂区或者集中放置，或是人员监督抽查核查。但不仅存在耗费大量人力的问题，而且总有“空子”可钻，难以做到事前预警、始终常态检测、事后规范管理的全链条监管。

《中华人民共和国安全生产法（修正草案）》的说明中特别强调，要强化基础保障能力，依靠法治力量推进安全生产治理体系和治理能力现代化。目前基于人工智能技术的工厂安全生产监控预警系统逐渐应用部署起来，该系统通过对设置在生产工区内摄像头采集的视频图片进行分析，快速、准确识别员工违规使用手机的行为，并进行提示和规范，可有效加强安全生产监管，实现降本、提质、增效，加速数字化转型进程。

基于此提炼的赛题任务，要求参赛团队结合提供的数据训练集，识别判断图片上的人物是否存在使用手机行为，提高识别的正确率。

据了解，上述三道赛题，是从大安全领域产业应用的真实场景中提炼而来，分别针对三个具体场景和问题。杜跃进表示，希望通过数字安全公开赛，发动社会力量，以互相促进的方式做创新，为真实场景下的安全问题提供更好的解决方案。

数据安全公开赛

声明：该文观点仅代表作者本人，转载请注明来自看雪

聚焦创新性和实用性方法 近千支队伍参与数字安全公开赛

聚焦创新性和实用性方法近千支队伍参与数字安全公开赛