披沙沥金，大模型助力海量情报分析

发布者：绿盟科技

发布于：2023-09-13 16:54

在ChatGPT呈现全球现象级热度时，通用大语言模型技术已成为推动创新和变革的关键驱动力。基于“人工智能+安全”多年积累的安全专业经验和高质量数据，9月1日，绿盟科技正式发布绿盟风云卫大模型（NSFGPT），同期推出《安全行业大模型 SecLLM技术白皮书》，分享其在安全行业大模型研发过程中所积累的最佳实践与经验教训，以期为安全行业提供“量身定制”的大模型解决方案。

乱花渐欲迷人眼

海量信息下的网络安全

“知己知彼，百战不殆”，威胁情报收集与分析作为安全防护中的“千里眼” “顺风耳”，在威胁应对、风险控制、决策辅助等方面充当了关键的角色。然而，互联网普及所带来的信息爆炸，给信息的收集整理和威胁情报分析使用带来了新的挑战。

在信息收集整理的过程中，需要面对互联网上不断涌现出的海量信息。如此浩如烟海的数据会直接造成信息过载的问题，其中包含的噪音和重复内容，会增加整理的难度。此外，收集到的信息可能来自不同的语言、文化和专业领域，其数据载体和格式也往往是多样的，这更让信息的整理和分析难上加难。

在情报分析使用的过程中，巨量的情报也会带来新的困难。第一，用户需要在海量情报中检索出所需的情报，但是复杂的查询语法带来了较高的使用门槛。第二，主动检索的模式存在着较大的隐患，一方面，用户的检索难以覆盖到所有相关情报，存在很大的遗漏风险；另一方面，当与用户自身高度相关的威胁情报产生时，用户很可能在几小时之后才获知这一消息，这无疑会让用户更久地暴露在风险之下。第三，结合多源头、多维度情报数据来高效分析情报，也是一项难度颇大的任务，不同来源的情报甚至可能会产生冲突。第四，在对情报进行总结时，要进行大量研究并编写报告，这一过程需要丰富的经验以及大量的人力，在网络安全问题日益严重的今天，这无疑是低效的。

“大风起兮云飞扬，安得猛士兮守四方”，绿盟风云卫大模型面对高速动态变化的信息丛林，可以提供专业、高效的整合分析能力。该大模型同时具备通用大语言模型的自然语言理解能力和网络安全专业知识分析推理能力，针对上述信息收集整理和情报分析过程中面临的问题，能够很好地解决其中的难点痛点。

一日看尽长安花

人工智能+安全高效赋能网安

围绕威胁情报平台，风云卫可以从情报数据的输入、整理、检索、分析、推荐等方面提供能力，为信息整合和情报挖掘带来新的解决方案。下图展示了风云卫在多源情报整合过程中所能够提供的能力。

新能力：风云卫+威胁情报

风云卫在进行情报智能整理时，能够通过对信息进行语义分析和关联性识别，将来自不同渠道的多种形式的信息汇聚为有机的整体，消除信息碎片化问题，从而提高信息整理的效率和全面性。在这个过程中，风云卫结合自身丰富的网络安全领域知识，能够准确识别出信息中格式多样的威胁情报实体，以及实体间复杂的关联关系，从而高效地实现去噪、摘要、归类等功能，并汇总到威胁情报平台中，实现情报梳理和整合的自动化。

威胁情报平台在结合了风云卫后，可以派生出多种新的能力。在海量情报检索过程中，集成了风云卫的威胁情报平台能够实现自然语言查询。用户无需牢记大量查询规则和语法，只需要使用自然语言描述出其需求，风云卫可以理解语言，进而自动生成查询语句。更进一步地，可以实现一站式查询功能，无需从多种平台搜集信息。下图是使用自然语言进行一站式检索的示例。

自然语言查询

除了用户主动检索，风云卫还可以结合用户的具体情况，判断用户可能感兴趣的领域和内容，主动推荐相关情报。此外，鉴于情报的突发性，为了避免用户长时间暴露在风险下，风云卫也可以结合用户具体情况进行预警推送。下图是风云卫的主动推荐示例。