网络威胁变得越来越普遍。最近备受瞩目的入侵事件表明,秘密的的网络空间效应如何能够挑战21世纪的国际安全战略格局。每个经济部门和人类生活的各个方面对数字技术的日益依赖强烈地表明,这一趋势将继续下去。北约盟国正以日益强大的网络安全和防御来应对,特别是当它与军事系统、平台和任务相交时。对提高复原力和稳健性的要求加速了对人工智能技术的探索和采用,即使计算机能够模仿人类智能的技术,用于网络防御。深度机器学习(DML)就是这样一种最先进的技术,它在网络安全以及许多其他应用领域都表现出了相当大的潜力。深度机器学习可以增强网络弹性,其防御措施随着时间的推移随着威胁的变化而变化,并减少人类专家手动数据分析的总体负担。深度机器学习可以促进更快的响应,特别是在充分和足够的训练下。一些可能的考虑包括在建立或生成数据模型开发中的对抗性样本。本技术报告在整合北约范围内深度机器学习(DML)的网络防御应用知识方面采取了初步措施。它进一步确定了目前的解决方案和军事需求之间的差距,并相应地构建了DML在军事领域有前途的网络防御应用的追求。研究小组以技术报告的体现为核心,从恶意软件检测、事件管理、信息管理、漏洞管理、软件保障、资产管理、许可证管理、网络管理和配置管理的角度审查国家标准和技术研究所的安全准则。该报告研究了DML的复杂效用、实际实施以及公开的挑战。研究工作组由数据科学、机器学习、网络防御、建模与仿真和系统工程等领域的专家组成。研究人员和从业人员考虑了数据的聚集、数据的特征、共享数据的需要以及数据模型的共享,或其生成者。这些因素,包括如何处理、训练、访问数据,以及相关的技术,如迁移或联邦学习,也被考虑在内。第1章 背景
网络威胁越来越先进,对手更具战略性,可以从世界任何地方表现出威胁。今天的对手拥有资源和时间,只要有时间和资源,就可以轻松地发动破坏性攻击。不同格式的数据的可用性和丰富性也有助于为对手创造一种灵活性,如果没有数据的涌入,这种灵活性是不存在的[1]。由于对手很容易获得工具和技术,所有形式的大数据的可用性,网络攻击达到了前所未有的高度,北约国家必须通过缓解工具和技术来增强其战略地位,以减轻对军事系统、平台和任务的网络威胁[2]。缓解技术将包括最新和最伟大的技术,以创造弹性,及时发现和应对攻击,并在平台发生任何损害或损害之前恢复。世界正在变得更加数字化[3],军队也不例外。随着先进工具的出现和技术的数字化,研究人员必须做好准备,研究防御性技术,以防止军事系统和平台的破坏和退化。RTG计划探索深度机器学习(DML)的应用,以实施和加强军事战略网络地位,并创建一个防御,不仅要解决今天的威胁,还要解决未来可能出现的威胁,如增加的处理能力,先进的工具和数据操作技术。拟议的 "IST 163 - 网络防御深度机器学习"活动的主要目标是巩固全北约在DML和网络防御领域的知识,确定民用解决方案和军事需求之间的差距,并与其他北约国家合作,使用数据处理,共享数据和模型,并追求将最有前途的技术和应用转移到军事领域,同时坚持标准,确保数据与所选技术相匹配。RTG致力于发现北约各国的DML技术,揭示数据是如何处理和适合神经网络的,并确定各国在这些技术中的差距,以比较最佳的解决方案,这些解决方案有可能被其他可能没有潜力或技术不先进的国家采用。这项研究为各国创造了一个机会,以全面审视DML在网络防御方面的能力和差距,并研究以最先进的DML方法加强网络防御的手段。在为DML创建数据时,来自不同背景的研究人员将共同支持反映数据效用和模型的最佳情况的用例,并努力确保数据最适合于研究。考虑到来自多种背景的拟议数据的动态,对数据的整理和消毒以适应模型,将创造一个机会,看到不同类型的数据对DML模型的各方面作用。将特别关注术语与北约其他倡议中的相关活动的一致性。因此,它将面向来自人工智能、机器学习、建模和模拟以及系统工程等领域的多学科受众。工作组的工作将集中在机器学习上,包括深度学习方面。第2章 军事关系
网络防御影响军事行动的所有领域,包括通信、行动和后勤。随着威胁的复杂化和对手变得更加创新,传统的基于签名的检测威胁的方法很容易被规避。现有的防御措施无法跟上新的漏洞、漏洞和攻击载体出现的规模。显然,有必要开发自动和数据驱动的防御系统,其模型适合于军事系统和联盟操作环境。减少数据分析的负担和扩展到多样化和联合环境的网络防御技术,现在和将来都对军事行动相当重要。在这一类别中,一个有前途的领域是机器学习(ML)的应用,即研究和开发没有预编程指令的模式识别方法来解释数据。Theobold[1]明确阐述了机器学习的效用:- 几十年来,机器都是靠响应用户的直接命令来运作的。换句话说,计算机被设计成响应预先编程的命令来执行既定任务。现在,计算机严格来说不需要接收输入命令来执行任务,而是需要输入数据。具体来说,机器根据数据中捕捉到的以往经验创建一个预测模型。从输入的数据中,机器就能制定出如何、在何处、何时执行某种行动的决定。[1]
在20世纪上半叶的20年里,美国的武装部队是数字计算机发展的唯一最重要的驱动力[2]。随着商业计算机行业开始形成,武装部队和国防工业成为其主要市场。在其发展过程中,人类对所有的软件进行编程,并作为计算和算法进步的主要驱动力。面向对象的编程使软件可以重复使用,并扩大了其规模。后来,互联网使软件民主化。随着深度机器学习(DML)的出现,这一格局正准备再次发生根本性的转变,这是ML的一个子集。DML技术通过训练描述输入和输出之间关系的模型,使计算机能够 "编写 "自己的软件。这一突破已经在加速每个行业的进步。研究表明,深度学习将在未来20年内使全球股票市场增加近50%[3]。网络防御也不例外,这是个趋势。20世纪后半叶,社会和军事应用中越来越多地采用数字技术,而21世纪头几十年的常规数据泄露事件,说明了一个有弹性的网络空间的重要性。人工智能(AI)的应用,包括用于网络防御的ML和DML,已经在国防研究论坛上获得了相当多的曝光[4]、[5]、[6]、[7]、[8]、[9]、[10]、[11]。这些应用具有相当大的军事前景,特别是涉及到漏洞发现、威胁识别、态势感知和弹性系统。第4章 深度机器学习在网络防御中的应用
传统的网络安全和网络防御方法依赖于人工数据分析来支持风险管理活动和决策。尽管这些活动的某些方面可以自动化,但由于其简单性和对问题领域的有限理解,自动化往往是不足的。在这一章中,我们将调查DML应用的文献,这些应用可以帮助信息安全的持续监控,用于美国国家标准研究所定义的一组安全自动化领域[1]。我们这样做是为了对最先进的研究现状、实际实施、开放的挑战和未来的愿景建立一个结构化的理解。通过这些见解,我们指出了DML在整个网络安全领域应用的一系列挑战,并总结了我们的发现。
在不同的安全自动化领域中,我们已经确定了主题和建议未来研究的领域。其中一个反复出现的主题似乎是缺乏实际的实现,也就是说,缺乏高技术准备水平(TRL)。我们怀疑这可能是由于许多不同的原因,例如,未满足性能预期、数据不足、不合格的深度学习架构、对促进可扩展的DML应用的通用数据存储和分析解决方案缺乏共识,或研究的初级阶段。通过我们的初步调查,我们强调了未来的研究方向和/或阻碍每个安全自动化领域的进一步进展的问题。- 恶意软件检测。DML应用需要处理恶意软件如何随着时间的推移改变其统计属性,例如,由于对抗性方法(概念漂移)。还有一个问题是关于数据共享,以适应不太可能被释放到野外的高级恶意软件,以及一般的数据访问。此外,还需要研究如何定义能够代表软件的新特征,以便进行检测和归属。
- 事件管理。DML与现有安全控制的整合不足,限制了DML应用的开发程度。在操作化、管理和例行程序方面,以促进标记数据的收集和深度学习模型的开发。
- 信息管理。DLP系统可以与网络和终端系统紧密相连,需要对系统有一个深刻而广泛的了解。在当前的IT安全趋势下,加强数据保密性,这样的系统正面临着数据可访问性的降低。这绝不是这个领域特有的问题,但却使DML应用的开发变得复杂。因此,研究机会是存在的,例如,通过与底层操作系统更深入的整合来恢复数据的可访问性。然而,也有一些课题需要研究描述任何给定数据是否包含敏感信息的条件,以及相同数据的变化如何被识别,而不考虑例如编码方案。以及当所需的数据在没有额外分析的情况下无法直接获得时,如何表示模糊或开放的规则并验证其合规性。
- 脆弱性管理。缺乏共识和对公共和足够大的数据集的访问,已经被认为是漏洞发现领域的一个挑战。然而,有一些尝试可以减少这种依赖性,通过部署预先训练好的语言模型,例如,对软件扫描进行模糊测试,以检测漏洞并协助修补漏洞。我们预见了两个可以进一步研究的方向:改进深度学习架构或改进数据集及其特征表示。
- 软件保证。尽管支持DML应用的技术存在于相关领域,如恶意软件检测和漏洞管理。我们还没有发现在这个领域内研究问题的努力,但当多个DML应用能够协同工作时,我们期待这种发展。
- 资产管理。随着即将到来的资产新浪潮,被称为 "工业4.0"。其中包括制造业的自动化和数据交换的趋势,以及移动设备、物联网平台、定位设备技术、3D打印、智能传感器、增强现实、可穿戴计算和联网的机器人和机器。我们认为,DML的应用可以并将有助于这种未来资产管理的某些方面,然而,哪些方面仍然是一个开放的研究问题,开放的文献表明,需要探索行业特定的使用案例。
- 许可证管理。考虑到软件资产管理(SAM)考虑到许可问题,这里也适用与资产管理相同的未来研究方向。- 网络管理。移动目标防御(MTD)是一个新兴的研究领域,将大大受益于人工智能驱动的方法。
- 配置管理。我们希望与MTD研究相关的技术可以使配置管理能力受益。
- 补丁管理。我们已经确定了解决某些问题的研究,如:以风险意识的方式动态调度补丁,自动漏洞修复分析,以及在软件补丁尚未可用的情况下定位漏洞缓解信息。然而,没有人试图将这些纳入一个单一的模型,从而创建一个完整的管道。这可能是未来研究中需要探索的一个领域。
最后,我们没有发现任何证据表明,任何安全领域在DML应用方面的研究都已经完成。所有的领域都有尚未探索的研究领域,这些领域在未来可以并且有望经历重大的研究。军事行动植根于对工业时代危机的实际反应,并由关于规模、杀伤力和覆盖范围的假设形成[1]。然而,当代冲突跨越了区域边界和地理领域。威胁的数量和行为者的范围在数量和多样性上都在增长,这与需要与之协调应对的行为者的数量相呼应。利用网络空间的敌人可以挑战盟国能够或愿意作出反应的门槛。对网络领域的依赖增加了在敌方网络空间实现支持军事目标的效果的重要性。最终,军事行动变得更加动态和复杂。深度机器学习(DML)已经成为人工智能领域的主要技术来源。可以预见的是,DML对网络防御之外的军事应用的影响将是广泛的,因为它提供了在军事行动环境中获得信息和决策优势的机会。在本章中,我们将研究那些有可能受益并因此重塑网络防御的军事应用,超越传统的保护、威慑、检测和响应概念。
7.1 指挥与控制
7.2 态势感知和任务保证
7.3 网络空间防御作战
7.4 社交网络安全
7.5 网络欺骗
专知便捷查看
便捷下载,请关注专知人工智能公众号(点击上方关注)
专知,专业可信的人工智能知识分发,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取70000+AI(AI与军事、医药、公安等)主题干货知识资料!
点击“阅读原文”,了解使用专知,查看获取70000+AI主题知识资料