人工智能的智能体不包括心理研究(AI)心理干预系统有哪家?

美国DARPA在人工智能领域的新发展

美国国防高级研究计划局(DARPA)一直处在人工智能研究的前沿,可以说,美国人工智能的发展很大程度上归功于DARPA的支持。从20世纪60年代初至今,在60余年的研究中,从最初的基础研究项目到军事应用研究,DARPA在基础研究和应用研究之间建立了平衡,先后进行了自然语言理解、感知和机器人、可解释的人工智能、下一代人工智能、人机融合、基于人工智能的网络攻击与防御技术等领域的研究。因此,在人工智能领域的研究和技术选择方面,DARPA对未来人工智能技术的发展起到重要支撑和引导作用。本报告梳理了近三年DARPA在人工智能领域的新进展及新项目,分析项目中涉及的技术及DARPA的研究重点,研判DARPA未来人工智能的发展趋势,最后,基于上述内容提出几点认识和思考。

一、DARPA在人工智能领域的重点技术域及研究项目

当前,除了2018年美国《国防部人工智能战略》给出了人工智能(AI)的简明定义外,学术界对人工智能技术并没有明确的定义和分类。DARPA当前正在进行的人工智能计划或项目合计约33项,涉及范围很广。本报告选取DARPA的部分计划和项目,将其从事的人工智能技术群归纳、提炼划分为通用的9个技术领域,2017年以前DARPA的研究范畴未纳入本文所列技术范围。

(一)基于人工智能的网络安全技术

以人工智能技术为支撑的网络安全攻击和防御已成为网络安全发展的新方向,迫切需求全面而深入地开展基于人工智能的网络安全攻击和防护研究应用落地,无论是军事领域,还是产业界支持人工智能与网络安全的集成势在必行。到2026年,人工智能网络安全市场规模预计将增长到382亿美元,年复合增长率高达23.3%。为此,DARPA在网络攻击和防御领域都开展了相关研究,开发AI工具并用于网络领域,是DARPA长期战略中深度推进的几个关注焦点之一。攻击方面高度重视研发基于人工智能芯片的自主网络攻击系统,进一步提升美军在网络安全领域的进攻实力。防御方面创建了利用僵尸网络植入针对性打击网络攻击的HACCS项目;旨在开发新一代防御技术,寻求可靠的抗欺骗机器学习模型和算法的GARD项目;采用自适应数据收集技术发现隐藏在大量输入数据中的高级网络攻击的CHASE项目;寻求对社会工程攻击自动防御的ASED项目;意在融合人工和计算机网络防御系统,发挥“1+1>2”联合效应的CHESS项目。

*基于人工智能的网络攻击技术

“基于人工智能芯片的自主网络攻击系统”项目。最初由美斯坦福大学和美Infinite初创公司2017年10月联合研发,DARPA给予高度重视并予以优先资助。该系统能够自主学习网络环境并自行生成特定恶意代码,实现对指定网络的攻击、信息窃取等操作。该新型网络攻击系统基于ARM处理器和深度神经网络处理器的通用硬件架构,在特定网络中运行后,能够自主学习网络的架构、规模、设备类型等信息,并通过对网络流数据进行分析,自主编写适用于该网络环境的攻击程序。该系统每24小时即可生成一套攻击代码,并能根据网络实时环境对攻击程序进行动态调整,由于攻击代码是全新生成的,因此现有的依托病毒库和行为识别的防病毒系统难以识别,隐蔽性和破坏性极强。DARPA高度重视该系统的自主学习能力、应对病毒防御系统的能力,认为具有极高的应用潜力,能够在未来的网络作战中帮助美军获得技术优势。

*基于人工智能的网络安全防御技术

(1)“利用自主系统对抗网络对手计划(HACCS)”项目。该项目于2018年启动,将持续4年,是DARPA的重点项目之一,正迅速推进人工智能与网络安全和网络战的集成。该项目将网络空间中脆弱的和已被恶意控制的节点集合统称为灰色地带,灰色地带的节点可能表现为僵尸程序、后门和跳板等形态,可能被多个攻击者利用。该项目旨在通过技术和算法,测量识别僵尸网络感染的网络,识别驻留在网络中的设备类型以及潜在访问媒介的稳定性。总体目标是开发“自主软件助理”,研究能准确识别僵尸感染网络、网络设备类型及潜在的稳定访问矢量的技术和算法,以利用僵尸网络植入有针对性地打击网络攻击,以及大规模恶意软件攻击,旨在整合AI增强型应用程序来捍卫美国武装部队的网络。

目前该项目正投资于三项主要技术领域:在互联网上发现和识别僵尸网络的系统;通过已知安全漏洞将软件传至受感染设备的工具;能够禁用僵尸网络恶意软件传输应用的软件。最终,DARPA计划将这些技术集成到一个单独的系统中,这样就可以在无人参与的情况下发现、处理和消除受僵尸网络感染的设备。目前项目的第一阶段由Packet Forensics公司研发能够扫描全球约5%的IP地址,并且发现僵尸网络的准确率达80%的技术。到项目结束时,DARPA预计该系统将能够对全球80%的互联网进行扫描分析,并且发现僵尸网络的准确率可达95%。

(2)“确保人工智能抵御欺骗的稳健性(GARD)”项目。该项目于2019年启动,意在寻求以检测、定位和预测进行防御,推动先进机器学习防御技术;寻求通过开发抵抗不同模式物理攻击(视频和音频)的防御技术,推动先进机器学习防御技术超越标准的数字图像模式。该项目的三个具体目标是:(1)开发防御性机器学习的理论基础。这些基础包括用于衡量机器学习弱点的标准,以及用于确定增强系统可靠性的机器学习性能标准。(2)在各种环境中,创建并验证原则防御算法。(3)构建基于想定的评估框架,表征在多种目标和威胁模型下的防御技术。2019财年,项目团队重点研究识别漏洞产生的原因,为机器学习算法的鲁棒性制定指标;2020财年开发提高机器学习系统应对欺骗数据和敌对攻击鲁棒性的方法,通过挑战性问题、攻击模拟和公开竞赛建立机器学习风险评估试验台。

尽管当前机器学习防御技术倾向于高度针对特定攻击和狭窄威胁模型,但GARD项目寻求开发更通用的防御技术,适用于广泛的攻击类别和不同的威胁模型。GARD项目的防御技术将在基于想定的框架中评估,表征针对多种威胁的防御能力,包括:数字之外的物理环境;药饵和推理攻击;不同级别的攻击者或防御者知识(例如黑箱、白箱);输入模式(例如图像、视频和音频),以及多模式多传感器设置;攻击者和防御者的资源约束(例如计算、数据和疑问)。

(3)“大规模网络捕猎(CHASE)”项目。企业规模的网络在规模和分布式结构方面都面临挑战,当今最先进的商业工具也无法直接解决为多个网络提供最佳防御所需的规模和速度。2018年,DARPA和BAE系统公司联合开发一种以人工智能为支撑的新型大规模网络捕猎(CHASE)安全技术。该项目寻求开发自动化工具,以检测和表征新颖的攻击媒介,收集正确的上下文数据以及在企业内部和企业之间传播保护措施。CHASE的目标是开发用于检测,表征和战略数据管理的基础技术,专注于研究能够加速网络搜索的方法,在正确的时间从正确的设备提取正确的数据,利用机器学习建立自动化,通过模式识别、背景关联、新旧数据对比来组织和分析新的信息。DARPA将此技术称为“自适应数据收集”,使用计算机自动化、高级算法和更高的处理速度实时跟踪大量数据,使网络“猎手”能够发现隐藏在大量输入数据中的高级网络攻击。通过过滤人类网络防御者无法追踪的大量信息,开展实时调查研究。

CHASE项目还将开发一些组件的原型,这些组件能够让网络所有者重新配置传感器,达到机器的速度,同时又具有适当的人工干预,不仅要挫败恶意软件、网络钓鱼和拒绝服务攻击,而且还要挫败更缜密、更复杂的攻击。该项目由三阶段组成,计划在三年内为美军提供该技术,目前处于第一阶段,主要利用机器学习优势,即计算机自动化处理大量信息,并同时将数据置放在正确的背景下,一定程度上,可通过使用算法分析数据(有时以毫秒为单位)来实现。

(4)“主动社会工程防御(ASED)”项目。DARPA于2017年9月发布ASED项目公告,旨在寻求利用软件机器人从恶意对手那里自动获取信息,以甄别、破坏和调查社会工程攻击。软件机器人将传达用户和潜在攻击者之间的通信内容、检测攻击行为以及协调调查行动以发现攻击者的身份。该项目包括三个技术领域:(1)自动检测社会工程攻击,主要通过观察社会工程攻击的特征研发自动检测社会工程攻击的技术,并验证通信者的身份。该项目此部分工作将研发通信机器人,以传达和观察攻击者和潜在受害者之间的通信信息。(2)自动调查社会工程人员,使用自动化、虚拟、可变自我的机器人来帮助发现攻击者的身份。每个机器人将管理它可以交易的资源,以获取有关攻击者的信息。(3)可扩展的评估团队,评估自动探测社会工程攻击和自动调查社会工程师的表现,并通过社会工程攻击衡量其进展情况。该项目将使用真实机构的电子邮件和电话系统构建试验范围,以建立技术评估的现实环境并开展真实试验。

(5)“人机探索软件安全(CHESS)”项目。该项目于2018年5月启动,其目标是实现自主、半自主网络安全系统与网络安全专家之间的协同合作,开发一种允许计算机和人类进行协作推理的技术。双方通过在类似于源代码和编译二进制文件等软件构件上进行协作,从而能比人类更快、更准确地发现漏洞,将黑客专业知识转化为技术人员更容易获得的自动分析技术,最终在机器速度下实现专家黑客级漏洞分析。该项目是DARPA在网络能力方面重点关注的三大技术领域之一,整个项目预计耗时42个月,计划将从5个技术领域寻求创新方案:人机协作、漏洞发现、进攻性的态度、控制团队以及集成、测试和评估。很明显,CHESS代表了由人机团队担任高强度网络运营的发展趋势——将人类的洞察力与机器的计算分析速度和规模相结合,利用自动化程序分析技术与高级人机协作的创新融合,实现在某些规模下、特定时间内发现系统漏洞。

(二)下一代人工智能技术

DARPA认为第二代人工智能技术依赖于大量高质量的训练数据,不能适应不断变化的条件,提供有限的性能保证,无法向用户解释其结果。未来第三代AI技术可能会极大地改变军事任务规划,科学家可利用机器开展研究,人类可与机器互动。人机各有优点和不足,两者之间更加密切的合作可实现更好的决策能力和产生更具创造性的思维。

为此,DARPA启动了开发第三代AI技术的下一代人工智能(AI Next)项目,以及大型的、多样的基础及应用的人工智能项目组合—人工智能探索(AIE)计划;致力于将AI提升为有洞察力和可信赖的合作者的AIRA计划;为第三代AI开发新算法的虚拟智能处理(VIP)项目。

(1)“下一代人工智能(AI Next)”项目。该计划于2018年7月首次宣布,并于2019年8月续签。DARPA未来5年将为此计划投资高达20亿美元,研究重点涵盖新能力、高可靠性、对抗性、高性能、下一代AI等。AI Next项目基于DARPA过去60年引领开发的两代人工智能技术,旨在解决国防部最棘手的问题,并定义和塑造未来的发展趋势。该计划的重点领域包括关键的国防部业务流程的自动化;提高AI系统的鲁棒性和可靠性;增强机器学习和AI技术的安全性和弹性;减少功耗,数据和性能效率低下;并开创了下一代AI算法和应用程序,例如“可解释性”和常识推理。

(2)“人工智能探索(AIE)”计划。该计划于2018年创建,通过AI计划,DARPA寻求开发“第三波“人工智能理论和应用程序,通过使机器能够结合上下文中的可用数据、事实、模型、启发式和附加信息来解决当前的限制,以实现更大的鲁棒性、适应性和可推广性。AIE构成了一系列高风险,高回报的项目,旨在加快AI平台的研究和开发工作,主要进行 AI 试点、概念验证、将商业技术平台用于国防用途,以及操作或技术工具的设计、开发与演示,测试创新概念的价值和可行性。该计划是一个综合性计划,研究工作包括两方面:一是侧重于基础研究;二是开发基于深度学习的模型及其他,以当前AI行业的开发基准来制定解决问题的框架。专注于第三波人工智能的应用及理论,让机器适应不断变化的情况。

(3)“人工智能研究助理(AIRA)”计划。2018年9月,DARPA宣布了人工智能研究助理(AIRA)计划,致力于将人工智能提升为有洞察力和可信赖的合作者。该计划重点解决两个目标:1)探索和开发新的人工智能算法和方法,以发现复杂物理现象的科学规律和控制方程;2)探索新的方法来评估数据过于稀疏,嘈杂或不足以建立预测模型的地方;产生可检验的假设;找出可以缓解数据短缺问题的高价值实验;并量化训练空间之外预测的置信度。该计划是DARPA AIE计划的一部分,旨在通过标准项目和相对短期的技术开发项目来提高人工智能的水平,这些项目可以快速测试和验证新的人工智能概念。此外,在AIRA计划下,DARPA寻求解决将人工智能嵌入物理学,以及更广泛地嵌入科学和科学过程的挑战。

(4)“虚拟智能处理(VIP)”项目。第三代人工智能算法要能处理不完整、稀疏、冗杂的数据,以及新计算模型引发的意外情况,同时可从较少的案例中学习新概念,并指导未来硬件的发展。2019年启动的该项目共分两个阶段:第一阶段主要解决基于未研究的数学理论的算法,并验证其能效和数据处理能力能否提高10倍,以解决军事领域的相关问题,预计持续12个月;第二阶段将第一阶段开发的算法应用于实际的数据库,并提供可行的硬件结构,探索未来硬件开发的性能伸缩预测,预计持续6个月。

当前的机器学习系统无法不断学习或适应新的情况,系统程序在经过训练后即会固化,因此部署后,无法对新的、不可预见的情况做出响应,通过增加新信息来修改程序缺陷又会改写现有的训练集。在当前技术条件下,解决这一问题需要使系统脱机,并利用包含新信息的数据集对机器系统进行重新训练。为解决这一问题,DARPA于2017年开展了“终身学习机器”项目,目的是使智能系统目前采用的固化训练方法能够被现场学习方法所取代,实现更安全、灵活、有效的人工智能系统能够在操作中学习并将学习内容应用于系统之前未经训练的新环境。同年,启动了“通过数字捕捉并传递人类行为规范”的项目,让机器人能够快速评定给定情景并学会应用人类的社会行为规范。2019年启动“能力感知机器学习”(CAML)项目,主要研究自主装备与系统能够评估自身的任务完成能力与策略,并以人类可理解的方式呈现出来。

(1)“终身学习机器(L2M)”项目。探索生物学习机理在人工智能中的应用,推进新一代人工智能系统的发展,试图打破机器学习系统对预编程和训练样本的依赖,使人工智能系统像生物系统一样能够根据经验进行决策,提高行动的自主性,增强广度环境适应能力。为了实现这一目标,L2M项目旨在从根本上开发一种全新的机器学习机制,使系统能够从经验中不断学习,并将为第三次人工智能技术浪潮打下坚实的技术基础。

该项目从2017年以来将持续4年,包含两个技术领域:第一个着眼于框架开发,可以不断应用过去的经验,应用“经验教训”于新数据和新情况。同时,要求开发的技术可用于监测机器学习系统的行为,对适应能力的范围进行限制,以及按需要控制系统的功能。研究将包括网络理论、算法、软件和计算机结构。第二个是技术领域,源于对生物学习机制的兴趣,着重探讨生物系统是如何学习和适应,以及考虑是否和如何将这些原则和技术应用到机器学习系统。2019年3月,该项目取得重大进展,所研究的机器人肢体依赖一种生物启发算法,即可自行学习步行任务,机器人“边做边学”的能力是机器终身学习的重大进步,人工智能系统有可能从相关经验中进行学习,该研究成果发表于《自然·机器智能》杂志。

(2)“能力感知机器学习(CAML)”项目。该项目自2019年启动以来为期四年,重点研究自我认知或经验认知、任务策略的自我认知、能力感知学习和能力演示四个方面,目的是通过创建一种全新的机器学习方法来改善人机协同能力,并帮助人类作战人员根据机器的专业水平和经验选择合适的智能机器伙伴,有助于将自主装备与系统从工具转变为可信任的合作伙伴。最终自主装备与系统能够控制自身行为以符合人类操作员的预期,并使操作员能够快速、准确地洞察系统在复杂的、时间要求高的动态环境中的能力,最终达到人机良性协同与互动。

(3)“通过数字捕捉并传递人类行为规范”项目。主要研究为“规范和规范性网络是什么”制定理论和形式框架;实验研究这些规范是如何在人类意识中形成并激活的;判定这些规范如何学习并通过新的交互式算法表现出来。目前已经建立了人类表现中规范的认知计算模型,并编码至机器,开发了机器学习算法,使机器能够在由人类数据描绘的不熟悉情景中学习规范。此项工作代表了人工智能系统开发的重要进步,使人工智能系统能够“凭直觉感知”如何在特定情况下以大多数人类做事的方式来进行社交活动。这些研究成果加速了人工智能机器模仿最佳人类行为规范的进程,有助于机器人变得“社会化”甚至“伦理化”。

可解释人工智能(XAI)是人工智能领域的一个新兴分支,研究如何通过动态生成的图表或文本来描述和理解AI技术做出决策的路径,解释AI决策背后的逻辑。传统的人工智能/机器学习算法在输入数据和输出答案之间存在着不可观察的黑盒空间,因此,对XAI的研究也应运而生。2017年,DARPA启动了“可解释人工智能”项目,旨在建立一套新的或改进的机器学习技术,生成可解释的模型,结合有效的解释技术,使用户能够理解、一定程度信任并有效管理未来的人工智能系统。2017年3月,DARPA从学术和工业界挑选出13家研究机构进行资助,包括加州大学伯克利分校、加州大学洛杉矶分校、卡耐基梅隆大学、SRI、PARC、Rutgers、Raytheon等。

该项目正在开发新一代机器学习技术,以形成一套基础理论来解释人工智能得出的结论,目标是产生更多可解释的模型,同时保持高水平的预测准确性,使用户能够理解、信任并有效管理新一代人工智能伙伴。该项目可分为两个技术领域:可解释的学习者和解释的心理学模型。2018年已取得了一些成果,主要在通过奖励分解解释深度自适应编程,使用场景图和视觉注意生成对视觉问答的自然语言解,学习循环策略网络的有限状态表示,一种解释贝叶斯网络分类器的符号方法等方面取得了一些新进展。2019财年评估了初始原型系统的性能,着重改进可解释的机器学习方法,完善人工智能解释理论的计算模型。2020财年着重优化可解释的机器学习用户界面,将其集成到原型系统。目前,华盛顿大学的研究团队已经取得了一些研究成果,开发了一种方法,可以让人工智能系统阐述其输出结果的基本原理,并会从数据集中自动找到一些样本,然后给出简短的解释。研究团队还针对图形识别系统设计了一些方法,通过标注图片上最重要的部分来揭示图形识别系统的判断逻辑。该项目将建立起信任的桥梁,使人类能够适应并习惯与智能机器一起工作,未来的应用前景十分可观,但还面临着巨大挑战:如何生成可解释模型、如何设计解释接口、如何理解用户心理需求以进行有效地解释等。

意识控制系统将可能推动军事理论和应用的重大变革,具有巨大的潜在军事价值,人机融合是其在未来战场应用的主要障碍之一。为解决机器和人类“思考”方式的基本差异,促进人机融合与团队合作,使人工智能系统成为“解决问题的合作伙伴”。为此,DARPA非常重视人机融合领域的研究,2019年陆续发布“智能神经接口”(INI)项目和“人工智能科学和开放世界新奇学习”(SAIL-ON)项目,致力于推动人机融合技术的发展。

(1)“智能神经接口(INI)”项目。旨在开发神经接口维护和应用的决策方法,通过模拟和利用生物神经电路信息来提高带宽与计算能力,解决中枢和外围神经接口的有关问题,建立第三代人工智能方法的概念原型,以改进和扩大下一代神经技术的应用空间。主要包括两个技术领域:一是神经接口维护,研究神经接口的可持续发展和维护决策,以提高鲁棒性和可靠性;二是信息内容的最大化,对生物神经电路的信息内容进行建模和最大化,以增加神经接口的带宽和计算能力。

(2)“人工智能科学和开放世界新奇学习(SAIL-ON)”项目。旨在研究和开发必要的基础科学原理以及通用工程技术和算法,以创建在开放世界中发生的新颖情况下适当且有效地起作用的AI系统。SAIL-ON在AI的多个子领域寻求专业知识,包括机器学习、计划识别、知识表示、异常检测、故障诊断和恢复、概率编程等。项目主要包括三个目标:一是制定科学原则,量化和描述开放世界的新奇性类型和程度;二是创建可在开放世界中适当和有效运作的人工智能系统;三是在选定的国防部领域进行系统演示和评估。该项目旨在奠定相关技术基础,使无论什么领域的机器,都能自主进行军事OODA循环过程,即观察形势、根据观察内容进行调整、决策最佳行动方针、最终采取行动。

推理决策是指计算机程序模拟人类智能,为达到一定目标,按照某种策略从已有事实和知识推出结论、做出决策并付诸实施的过程。推理决策技术包括确定性推理决策和不确定性推理决策,人工智能系统的智能水平主要体现在求解不确定性问题的能力上。2019年,DARPA启动了“以知识为导向的人工智能推理模式”(KAIROS)项目,旨在建立复杂现实事件的图谱结构和知识库,构建能够对事件进行分析和预测的人工智能模式识别能力。

KAIROS项目将使用一种“基于模式的人工智能”技术感知世界各地的事件,尤其可用于发掘多媒体信息中的复杂事件,并对其进行上下文理解和时间推理,预测其如何发展。该项目分为两个阶段目标展开:(1)利用大规模数据来学习创建一系列模式,主要基于语言学推理和常识的因果关系来对各个子事件进行检测分类和聚类。通过大量普遍的、复杂的和特殊的过程来帮助系统生成一种可以同时描述简单和复杂事件的机制,将这些机制按照一定的序列组合就能发掘出像时间线和关键角色一类重要的上下文信息。(2)系统被用于分析复杂的现实世界数据,并尝试根据创建的模式提取事件和叙述,可从纷繁复杂的世界中抽取出复杂事件的蛛丝马迹。致力于识别事件、实体等因素之间的关联关系,以帮助人工智能系统形成和扩展其知识库。该技术通过系统分析社会运作和舆论趋势,提前预知诸多风险,使管理部门和政府可以及时防患于未然,具有很大的军事和国防应用潜力。未来,基于全球信息系统的因果分析和推理系统将会在人工智能的帮助下逐渐成型。

随着军事系统、手机、智能家庭设备等越来越多,频谱越来越拥挤。如何解决日益增加的频谱需求,对国家是挑战,对军队更是亟待解决的难题,而现行的人为管理方式使频谱无法根据动态供求关系进行自适应调整。为此,DARPA于2017年启动了致力于将软件定义无线电和人工智能技术结合起来重新思考频谱实践的“频谱共享挑战赛”(SC2)项目;同年启动了“射频机器学习系统(RFMLS)”项目,探索利用机器学习理解无线电信号,旨在利用射频机器学习系统能力研究无线电频谱构成,并通过相关技术开发改善和扩展频谱共享,极大扩展电磁频谱的无线通信容量。

(1)“频谱共享挑战赛(SC2)”项目。该项目旨在极大扩展电磁频谱能够容纳的无线电通信流量,确保呈几何级数增长的军用和民用无线电设备能充分使用日益拥挤的电磁频谱。参赛对手重新设计频谱接入策略,并开发一种新的无线模式,使无线电网络自主协作,推出共享RF频谱、避免干扰的方法,并共同开发实现频谱最佳使用的方案。SC2团队借用人工智能和机器学习的最新技术以及扩展的软件定义无线电能力来开发这些突破性能力。该项目不仅要挑战学术界和商业界的创新人员在共享AI方面取得的突破,还要催化一种新的频谱模式,帮助DARPA开辟一个频谱充足的时代。

(2)“射频机器学习系统(RFMLS)”项目。针对目前电磁环境中存在着态势感知能力不足、威胁无法确定以及通信易受恶意干扰等问题,该项目探索利用机器学习理解无线电信号,包括掌握占用频谱的信号种类、从背景中提取出重要的信号,辨别来自物联网设备的射频信号,以及将这些信号与试图入侵设备的信号区分开来等。

RFMLS具有四个技术组件,这些组件将集成到将来的RFML系统中:1)特征学习:利用射频信号数据集,RFML系统需要学习用于识别和表征各种民用和军用设备信号的特性。2)注意力与显著性:RFML系统其注意力导向运行射频频谱中潜在的重要事项,并设计一种射频领域的“显著性检测”,即实现一种对重要视觉和听觉刺激进行识别的能力。3)自主射频传感器配置:对于那些系统认为对完成任务最为有效的信号和信号特征,系统应当能够自动调节对其感受能力。4)波形合成:对几乎一切可能波形进行数字合成。DARPA认为,该项目将使射频系统能够对空前拥挤的频谱中的信号进行区分和表征,并为新兴的自动化系统及依赖这些系统的指挥官们提供更多了解无线领域所需信息。在RFMLS的四个组成部分中,特征学习和波束合成属于射频前端,注意力引导和自主射频传感器配置属于频谱感知。

(八)新一代计算机芯片技术

摩尔定律作为一项基本原理,一直推动着计算机芯片微处理器的发展,但随着晶体管越来越小,晶体管电路逐渐接近性能极限,通过提高集成度来提升芯片性能变得愈发困难,摩尔定律即将走到尽头。为此,DARPA认为开发专用电路或专用型集成电路芯片(ASIC)是突破摩尔定律的方法之一,将研发特制芯片作为“电子复兴计划”(ERI)的一部分,2017年,DARPA授出3亿美元的合同,开发新一代计算机芯片,以满足对更高阶处理能力的需求,确保人工智能的长足和持续发展。

(1)“软件定义硬件”项目。通过开发一种硬件/软件系统,允许数据密集型算法在不受任何与ASIC相关的开发成本、开发时间和单个应用限制的情况下,在ASIC上高效运行。领域内专用系统芯片项目。简单地说,就是将通用芯片、硬件协处理器和ASIC组合起来,将这个组合体轻松编到特定技术领域的应用程序中。

(2)“实时机器学习(RTML)”计划。旨在通过开发一种基于机器学习框架的自动生成新颖芯片设计的方法,来降低与开发针对新兴机器学习应用量身定制的ASIC相关的设计成本。RTML程序的目标是创建一个编译器或软件平台,该编译器或软件平台可以接收TensorFlow和Pytorch之类的机器学习框架,并根据特定机器学习算法或系统的目标,生成针对该机器学习优化的硬件设计配置和标准Verilog代码。在程序的整个生命周期中,RTML将在两个关键的高带宽应用领域(5G网络和图像处理)中探索编译器的功能。基于应用空间的预期敏捷性和效率,RTML编译器为原型设计和测试需要新颖芯片设计的基本机器学习研究思想提供了理想的平台。RTML是DARPA电子复兴计划第二阶段的一部分,该计划为期五年,美国政府和国防电子系统投资超过15亿美元。作为ERI第二阶段的一部分,DARPA支持国内制造方案,并能够开发满足不同需求的差异化能力。

(3)“大脑皮质处理器”项目。旨在通过模拟人类大脑皮质结构,开发出数据处理更优的新型类脑芯片。这些人工智能芯片功耗极低,可用于实时数据感知处理和目标识别,还可解决高速运动物体的即时控制等难题,其未来投入应用后,将实现无人作战及云计算能力的巨大提升。

(九)深度伪造检测技术

深度伪造不同于以往相对简单的PS图像篡改或其他的视频、音频篡改技术,而是基于训练样本进行人工智能的深度学习,是人工智能发展到一定阶段的产物。随着样本数据越来越多,计算机对目标对象的模拟也越来越真实,可达到以假乱真的地步。深度伪造技术结合社交网络的涟漪效应,可以带来大规模的以讹传讹式扩散,达到信息作战目标。在近几年迅速兴起,为国家间的政治抹黑、网络攻击、军事欺骗、经济犯罪甚至恐怖主义行动等提供了新工具,为国家安全带来很大冲击。随着深度伪造技术的飞速发展及造成的影响越来越大,对其检测变得越来越重要。为此,DARPA重点研发媒体取证(MediFor)、语义取证(SemaFor)两大项目,检测并识别深度伪造技术制作的各型产品,以防御大规模的自动虚假信息攻击,提高美军在信息作战中的防御能力。

(1)“媒体取证”项目。该项目正在研发自动评估照片和视频完整性的算法,并向分析师提供有关伪造内容是如何产生的信息。致力于探索并识别深度伪造中存在的视听不一致的技术,包括像素不一致(数字完整性)、与物理定律不一致(物理完整性),以及与其他信息源的不一致(语义完整性)等问题。MediFor项目汇集了世界一流的研究人员,试图通过开发技术来自动评估图像或视频的完整性,并将这些技术集成到端到端媒体取证平台,对于给定的图像或视频,自动进行检测,并向分析师和决策者提供具体信息,包括不同操作的表现形式,如何进行操作,以及相关重要性,以便于根据图像和视频价值做出决定。该项目2019财年获得1750万美元的资助,2020财年获得530万美元。“媒体取证”项目在2021财年完成后,预计将过渡到作战指挥和情报部门。

(2)“语义取证”项目。该项目于2019年8月启动,旨在开发使伪造媒体资产的自动检测、归属和表征成为现实的技术,目标是开发一套语义分析算法,为了开发跨媒体模式和大规模使用的分析算法,该项目专注于三种特定类型的算法:语义检测、归因和表征。(1)语义检测算法确定是否生成或操纵多模态媒体资产;(2)而归因算法推断媒体是否来自声称的组织或个人。确定媒体是如何创建的,由谁来帮助确定其创建的更广泛的动机或理由,以及伪造者所掌握的技能;(3)最后,表征算法推断是否为恶意目的生成或操纵多模态媒体。这些技术有助于识别、阻止和了解对手的虚假信息宣传活动。该项目还将开发使人类分析师能更有效审查被操纵的媒体资产并确定其优先级的技术,包括整合检测、归因和表征算法提供的定量评估的方法,自动确定媒体的优先级,以便进行审核和响应。为了向分析师提供可理解的解释,还将开发自动组装和策划检测、归因和表征算法提供的证据的技术。在项目的整个生命周期中,针对一组代表新的或新兴威胁情景的挑战进行评估。该项目最终形成的语义不一致性检测工具将显著提高媒体伪造者的恶意成本,因为媒体伪造者以后需要“完善每一个语义细节”,而防御者“只需找到一处不合理之处”就可判断媒体真伪。该项目将于2024年6月前完成。

二、DARPA在人工智能领域的研究重点

(一)高度重视第三代人工智能基础理论研究,秉承颠覆性技术创新的使命定位

DARPA认为第一代人工智能系统主要基于手工化处理知识或狭义任务规则,对严格定义的问题具有较好推理能力,但由于没有学习能力且处理不确定性问题能力较差,因而系统脆弱且应用范围有限;第二代人工智能系统以统计学习为主要特征,系统依赖大量高质量的训练数据,只能提供有限的可靠性能保证,并且无法向用户解释结果的原因并缺乏情境联想推理能力,无法适应不断变化的复杂环境;第三代人工智能系统将重点突破前两代的局限性,利用情境模型来感知、学习、抽象和推理,并具有很强的适应不同情境的能力。

为此,DARPA在继续开发第二代人工智能技术及其军事应用的同时,积极布局第三代人工智能发展,通过新设项目和延续项目,致力于第三代人工智能的基础研究,旨在通过机器学习和推理、自然语言理解、建模仿真、人机融合等方面的研究,突破人工智能基础理论及核心技术。为了维持美国人工智能的创新优势,DARPA开展了一系列具有长远价值的基础研究项目,典型项目包括上述的:终身学习机器、下一代人工智能、人工智能探索计划、智能神经接口、人工智能科学和开放世界新奇学习、虚拟智能处理、机器常识、可解释人工智能、人机探索软件安全、以知识为导向的人工智能推理模式等项目。涵盖了大部分DARPA的AI项目,秉承并契合着其使命定位,根植于DARPA的创新基因,大胆从事其他军种不愿意触碰的高难度、跨军种、与国家安全关系重大的AI项目。而且DARPA所具有的战略眼光和长远视野,以及超乎寻常的创造能力,使其不拘泥于眼前需求和具体问题,注重基础理论研究,寻求问题本质,这种独特定位使其能在国家安全战略大格局下思考重大需求问题,推动颠覆性技术创新。

(二)高度重视以人工智能为支撑的新型网络攻击和防御技术的研究

人工智能作为信息革命中最具颠覆性、变革性的前沿技术,正全面而快速地融入军事领域,网络安全领域也不例外,以人工智能为支撑的新型网络攻击和防御研究在多角度研发中不断寻求突破和发展。例如,人工智能技术加持的恶意软件可以提高隐蔽性和针对性,绕过主流的检测技术。而另一方面,基于人工智能的恶意代码检测技术可有效提升恶意代码检测效率和精度。

针对网络安全这些新兴问题,DARPA已将人工智能技术融入了其网络安全研究中,启动了相关项目,有望开辟网络安全的新路径:(1)网络攻击方面,以基于人工智能芯片的自主网络攻击系统项目为代表,通过人工智能自主寻找网络漏洞,自主学习网络环境,自行生成特定恶意代码,自主编写适用于特定网络环境的攻击程序并进行动态调整,具有隐蔽性、破坏性强,智能化程度高的特点。(2)网络防御方面,借助机器学习和人工智能,使用大规模训练样本集搭建智能模型,可以准确、高效地预防、检测和阻止网络威胁,识别分析未知文件,即使在面对持续进化和变种的恶意软件时也能始终保持极高检出率,有效提高威胁检测与响应能力,从而极大提升安全防御能力。以HACCS、GARD、CHASE、ASED、ASED、CHESS等项目为代表,DARPA从理论基础、检测、定位、表征、预测、人机协同、构建具备自我修复能力的网络体系等几方面寻求突破,实现新的网络防御模式,应对更缜密、更复杂及人工智能加持的新型网络攻击。

(三)高度重视人工智能技术的可解释性研究

可解释性不强是当前以深度学习为代表的人工智能技术的弊端之一。绝大部分算法属于“黑盒”系统,中间的分析与决策过程不得而知,也缺乏可交互性和操作性。对于大规模的深度学习网络,由于存在复杂的非线性变换及大量的神经元连接,少量扰动即可引起结果的剧烈变化,表现出的行为将会变得难以理解。具有可解释性的智能系统能够实现人机互操作,便于将人的经验融入到决策中,做到决策可追溯、可引导、可纠正,从而提升系统的智能性。

现代战场环境错综复杂,作战环境的微小改变都有可能让智能化算法不再“智能”。加强算法的可解释性,是发展通用人工智能迫切需要解决的问题。为此,DARPA依托“可解释人工智能”项目,旨在形成一套基础理论来解释人工智能得出的结论,推动研究人员理解人工智能行为决策背后的机理,能够理解、一定程度信任并有效管理未来的人工智能系统。通过该项目,新的机器学习系统将能解释自身逻辑原理、描述自身的优缺点,并解释未来的行为表现。此外,DARPA下一代人工智能技术域中的“下一代人工智能”项目等,其目的都是探索机器如何获得与人相类似的交流和推理能力,让人类可以更好地理解人工智能。DARPA的人机融合也是将最新的人机交互技术(如可视化、语言理解、语言生成和会话管理)与新的原则、策略和技术相结合,获得有效的解释。同时,通过解决算法的可解释性问题,提升对智能系统的信任度,更好理解人工智能的行为和表现,解决人机信任危机。

(四)高度重视人工智能技术对美军“马赛克战”能力的提升

“马赛克战”作为DARPA提出的创新性作战概念,融合了美军近年来其他作战概念的思想和理念,成为DARPA军事作战体系研究的顶层核心概念。马赛克战的中心思想是人工指挥和机器控制相结合,通过对更为分散的美军部队的快速组合和重组来为美军制造适应能力,为敌方制造复杂性和不确定性,其本质是迅速构建模块化部队、实现分布式作战,对美军作战概念和部队的发展具有重要意义。

基于自主系统的分布式作战和任务指挥、基于人工智能的快速决策支持是马赛克战的实现基础。事实上,不论是基于自主系统的作战指挥,还是基于人工智能的决策支持,都离不开人工智能技术的支撑。因此,可以说马赛克战从理论研究走向应用研究,归根结底不可或缺的一环是充分发掘和利用成熟的人工智能技术。

DARPA从底层算力算法基础层出发,利用强大算力、高效架构平台及深度学习算法支撑通用AI技术层,以上述AI芯片、AI算法等为主要研究内容。通过对AI技术域进行组合,支撑马赛克战概念的关键作战应用层,以上述可解释AI、推理决策、基于AI的网络安全技术、人机融合、语音识别等为主要研究内容。通过对各种作战应用技术进行组合,形成分布式作战指挥能力及快速决策支持能力,支撑起整个马赛克作战体系,充分体现了DARPA擅长将作战概念与新技术相结合以创造新的颠覆性优势的特点。

(五)高度重视基于人工智能的深度伪造检测技术研究

当前,深度伪造给国家政治安全、经济安全、社会安全、国民安全等领域带来了诸多风险。国家政治安全方面,深度伪造技术为抹黑政治人物提供了新的强大工具,利用深度伪造技术制作政治人物的虚假负面视频可以破坏其在民众中的形象。对国家领导人选举而言,无疑会破坏选举人形象和选举制度的公正性,从而威胁国内政治制度的合法性。例如2020年美国大选之前对深度伪造技术进行了重点调查,并展开了相关立法行动。深度伪造技术还可能成为信息战的强大武器,破坏国家间的正常关系。经济安全方面,深度伪造技术可为破坏企业形象提供新工具,为引发金融市场动荡提供了新的不稳定源。社会安全方面,深度伪造可能会使民众对一切事物产生怀疑,从而可能造成全社会范围内的信任危机。国民安全方面,深度伪造技术可能会被不法分子用于制作虚假视频,进行诈骗、勒索等违法行为,威胁公民的生命财产安全。

为防范和应对深度伪造技术的潜在风险,各国政府必须从技术工具、法律监管、公民教育以及国际合作等方面建立相应的治理框架,而其中最为关键的就是预警检测技术工具的研发,DARPA为此着力开展媒体取证和语义取证两大项目,力图在自动评估照片和视频完整性的算法,以及语义分析算法方面进行突破,包括整合检测、归因和表征算法提供的定量评估的方法,旨在开发使伪造媒体资产的自动检测、归属和表征成为现实的技术。

三、DARPA在人工智能领域的未来研究趋势

 2020财年DARPA人工智能的重点投资项目,如“可解释的人工智能”、“不同来源的主动诠释”、“自动知识提取”和“确保人工智能抵御欺骗的稳健性”等项目,都涉及到了认知技术的研究,将数据结合知识、环境等信息转化为认知,致力于研究具有常识、能感知语境的系统,极大促进人机融合智能的发展。未来DARPA对于认知技术的发展将从当前的自动行为转变为自主行为,能预先感知人、环境和有效操作;加强人机交互,实现合作与信任;未来将进一步完善认知能力,提高自主能力,同时实现一些新的概念,例如智能化无人机系统编队在对抗环境中的自主作战,无人系统与有人平台协同作战等。

(二)适应动态环境的AI系统

当前的人工智能系统擅长于执行由严格规则定义的任务,但是,并不能很好地适应现实世界中不断变化的条件。对人工智能系统而言,要做的第一件事就是认识世界已经改变;第二件事是表征世界如何变化;第三件事是适当地调整其响应;第四件事就是要更新世界模型。为了使AI系统能够有效地与各种军事应用中的人类合作,学会应对变化多端的新颖情况。DARPA致力于研究可自动识别现实环境中的变化并对其做出反应的新的AI系统。例如,DARPA的开放世界新奇的人工智能和学习科学(SAIL-ON)计划,意在实现上述人工智能系统第三阶段的飞跃。

(三)新一代网络防御措施

当前机器学习防御趋向于高度特定,并且仅对特定攻击有效。防御措施旨在防止特定的预先定义的对抗攻击,并且在测试时仍然容易受到设计参数之外的攻击,为了应对这一安全挑战,DARPA先后启动了利用自主系统对抗网络对手、确保人工智能抵御欺骗的稳健性、大规模网络狩猎、主动社会工程防御、人机探索网络安全等诸多项目,重在实现新的网络防御模式,致力于开发能够防御各种攻击的新一代防御措施,试图通过开发基础广泛的防御方法来解决机器学习防御方法的不同,并探索包括生物学在内的许多潜在防御方法,解决当前的需求及未来将面临的挑战。

(四)可信赖的人机合作

虽然人工智能和深度学习方法在某些应用领域被证明非常有效,但在科学发现和技术开发方面,人工智能仍然没有成为值得信任和重视的合作者。信任是团队的关键要素,在组建有效的人员和自治系统团队时,人员需要及时、准确地了解其人工智能合作伙伴的技能、经验和可靠性,以在动态环境中信任他们。目前,机器缺乏对自身能力的了解,也无法与人类合作伙伴进行交流,从而降低了信任度并破坏了团队效率,人工智能仍然没有成为值得信任和重视的合作者。为了帮助将机器从简单的工具转变为值得信赖的合作伙伴,DARPA在机器学习、可解释的AI、人工智能探索(AIE)、人机融合等领域创建了多个项目,侧重于将AI提升为科学发现和科学过程中富有洞察力和值得信任的合作者的角色。从全新的机器学习机制寻求突破,结合有效的解释技术,使用户能够理解、一定程度信任并有效管理未来的人工智能系统,最终实现人机融合。

(五)与量子计算的交叉融合

算法是计算领域技术发展的基石,人工智能领域的应用是推动算法发展的一大要素。目前,人工智能+量子计算作为交叉融合的热点研究方向,仍需探索诸多开放性科学问题,如机器学习中的数据与特征的量子编码与量子制备问题、量子版本的机器学习是否可真正发挥量子计算的优势,复杂且灵活的量子机器学习任务如何与量子计算硬件进行协同适配等。目前,DARPA除了重点关注用量子计算解决机器学习问题,通过对量子/经典方法的结合,大幅改善构建高性能机器学习/深度学习解决方案所花费的总时间之外,DARPA已通过人工智能技术大幅提升量子计算的稳定性,开始探索人工智能算法在量子计算机上运行的可行性。

对于DARPA而言,可总结思考的角度很多,本节主要围绕DARPA的创新力提出几点认识。因为对于DARPA而言,创意就是一切。而美国军事硬实力和战略威慑力在很大程度上依赖于其源源不断的科技创新能力,尤其是对战略前沿技术的敏锐捕抓能力。

(一)善于提出问题,善于做“白日梦”

DARPA很善于提出问题,DARPA从事的科学开发工作与美陆、海、空三军主要的军事科学中心之间是平行关系,一般都是从事那些有潜在军事用途而又未被陆、海、空军列入现时议程的跨部门跨学科研究、高风险研究、超前研究和基础研究。DARPA的独特定位使其能超越军种、行业、领域,甚至学科学派,在国家安全战略大格局下思考重大需求问题,更易催生颠覆性技术的视野和远见,推动颠覆性技术创新所需新思想、新理念的开拓。DARPA还非常善于做“白日梦”,看重的是技术理念的新颖性,偏重于以颠覆传统的“奇思妙想”来激励创新;其根本职责是“开发富有想象力、创新精神且通常是高风险的理念”,不受约束地“胡思乱想”各种情景,并从中总结规律,不走寻常路且不受各种条框约束的创新思维是DARPA的精髓所在。

对我们而言,必须着眼于未来需求,感知军方的未来潜在需求,而不是去验证军方提出的现实需求。基于这样的要求,对于科研工作者而言,必须真正落脚于原创性,不仅仅是跟风炒热点,在认识、见识、方法、思维、恒心上予以重塑,尽量减低非科研因素等的干扰。

(二)注重基础科技,夯实发展基石

军事强国要想长期保持国防科技领先优势和创新优势,必须高度重视基础学科和科技的建设和发展,持续加大投入,为武器装备的可持续发展和国防科技的不断创新奠定坚实基础。对DARPA而言,其2020财年预算总计35.56亿美元,比2019财年(34.27亿美元)增长3.77%,比2018财年(30.88亿美元)增长15%。而其中基础研究约4.86亿美元,占其总预算的比例从10年前的6.2%增长到14%左右,充分反映了DARPA在研发经费稳步增长的同时,对基础学科领域投资的高度重视,先期技术开发依然占据预算的大头。从项目具体预算来看,人工智能、机器学习等仍是DARPA的关注重点,其中人工智能和机器学习项目的投资涨幅最为突出,总额达4.09亿美元。成分体现了DARPA对基础性研究的重视,聚焦核心和关键技术的突破,夯实军事智能化发展的基础。

对我们而言,必须关注国家和国防发展短板和长远发展需要的基础上,无论是人工智能、5G、区块链、量子计算、大数据等新兴技术,真正做到前沿与基础相结合,善于并勇于沉下去,杜绝跟风炒概念,真正在源头上寻求突破。

(三)允许失败和强调信任是DARPA坚持的创新态度

“允许失败”是DARPA 秉持的创新态度和创新文化。认为“必须乐于面对风险,乐于进行试验,辩证地看待失败之处。”DARPA强调的是“高风险、前瞻性”研究,因此容忍失败,实行开放式学习,强调管理风险,但不逃避风险,形成了一种风险承担文化。同时,DARPA对失败的宽容是建立在紧随时代的战略眼光与超乎寻常的创造能力基础上的,不过分聚焦成败,不关注短暂的、平庸的结果,营造良好的创新文化氛围。但是,“高风险”并不等价于“高代价”,DARPA严格的项目评审机制在一定程度上又降低了高昂的代价。

“强调信任”是DARPA 秉持的创新精神,对于团队创新研究的有序开展起到了至关重要的作用。相较于传统研究机构,DARPA 授予了项目经理与项目研究人员较大的自主权利。研究人员一旦对某一项目产生一个大胆想法时,可以将自己的想法平等地与项目经理交流;而项目经理也能够将“大脑风暴阶段”所形成的成熟概念有效地传达给DARPA局长,并争取支持。在DARPA“强调信任”的创新精神影响下,项目研究人员愿意更自主地成为DARPA这个“利益同盟”的推动者。基于这种技术信仰,大量优秀人才不计薪酬差异或降薪加入DARPA,追求将想法变为实际的颠覆性成功的创新梦想,追求在某种程度上影响历史的成就感。

(四)分类清晰,处理灵活地启动创新项目

DARPA的定位非常明确,对其使命及具体实现途径有章可循,从其分类清晰的项目招标书可见一斑。“单个项目BAA”针对常规项目,“广泛BAA”面向前沿基础性研究、“研究通告”聚焦学术和非营利机构、“项目征求”主要指向小型企业或非传统国防承包商、“商业执行人项目通告”征求军民两用项目。如此清晰的招标书分类,使各领域潜在提案人可以非常方便、有针对性地提交研究方案,利于各类项目的顺利启动。虽然DARPA每类项目招标书的范式和随后的项目立项流程相对固化,但可根据每个项目的具体情况灵活安排立项流程,以尽快向前推进项目,加速技术研发进程。此外,DARPA有多种项目构想来源,但是无论哪种来源,DARPA都秉持自己的独立思想,从项目名称、背景需求、初步构想、项目金额、关键技术、项目阶段等方面进行完整阐述和要求,体现该局对各前沿技术的深刻理解,并由DARPA掌控未来技术的发展方向,确保能一直走在技术发展前沿。这种独立性使DARPA摆脱了行政指派,可充分发挥其预见性,并激发研究人员的探索精神,促进他们之间的交流和合作,从而在一些重大的、前瞻的科技领域取得突破性进展。

(五)注重与外界建立广泛的联系,吸引新思想挖掘新技术

通过与外界的广泛联系,可以由小聚大,最终产生突破性的创新。对DARPA而言,非常注重与外界广泛的联系性。定期与国防部的文职官员和领导人会面,了解需要研究的问题;定期对军事基地、司令部、训练中心和其他军事机构进行参访、调研,收集情况;广泛征求高级军事领导人的意见,了解他们最关心且难以解决的问题:研究最新的军事行动战例,找出限制美军能力的薄弱环节和问题;与军内外涉及国家安全的诸多部门共同研讨相关专业领域的技术发展问题,探索以创新性方法解决所面临挑战的可行性。

此外,近年来,随着民用和商用技术的飞速发展,以DARPA、美各军种实验室等为代表的内部创新模式面临挑战,促使其非常关注外部创新成果的挖掘和利用。DARPA“聚网”社交网络平台于2019年3月正式公开运行,作为全球性的研发交流平台,“聚网”将极大促进跨学科交流协作,加速研发进程,同时也将为普通民众参与DARPA研发创新活动提供新路径。“聚网”的开放和不断完善,将吸引越来越多具有广泛专业背景的研究人员甚至普通用户积极加入,通过科学领域合作和迸发创意设想,为DARPA的研发创新活动献策献力,实现集思广益和“社会智慧”的充分发挥。

(六)创新作战概念,牵引技术应用

近几年,DARPA加大了对智能科技的关注与升级,布局的一系列科研探索项目,将标靶瞄向了未来智能化重构的战场。“马赛克战”作为DARPA近年来提出的创新性作战概念,以构建快速、可扩展、自适应联合多域杀伤力的新作战模式,在传统作战单元的基础上,依托先进网络能力、人工智能处理、计算和联网、分布式指挥控制等技术,融合大量低成本、单功能的武器系统和无人系统,形成跨域协同的分布式、开放式、可动态协作和动态重组的作战体系,实现覆盖陆海空天网电各作战域的“杀伤网”。

在人工智能、大数据、云计算等技术的快速发展和支撑下,未来战场将加速向智能化、无人化战场过渡,陆、海、空、天、网等跨域协同作战将成为未来战争的主要作战样式,牵引装备技术发展和运用转化。虽然分布式、分散作战的理念是顺应军事斗争发展的时代产物,但模块化武器平台在很长一段时间内都难以替代包括舰船、飞机等在内的传统多用途武器平台。目前的技术成熟度尚不足以支撑马赛克战成为现实,然而,无需质疑的是在可预见的未来,信息和决策将成为军事竞争中最重要的领域之一。通过实现马赛克战,美军有望形成在战场认知域的优势,这是值得我们关注和警惕的。

(来源:信息安全与通信保密杂志社)

}

智东西(公众号:zhidxcom)

时光的齿轮每碾过15分钟,就有一位女性死于宫颈癌。

宫颈癌,这个发病率仅次于乳腺癌的妇科恶性肿瘤,每年都会危害50多万名女性的健康,夺去20多万女性的生命。

中国每年发病人数多达13万人,几乎占全球每年新发病例的四分之一,而执业医师注册在病理科的人数不过一万余人,宫颈癌病理医生更是稀缺。可怕的是,这一昔日高发于45至55岁多产女性的疾病,如今正以快速向年轻女性蔓延。

在患者数量猛增、医生严重匮乏、资源分布不均的多重压力下,国内外的医疗机构都在积极寻觅新的解法。快速发展的计算机视觉和深度学习技术,为医疗影像数据地快速处理带来了超乎于人的高效和准确。

中国最大第三方医学检验机构金域医学与华为云EI视觉团队合作,运用AI技术将敏感度和特异性分别提升到99%和80%,这一水平几乎可以接近中美一流的病理专家。

AI辅助宫颈癌早筛的优势及主要难点是什么?目前世界上常用的“宫颈癌细胞病理学筛查+AI”形式有哪些?金域医学和华为云EI具体如何合作,以实现在宫颈癌病理检测方面的阶段性进展?

对于这些问题,智东西与金域医学首席信息官李映华及华为云EI(企业智能)内部人士进行深入交流,详解宫颈癌病理检测AI系统是如何“炼”成的。

一、21-65岁女性不得不防的隐形杀手

许多漂亮的东西都很危险,导致感染宫颈癌的主要元凶——人乳头状瘤病毒(HPV)亦如是。

▲人乳头状瘤病毒(HPV)

它形如布满了五瓣小花的球状物,看起来是美的、迷人的、令人赏心悦目的存在,同时,它也是可能扼住百万女性咽喉的恐怖杀手。

HPV病毒有200多种,分为低风险和高危类型,低风险HPV类型引发的感染通常会被人体的免疫系统清除,但约有14种高危HPV类型引起的感染往往会随着时间的推移而导致多种类型的癌症。尤其是HPV16和HPV18,几乎是中国超过90%的宫颈癌的罪魁祸首。

在进入女性体内后,它会先是进攻女性生殖系统,然后一步一步将势力范围逐渐扩张,等女性在表皮发现鸡冠状、菜花状、乳头状的淡红色丘疹,或者发现极易糜烂的尖锐湿疣,很不幸,这位女性极有可能已经被感染上了HPV。

到了晚期,宫颈癌病患承受的是来自生理上和心理上的双重压迫。盆腔神经受到肿瘤浸润,宫颈管内被肿瘤阻塞,肿瘤压迫或浸润输尿管时,都会引起剧烈的疼痛。加上肿瘤组织代谢、坏死组织的吸收或合并感染引起的发热,病患在没日没夜的疼痛和高烧的累加折磨下日渐油尽灯枯。晚期的“无药可救”更是让她们每痛一下,就仿佛离死神更近一步。

好在宫颈癌是为数不多的可以通过宫颈筛查早期干预的手段进行预防和有效治疗的肿瘤疾病。

女性从感染HPV病毒到发展为癌前病变,再到进展为子宫颈癌,通常需要5-10年甚至更长的时间。

▲HPV病毒感染后宫颈癌疾病发展示意图(来源:中大医疗)

只要提早接种HPV疫苗、定期检查、开展宫颈癌筛查和积极治疗,就能大幅降低其发病率和死亡率,使得数百万妇女将能免受不必要的痛苦。

目前国内9至25岁的男女均可接种HPV疫苗,超过25岁且无性生活者也可以接种。

根据专家给出的筛查时间线,未满21岁无需筛查,年满21岁开始宫颈抹片筛查,阴性者之后每3年筛查一次,30至65岁女性每5年做一次宫颈癌抹片加HPV病毒筛查,65岁以上女性若连续3次抹片阴性,或连续2次HPV阴性,可终生不再筛查。

二、AI技术会是对抗宫颈癌的新药神吗?

面对来势汹汹、传染力超强的HPV病毒,全世界都在积极解决严重不足的医疗人才资源以及医疗资源极度不平衡的问题。

据李映华透露,金域医学和华为云EI合作的宫颈癌病理检测AI系统计划在今年下半年进行大规模验证,当系统通过专家验证以及国家食品药品监管总局(CFDA)认证后,将帮助金域大大提高诊疗效率,为病理医生提供更精准的支持,最终惠及更大范围的宫颈癌患者。

四、华为云EI:做用得起的普惠AI”

除了打造宫颈癌病理检测AI系统外,华为云EI还提供OCR识别等技术来帮助金域医学实现管理层面的效率提升,从而“多管齐下”地帮助金域医学完成智能化升级。据李映华介绍,未来金域医学还将和华为云EI继续展开在其它肿瘤病理等多领域的合作。

像金域医学这样的例子还有很多,截至2018年12月31日,华为云EI为医疗、物流、工业制造等多个行业细分场景,提供从基础平台服务到通用API、高级API到预集成方案的56种服务和159项功能。

和其他进军“医疗+AI”赛道的玩家相比,华为云EI的优势主要体现在两方面。

一个是以华为AI昇腾系列芯片为代表的强大算力,成为华为云一系列服务的有力支撑;另一个是通用开发能力,帮助更多人降低AI开发门槛。

例如在去年的华为全联接大会上,华为云一连发布了AI开发平台ModelArts、视觉AI应用开发平台HiLens、离线开发套件Atlas 200等多项AI全流程开发平台和工具,使得从AI开发小白到高阶程序员都能快速实现高质量的AI模型。

自发布以来,华为云EI的一系列服务已经帮助许多企业快速实现智能化升级,加速释放AI在多个传统行业的独特价值。

结语:改变医疗,AI在路上

对于癌症患者而言,早一天发现,早一天治疗,就多一分早日治愈的希望。

经过两三年的发展,“医疗+AI”市场已经趋于理性,技术方案逐渐在实际应用场景中经得起考验。AI技术应用于医疗场景,尤其是癌症早筛这种关乎人的生命安危的领域,必须经过严苛的验证以确保足够的可靠性,才能被投入到辅助医生做早期预判的应用中。

登山不以艰险而止,则必臻乎峻岭。随着医疗工作者和AI开发者的共同努力,以及更多复合型人才被培养,我们不妨期待《Lancet Oncology》期刊中“到21世纪末,全球大多数国家都可以有效消除宫颈癌”的预言会提前实现。

}

这是一个系列文章,从各个角度来评估一个问题:“我的业务要不要用 AI ?能不能用 AI?”

本期评估角度——数据。

在人工智能普及之前,大家用的产品都是「基于规则」的。

我们通过总结规则,然后让计算机自动的执行这些规则,我们日常工作和生活中很多问题都是基于规则来处理的,比如:

  • Excel 中的各种公式的规则就是:将选中的区域进行计算
  • 邮件的规则就是:将内容发给收件人
  • 公众号的规则就是:将关注的公众号内容推送给你

基于规则的好处就是:所以人都能知道在什么情况下得到什么结果,一切都是可以预判的。

但是基于规则的方法也有很大的弊端:很多问题,很难(甚至无法)总结出有效的规则。

基于数据的 AI 时代

人工智能发展到现在(2019年),最核心的底层逻辑是:「基于数据」。

规则能很好解决的问题当然是用规则来解决,因为他的成本低,可解释性强。但是很多问题没有有效个规则,这个时候人工智能的价值就凸显了。

「基于数据」的方法简单说就是:从海量数据中找规律,这些规律是很抽象的,并不能总结成具象的规则。比如:

  • 给机器看海量的猫和狗的照片,它就具备了「区分猫和狗」的能力
  • 给机器海量的中英文对照文章,它就具备了「中英文翻译」的能力
  • 给机器海量的文章,它甚至可以具备「写文章」的能力

基于数据的好处是:只要有足够多的优质数据,那么机器就能学会某些技能,数据越多,能力越强。

但是基于数据的方法也有明显的弊端:机器只能告诉你「是什么」,但是无法告诉你「为什么」

《》有详细介绍这段历史

想要用 AI,需要知道数据金字塔

上文已经说明了「基于数据」的逻辑,那么支撑这个逻辑的就是「数据」。

没有数据,就无从基于数据。所以想要用人工智能,需要考虑业务场景的数据3要素:

他们3个类似金字塔的结构,先有「数据可获取」再谈「数据全面」,有了「数据全面」再谈「数据多」。

想要解决问题,就需要具备「跟这个问题相关的数据」。比如上面提到的例子:

给机器看海量的猫和狗的照片,它就具备了「区分猫和狗」的能力。

这里需要的数据不光是照片本身,还需要将照片里的猫和狗标注出来,如下图:

所以,你要考虑的问题是:

  1. 我遇到的问题有哪些影响因素?
  2. 这些影响因素是数字化的吗?如果不是,能否数字化?
  3. 这些数据是否可以获取?成本高吗?值得吗?

假如我们只能看到 10% 的照片,现在让你区分照片中是猫还是狗,这会非常难。如下图:

当我们能看到照片的 50% 时,还能猜一下。

当我们可以看到100%的照片时,就信心十足了。

人是如此,机器也是如此,你都不让我看全,我怎么分析啊!

所以,当我们想要利用人工智能技术来解决实际问题时,你需要仔细分析这个问题:

  1. 到底有哪些影响因素?是否有对应的数据?
  2. 有数据的因素是否足够全面?
  3. 关键因素的数据有遗漏吗?

还是区分猫和狗的例子。猫大概有40多个品种,狗大概有接近200个品种。并且照片可以从不同的角度,不同的背景,不同的光线下拍摄,会产生无数种组合。

想要有效的区分猫和狗,需要大量的不同的照片才行。kaggle(很权威的 AI 竞赛网站)上有很多区分猫和狗的训练数据,大部分都是上万的量级(1w+的猫和1w+的狗)。

区分猫和狗这种非常简单的任务都需要上万的数据,对于更复杂的任务,就需要上百万甚至上亿的数据。具体要多少跟你要解决的问题复杂度,模型选择,预期结果都有关系。

不过有一条原则是不会变:数据越多,效果越好!

假如你是游戏公司的老板,想利用人工智能技术提升游戏的收入,从数据角度评估一下是否可行?

电商平台通过推荐算法可以让购物者花更多钱,那么在游戏里结合推荐算法,理论上也可以让玩家花更多的钱。

推荐算法的本质是:挖掘用户需求,将匹配需求的商品推荐给用户。

应用到游戏里则是:挖掘用户的需求和他的消费能力,将匹配需求的道具,以合适的价格推荐给用户

第一步:数据是否可获取?

游戏算是数字化程度很高的领域了,但即便如此,还是有部分因素并没有数据化。比如:

  • 一些游戏玩家都会在微信群里聊天和互动,这部分数据游戏是没有的
  • 老婆发现老公在游戏里泡妞,被迫卸载了游戏。这种游戏外发生的事情有时候也会影响到游戏内。
  • 玩家的心理活动也是没有数据的(这次活动打折好厉害,但是我要忍住!不然又要吃一星期泡面了~)

够不够用呢?下一步全面性的时候再分析。

「数据可获取」看似是一个很白痴的问题,但是很多行业的数字化程度非常低,这个问题对于他们来说并不简单。

第二步:数据全面性是否够用?

想要判断玩家的需求和消费能力,大致有下面一些影响因素:

    1. 玩家属性(年龄、性别、地理位置…)
    2. 角色属性(等级、装备情况、剩余钻石数量…)
    1. 游戏行为(买过什么东西、参与过什么玩法、打过什么副本…)
    2. 消费行为(活动页面停留时长、买过什么东西、花过多少钱…)
    3. 玩家互动(跟谁组过队、跟谁打过架、跟谁参加过活动…)
    4. 聊天数据(跟谁、说过什么话、游戏内+游戏外)
    5. 心理活动(想要什么、喜欢什么、觉得多收钱值…)

还是参考电商的经验,亚马逊、阿里巴巴都已经验证过:

在缺失「聊天数据」「心理活动数据」「电商平台外数据」的情况下,依然能有效的挖掘出用户需求,刺激消费。

而游戏不但有推荐的权利,还有定价权,可以通过降价进一步的刺激消费。所以全面性角度是 OK 的。

PS:所以在全面性的评估上,不需要理论上 100% 全面,而是达到可用的程度即可,这个事前只能找案例参考。

第三步:数据够不够多?

推荐系统是一种特殊性的情况,他对数据量的要求很有弹性,在数据量少的事情有很多手段来解决冷启动的问题。随着数据量的增多,算法的作用逐步加大。

一个新用户下载了淘宝,依然不妨碍推荐,只不过用的越多推荐的越靠谱一些而已。

PS:在评估数据是否足够时,尽量找经验丰富的技术咨询一下。

所以,经过3个数据角度的评估,「通过推荐算法提升游戏收入」的设想应该是可行的。

评估能不能用人工智能技术时,「数据」可以说是最重要的一个维度。

具体评估时,想清楚下面3个问题:

3个问题需要同时满足,才算是「貌似可行」。

在评估「要不要用」和「能不能用」人工智能时,需要考虑很多问题。这个系列还会持续更新,关注我的公众号查看所有内容:

}

我要回帖

更多关于 人工智能的智能体不包括心理研究 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信