人工智能(AI)是当今时代的流行语,技术专家、学者、记者和风险投资家都在使用这个词。就像许多从学术领域进入大众领域的词汇一样,在这个词语的使用中也存在着严重的误解。但这并非是公众对科学家不甚了解的经典案例,科学家常常也会像公众一样误解人工智能(AI)。我们认为,我们的时代在某种程度上见证了从硅芯片中崛起的智能,硅基智能可以匹敌人类的智慧。上述想法让我们着迷,也让我们感到恐惧。遗憾的是,这样的想法会分散我们的注意力。
关于当今时代,存在不同的描述。如下的故事涉及人类、计算机、数据和生死抉择,但其重点不是硅基智能。14年前,我妻子怀孕时做了超声波检查,房间里有一位遗传学家,她指着胎儿心脏周围的一些白色斑点对我们说:“这些是唐氏综合症的标志,你们孩子患这种疾病的风险现在已经上升到了1/20。”她还进一步告诉我们说,我们可以通过羊膜穿刺术来了解胎儿是否有遗传性唐氏综合症。但是羊膜穿刺术也有风险,手术过程导致胎儿死亡的风险大约是1/300。作为一名统计学家,我决定找出这些数字的来源。结果我发现,英国在这方面已进行了10年的统计分析,这些白色斑点是钙积累的反映,被认定为唐氏综合症的预测因子。但我同时也注意到,我们测试中使用的成像机器比英国研究中使用的机器每平方英寸多出几百个像素。我回去对遗传学家说,白色斑点很可能是假阳性,她说,“哦,这就解释了为什么我们在几年前开始发现唐氏综合症发病率上升的原因,当时正是启用新机器的时候。”
最终,我们没有做羊膜穿刺术,几个月后一个健康的女婴来到了这个世界上。但这一事件让我感到困扰,尤其在经过粗略计算之后,我可以确信,世界范围内有成千上万的人在同一天也得到了和我们同样的诊断,他们中许多人选择了羊膜穿刺术,导致其中许多婴儿不必要地死去。这样的事情日复一日地发生着,直到成为一种固定的模式。这一事件揭示的不只是我个人遭遇的问题,而是关乎整个医疗系统,它对不同地方和不同时间的变量和结果进行测量和统计分析,然后将分析结果用于其他地方和其他时间。问题不只在于数据分析本身,还在于数据库研究人员所称的“出处”,概括来说,数据来自哪里,从数据中得出什么样的推论,以及这些推论与当前情况的相关性如何?等等。虽然训练有素的专业人员可在之前个案的基础上解决所有这些问题,但我们需要设计覆盖全球的医疗系统,不需要如此精细的人类监督而完成相关分析工作。
而我也是一名计算机科学家,因此我突然想到了建立这种行星尺度的推理-决策系统的一些原则:建立系统、将计算机科学与统计学相结合、将人类的因素考虑在内等,这些在我所受的教育中是没有的。在我看来,这些原则的发展(不仅医学领域需要,而且商务、运输和教育等其他领域内也需要)至少和棋类比赛和感觉技能中大放异彩的人工智能系统同样重要。
无论能否在不久的未来完全理解“智能”,我们都面临一个巨大的挑战,那就是如何将计算机和人类结合起来,以提高人们的生活水平。虽然这一挑战被一些人视为“人工智能”的诞生,但我们可以用一个更加平凡和不乏敬意的看法,这种挑战标志着一个新的工程学分支。就像几十年前的土木工程和化学工程一样,这个新学科的目标是融合一些关键想法的力量,为人们带来新的资源和能力,并安全平稳地做到这一点。土木工程和化学工程是建立在物理和化学基础上的,而这个新的工程学科将建立在20世纪的一些思想观念的基础上,如“信息”“算法”“数据”“不确定性”“计算”“推理”和“优化”等概念。此外,由于这个新学科的大部分重点都将是来自于或关于人类的数据,其发展需要来自社会科学和人文学科的视角。
虽然构建模块已经开始出现,但将这些模块组合在一起的原则还没有出现,这些模块目前只是以临时的方式组合在一起。因此,就像人类在土木工程学出现之前就建造了房屋和桥梁一样,人类也在开始着手建造涉及机器、人类和环境的社会规模的推理和决策系统。就像早期的建筑和桥梁有时会以不可预见的方式和悲剧性的后果倒塌一样,我们早期的许多社会规模的推理和决策系统已经暴露出严重的概念缺陷。而且,遗憾的是,我们不太擅长于预测下一个严重缺陷会是什么,我们所缺少的是一个拥有其分析和设计原则的工程学学科。
当前关于这些问题的公开对话经常使用“人工智能”作为智力的通用符号,这使得人们很难对这一新兴技术的范围和后果进行推理。让我们首先更仔细地考虑一下“人工智能”都被用来指代什么,包括最新概念和它的历史渊源。
如今大多数被称为“人工智能”的东西,特别是在公共领域内,是在最近几十年内所称的“机器学习”(ML)。ML是一种算法,它融合了来自统计、计算机科学和许多其他学科的思想,设计了处理数据、预测和帮助决策的算法。就对现实世界的影响而言,ML是很早就存在的真实东西。
事实上,早在20世纪90年代早期,ML将会成为巨大产业的苗头就已显现,世纪之交时,一些具有前瞻性眼光的企业,如亚马逊等公司已经在他们的业务中使用了机器学习技术,在欺诈识别和供应链预测等方面解决关键任务后端的问题,创建新颖的面向消费者的服务,如推荐系统。随着数据集和计算资源在随后20年的快速增长,很显然,ML不但为亚马逊,而且实际上为任何需要在大规模数据基础上做决策的公司提供帮助。新的商业模式应运而生,“数据科学”一词开始被用来指代这一现象,反映了ML算法专家与数据库和分布式系统专家一起合作构建可扩展、强大的ML系统的需求,反映了由此诞生的系统的更大的社会和环境范畴。
在过去几年里,这些观念和技术趋势汇聚在一起,被重新标以“人工智能”之名,但这种重命名还是值得推敲的。
从历史上看,“人工智能”一词是在20世纪50年代末创造出来的,代表了当时一种令人振奋的渴望,希望通过计算机软件和硬件创造出拥有人类水平智能的实体。我们将用“类人智能”,即“模拟人类的人工智能”(human-imitativeAI)这个词来指代这种渴望,它所强调的是这样一种观念,即人工智能实体应是我们中的一员,即使不是指身体层面上的,至少是在精神层面上的(不管这意味着什么)。这在很大程度上是一种学术上的追求。虽然一些相关学术领域,如运筹学研究、统计、模式识别、信息理论和控制理论等都已经存在,并且经常受到人类智能(以及动物智能)的启发,但这些领域主攻的可以说只是一些“低级”的信号和决策。
比方说,一只松鼠能感知它所居住的森林的三维结构,并在林中树枝间跳跃,这种能力激发和赋予人们灵感。而“人工智能”关注的是一些不同的东西:人类“推理”和“思考”的“高层次”能力或“认知”能力。然而,60年后,人工智能模拟高层次人类推理和思考能力的前景仍然难以捉摸。现在所称的“人工智能”的发展主要体现在一些与低水平模式识别和运动控制相关的工程领域,以及主要专注于寻找数据模式、做出有根据的预测、对假设和决策进行测试的统计学领域。
事实上,著名的“反向传播算法”在20世纪80年代早期由大卫?鲁梅尔哈特(DavidRumelhart)重新发现,如今被认为是所谓的“人工智能革命”的核心,它最早出现在20世纪50年代和60年代的控制论领域内,其早期应用之一是在向月球进军中用于优化阿波罗飞船的推力。
自20世纪60年代以来取得的许多进展并非来自于对人工智能的追求,而是就像阿波罗飞船的例子一样,通常是研究人员专注于解决某项特定工程难题的杰作,而关于人工智能的一些想法往往被隐在幕后。虽然不为一般公众所了解,但在文档检索、文本分类、欺诈行为检测、商品推荐系统、个性化搜索、社会网络分析、规划、诊断和A/B测试等领域内的研究和系统构建都取得了重大成功,这些进步成为谷歌、网飞公司(Netflix)、脸书网(Facebook)和亚马逊等公司发展的推动力量。
人们简单地将所有这些都称为“人工智能”,事实上,已达成了这样的共识。这样的标识可能出乎优化或统计研究人员的意料之外,他们一觉醒来会惊讶地发现,自己突然被称为“人工智能研究人员”。但是,撇开对研究人员的标识不当这个问题不谈,更大的问题是,使用这个单一、定义不清的人工智能的缩写词AI,阻止了人们对智力和商业问题范畴的清晰认识。
过去20年里,在对类人智能的热切期望中,工业和学术界领域内通常被称为“智能增强”(IntelligenceAugmentation,IA)的人工智能取得了重大进展。在这个领域内,计算和数据用来创建更多增强人类智力和创造力的服务系统。搜索引擎可以看作是IA的例子(增强了人类的记忆和实际知识),自然语言翻译也是(增强了人类的交流能力)。基于计算机技术的声音和图像生成也是艺术家的调色板和创造力的增强器。虽然可以想象得到,这类服务也涉及高层次的推理和思考,但目前它们还不是,它们主要是通过执行各种各样的字符串匹配和数值运算,捕捉人类可以加以利用的各种模式。
希望读者能够容忍最后一个缩略词,让我们泛泛地构想出一门被称为“智能基础设施”(Intelligent Infrastructure,II)的学科,即一个由计算、数据和物理实体构成的网络,这个网络将使人类环境更融合、有趣和安全。这样的基础设施已开始出现在交通、医药、商业和金融等领域内,对个人和社会都有着巨大的影响。这些经常出现在关于“物联网”的讨论中,但通常指的仅仅是将这些“东西”搬上互联网,而不是与这些“东西”相关的更大挑战:分析数据流,发现更多关于这个世界事实的能力;在比二进制更抽象的层次上与人类和其他事物互动。
回到我个人经历导致产生的一些想法上。我们可以想象,我们生活在一个“社会范围的医疗系统”中,这个系统在医生、设备和人体之间建立了数据流、数据分析流,从而帮助提升人类智力,做出更好的诊断,提供更好的护理。该系统内包含:有关人体细胞、DNA、血液测试、环境、群体遗传学的信息,关于药物学和治疗学的科学文献。它关注的不只是某个病人或某个医生,而是关乎所有的人类,就像目前的医学测试通过对一组人类(或动物)的实验,为其他人类提供更好的医疗服务,并有助于保持信息的相关性、信息来源的可靠性,就如目前银行系统在金融和支付领域集中应对这类挑战的方式。而且,虽然人们可以预见到在这样一个系统中会出现许多问题,包括隐私问题、责任问题、安全问题等等,这些问题也应该视为挑战而不是障碍,这才是正确的态度。
我们现在面临一个关键问题是:应对这些更大的挑战,走传统的类人智能(即模拟人类的人工智能)发展之路是否是最好或唯一的途径呢?最近一些广为宣传的关于机器学习(ML)的成功例子,实际上都产生于与类人智能相关的领域,如计算机视觉、语音识别、游戏和机器人领域。因此,也许我们应该只是等待这些领域的进一步进展。这里有两点需要说明:首先,人们不会从阅读报纸上知道的是:类人智能方面的成功实际上还很有限,我们离实现真正的类人智能的愿景还很遥远。遗憾的是,即使在类人智能领域取得哪怕有限的进展,引发产生的兴奋或恐惧情绪都会导致媒体的过度亢奋和关注,而在其他工程领域内的成功是不会导致产生这种现象的。其次,更重要的是,这些成功既不足以也未必能解决IA和II的一些重大问题。就其充分性而言,以自动驾驶汽车为例,要实现这样的技术,需要解决一系列的工程问题,这些问题可能与人类能力没有什么关系,或人类根本就缺乏这方面的能力。整体运输系统(II型系统的一个例子)可能更像目前的空中交通管制系统,而不像松散结合、只看前方、心不在焉的人类司机组成的系统;这样的系统比目前的空中交通管制系统还要复杂得多,特别是在通过大量数据和自适应统计建模提供详细决策方面,这些正是最前沿的挑战,过度专注于类人智能的研究可能会分散精力。
至于必要性论证,有人认为类人智能(AI)愿景也将IA和II愿景包括在内,因为类人智能系统不仅能够解决人工智能的一些经典问题(如图灵测试),同时也将是我们解决IA和II问题的最好办法。这样的论据几乎没有历史先例。土木工程难道是通过设想建造某个人工智能木匠或人工智能砌砖工而发展起来的吗?化学工程的发展是否也应该先创造出一个人工智能化学家来吗?更值得商榷的是:如果我们的目标是建造化工厂,我们是否应该先创造出一个人工智能化学家,然后再考虑如何建造一个化工厂呢?
一种相关论点是:人类智能是我们所知的唯一的一种智能,我们应该要做的第一步就是要模仿它。但是事实上,对于某种类型的推理人类并不是特别擅长,我们会有失误、偏见和局限。此外,至关重要的是,我们的智能还未能进化到拥有现代II系统处理大规模决策问题的能力,也没有具备能够应对II环境中出现的那种不确定性的能力。
可能有人会说:AI系统不仅会模仿人类的智能,而且还会“纠正”它,甚至还能任意扩展到解决其他更大的问题。但目前我们对于人工智能的推测性争论,都基于科幻小说的范畴和小说中设定的背景和场景,在面对即将出现的IA和II的关键问题时,这些不应该成为我们主要策略的论据。我们需要根据其自身的优劣或价值来解决IA和II的问题,而不是将其看作是类人智能发展的必然结果。
不难发现,II系统中的算法和基础设施方面的挑战并不是类人智能研究的中心主题。II系统需要具备管理分布式知识库的能力,这种知识库会快速变化并有可能在全局上不合逻辑。这样的系统必须在做出及时、分布式决策时处理好各种交互作用,并且还必须能够应对处理长尾现象,即一些人拥有大量数据,而大多数人只拥有极少量数据的情况。系统必须解决跨行政和竞争性边界共享数据的难题。最后,特别重要的是,II系统必须将刺激和定价等经济观念引入到统计和计算基础设施中,这样的基础设施将人们互相连接和对商品进行估价。这样的II系统不仅可以提供服务,还可以创造市场。一些领域迫切需要这样的市场,如音乐、文学和新闻等领域,在这样的市场中,数据分析将生产者和消费者联系在一起。这一切都必须在不断发展的社会、伦理和法律规范的背景下进行。
当然,经典的类人智能问题仍然是人们极感兴趣的研究课题。然而,当前人工智能研究的重点是收集数据,构建“深度学习”基础设施,模仿狭义定义的某些人类技能的系统示范,这些往往会转移对经典人工智能一些悬而未决重大问题的注意力。这些问题包括:将意图和推理引入到执行自然语言处理系统中的需要,推断和表示因果关系的需要,开发可计算可处理的不确定性表达式的需要,开发制定和实现长期目标的系统的需要。这些都是类人智能的经典目标,但在当前关于“人工智能革命”的争论中,人们很容易忘记的是:这些问题还尚未解决。
IA也将继续保持其相当重要的地位,因为在可预见的未来,计算机在对真实世界情景进行抽象推理方面的能力将仍然无法与人类相比,我们需要通过能周详考虑的人类与计算机的交互作用来解决一些最为紧迫的问题。同时我们希望计算机能激发人类新层次的创造力,而不是取代人类的创造力(不管这意味着什么)。
曾是达特茅斯大学教授后在麻省理工学院任职的约翰·麦卡锡(JohnMcCarthy)创造了“AI”这个词,显然是为了将他正在进行的研究与当时麻省理工学院老教授诺伯特·维纳(NorbertWiener)的研究区别开来。维纳创造了“控制论”一词来指代他自己的智能系统研究愿景,这一愿景与运筹学研究、统计、模式识别、信息理论和控制理论密切相关。而另一方面,麦卡锡强调的是与逻辑的联系。有趣的概念逆转是:打着麦卡锡术语旗帜的却是当今时代占据主导地位的维纳的人工智能研究成果,但这种情况肯定只是暂时的,在人工智能领域,钟摆的摆动幅度比其他大多数领域都要大得多。
但我们需要的是超越麦卡锡和维纳的特定历史视角。我们需要认识到,当前关于人工智能的公开对话(关注的是一个狭窄的行业子集和一个狭窄的学术分支)可能会让我们有一叶障目、不见森林的风险,忽略了AI、IA和II全景给我们所带来的挑战和机遇。
在这个全景范围内,应该较少关于科幻梦想的实现,或者是超级人类机器给我们带来噩梦的恐惧;应该更多考虑人类需要理解和塑造技术,因为这些技术日益出现和影响人类的日常生活。而且,在这样的理解和塑造中,需要来自各行各业的不同声音,而不只是技术上的对话,只聚焦于类人智能有可能阻碍我们听到更广范围的不同声音。
虽然产业在推动诸多方面的发展,但学术界也在继续发挥重要作用,不仅在于提供一些最新的技术思想,而且还在于计算机和统计学科研究人员以及其他学科研究人员的合作,这些学科的贡献和独有的视角都是目前迫切需要的,特别是社会科学、认知科学和人文科学。
另一方面,尽管在我们的发展过程中,人文和科学是必不可少的;但我们也不应该认为:我们所谈论的是工程领域之外、前所未有的规模和范围的东西。社会的目标是建造新的人工制品,这些人工制品应该名副其实。我们不希望建立这样的系统:能够在医疗治疗、运输工具选择和商业发展机遇等方面对我们有所帮助,结果却发现这些系统并不能真正起到作用,它们会犯一些让人类生命和福祉付出重大代价的错误。在这方面,正如我之前所强调的,在以数据和学习为中心的领域中,还有一个有待崛起的工程学科,尽管目前这些领域看起来令人兴奋,但它们还不能被看作是一个工程学科。
此外,我们应该接受这样一个事实,即我们将见证的是一个新的工程分支的诞生。在学术界和其他地方,“工程学”这个词经常被狭义引用,代表冰冷的、缺乏感情的机器,还有人类对它们失去控制等负面含义。但是一个新的工程学科正是我们想要的,在当前这个时代,我们将真正有机会去设想历史上前所未有的新东西:以人为中心的工程学科。
我没有给这个新兴学科命名的想法,但是如果要继续用“AI”这个缩写词来占据这个位置,那么我们就要了解这个术语真正的局限性。让我们扩大我们的眼界,让炒作降温,认识未来我们所要面对的严峻挑战。
资料来源Mudium.com
责任编辑 岳峰
――――――――――
本文作者迈克尔·乔丹(Michael I.Jordan)是加州大学伯克利分校电气工程和计算机科学系以及统计学系教授,美国工程院、美国科学院以及美国艺术与科学院院士。