何晖光

中国科学院自动化研究所研究员

大家提到脑﹣机接口,就会联想到在黑客帝国等科幻片中出现的场景,这其实并不是天马行空的幻想,而是基于早已有之的“脑﹣机接口”技术的合理设想。

要想了解脑﹣机接口这一概念,首先需要了解大脑的结构。大脑容量有1.3升,是宇宙中最复杂的结构,拥有1 000亿个神经元,这些神经元之间形成了超过100兆(Trillion)个连接。我们可以将大脑看成是一个信息处理装置,它创造了一切人类文明成果,包括科技和文化等。

我们来看一看以前人们是如何对大脑结构进行理解和研究的。在公元前1700年到公元前1600年,《艾德温·史密斯纸草文稿》(Edwin Smith Papyrus)中就出现了关于大脑的记录,比如脑膜是包裹大脑的组织等。之后随着科学发展,罗伯特·胡克(Robert Hooke)发明了显微镜,观察到了细胞。之后随着染色技术的发展,人们利用组织学知识对脑细胞进行了进一步观测。1796年,德国的解剖学家弗朗兹·约瑟夫·加尔(Franz Joseph Gall)提出了颅相学,认为可依据头盖骨的外部结构来推断心理功能和特性。将颅骨分成不同的区域,认为不同的区域映射不同的功能,不同功能间有一定的联系,这反映了早期人们对大脑结构和功能之间相关性的探索。

之后随着更进一步的研究,我们开始探讨大脑结构和功能之间的对应关系,相继发现了视觉中枢、语言中枢等。例如,菲尼亚斯·盖奇(Phineas P. Gage)25岁在美国佛蒙特州铁路工地工作时发生意外,被铁棍穿透头颅,从颧骨下面进入,从眉骨上方出去,但却依然存活。盖奇的幸存是一个奇迹,他仍然可以说话、走路,严重的脑损伤似乎对他没有什么影响。但不久以后,人们发现盖奇的脾气与从前大不相同了,这说明某个与控制性格相关功能的大脑结构发生了损害。

什么是脑﹣机接口技术

脑﹣机接口是建立在大脑和外部环境之间的技术,使得大脑在不依赖外周神经肌肉组织的情况下与外界进行交流。其目的一方面是脑控,将大脑活动转换成指令,通过大脑信号的解析操作机器;另一方面是控脑,可以通过对大脑进行刺激从而提供感觉反馈或者对神经功能进行修复,如刺激大脑帮助患者康复,或者为失明老鼠的大脑“传入视觉”使其能够走出迷宫。

脑﹣机接口主要包括三个部分,首先要对脑信号进行采集和记录,然后采用硬件和软件对信号进行分析和处理,最后进行感知反馈,形成脑﹣机接口的闭环。过程中涉及多个学科,包括神经科学和机器学习等等。

以基于视觉诱发电位的打字脑﹣机接口为例,人在看到以不同频率闪烁的物体时,大脑中会诱发出相应频率的电生理响应。对键盘上不同的字母以不同频率进行编码,当人的视觉关注到某一字母时,通过解码人的脑电信号,就能解码出人想输入的是哪个字母。

脑﹣机接口的种类

根据使用目的和实现方式,脑﹣机接口主要可以分为三类,第一种是主动式的,用有意识的脑活动来控制外界设备;第二种是反应式的,通过解码大脑对外界刺激所引起的特定响应,来间接地表达出大脑意图;还有一种是被动式的,能够读取用户认知状态变化并用于人﹣机交互的一类系统,它无须用户主动控制。

根据检测信号传感器的安置方式,脑﹣机接口也可以分为三类,分别为侵入式、半侵入式和非侵入式。侵入式是指通过手术等方式直接将电极植入到大脑皮层,这样可以获得高质量的神经信号来实现对外部设备的控制,但是却存在着较高的安全风险和成本。非侵入式尽管精度没有侵入式高,但其使用安全,可以广泛应用。国内非侵入式脑﹣机接口技术较为先进,如清华大学脑﹣机接口团队利用视觉诱发电位脑﹣机接口,帮助渐冻人朗读和交流;华南理工大学利用脑﹣机接口对植物人的状态进行评估。由于脑电信号是隔着颅骨传递的,其信号质量不如侵入式脑﹣机接口,要想提高非侵入式的性能,信号采集技术需要提高。

脑﹣机接口的应用

脑﹣机接口主要有以下几方面的应用:一是功能恢复和替代,即直接控制肌肉和外部设备;另一方面是脑功能增强、重建和改善,可利用调控技术刺激大脑特定功能区来实现。

运动想象和运动执行具有相似的大脑系统模式,但是运动想象只是一种运动意图,无任何实际动作输出,而且这种意图不需要外界刺激。大脑想象做不同的动作,例如,是要动左手还是右手,双脚还是双手,大脑的状态是不一样的,如果能够区分这些不同的状态,那就可以识别出用户的运动意图。这个过程不仅需要让机器适应人,还需要人适应机器。这个系统可以用于脊髓损伤人员,他们大脑的功能区出现了损害,但是大脑仍然有可塑性。通过运动想象康复训练系统,就可以通过大脑意图控制机械外骨骼,而且不仅仅是简单地控制左右,更可以精准到手腕和手肘等部位,包括可以做一些简单的伸拉、自己喝水等日常活动,从而使康复的时间降低,进一步改善生活。这就是功能恢复和替代。

2015年,德国之翼航空公司的一架飞机坠毁。事后经过调查,发现驾驶员有心理疾病。事实上,国际民航组织对飞行员是有要求的,即必须心理健康,在开飞机前还要进行检测,如果情绪不好(如跟家人吵架也会影响情绪)也是不能飞行的,我们要将这些隐患都消除。通常,可以通过语音和面部表情等传统方法识别人的情绪,情绪识别脑﹣机接口可以与这些传统技术相结合,进一步确保驾驶员情绪识别准确,根据识别结果可以进行预警。

脑﹣机接口有很好的市场应用前景,除了医疗健康和康复,还可以应用于娱乐、智能家居和军事等领域。如通过“脑动作”玩游戏;脸书的“意念打字”脑﹣机接口项目,其目标是希望可以达到一分钟打100个词。

脑﹣机接口的挑战

进行脑﹣机融合对于未来的智能化发展是非常有利的,在专业知识方面人工智能比人脑有优势,比如计算、识别、推理、计划等,但是人脑在决策、想象力、创作力、社交、情感方面比人工智能更有优势,要实现这一技术的完美应用,还存在着很多挑战。

一是我们对大脑工作的机制缺乏深入了解,目前对于大脑如何进行信息感知和加工处理的了解不够透彻,这需要神经科学领域的科学家对大脑工作机制进行持续探索。二是高质量信号的采集,由于侵入式脑电信号采集代价较高,往往需要开颅手术和动物实验,目前研究大多采用非侵入式设备,这使得我们获取的脑电信号质量大打折扣,如何获取高质量脑电信号是脑﹣机接口研究的重要挑战之一;另一方面,也可以不局限于大脑的电信号,还可以使用近红外等信号,进行多模态生理信号的整合,大大提高识别的准确率,从而在大脑系统和外界之间建立更好的联系。如果可以解决最重要的信号采集工作,我们就离实际应用越来越近了。三是需要考虑如何改进算法,进一步提高意图解码精度。最后,还需要考虑个体差异性的问题,因为不同人的脑电模式不同,对某些人适用的脑﹣机接口不一定适用于其他人。迁移学习技术有望跨越人与人之间脑电模式的差异,实现对大多数人都普遍适用的脑﹣机接口。这对于脑﹣机接口技术的广泛应用意义重大。

当然,当新技术用在人身上的时候一定会引起很多争议。如果将脑﹣机接口用在残疾人身上,可以弥补他的缺陷;如果用在正常人身上,那就会带来人与人之间的能力差异,这就带来了人工智能的伦理问题。人工智能的伦理方面有几个关键点,即不仅要公平、可靠、安全,而且还要保护隐私,具有透明性和可解释性。如机器人不得伤害人类,必须保证是安全的,而且还要服从人类的命令。近期一家脑﹣机接口公司将技术在课堂上运用,引起了很大的争议。因为其中涉及很多隐私问题,你的想法可能会被人利用脑﹣机接口技术“偷走”。我们也要避免出现科幻电影中机器操纵人脑,人类按照别人的意志去行动的情况。因此这项技术运用的边界在哪里,目前还在探讨阶段。

未来,通过记忆芯片进行记忆的植入和提取,或是通过人工感知达到传感器、芯片与大脑高度合作,我们将实现人类能力的增强,包括恢复残疾人的感知能力,扩展正常人的感知,最终实现脑﹣机一体,达到脑﹣机共融的未来。