http://www.nature.com/nature/journal/v527/n7576_supp/images/527S12a-i1.jpg

智能手机健身应用程序可以从人群中收集大量健康数据

  几十年来,世界各地的医生们一直在使用一种简单的方法来测量患者的心血管健康程度,即让人们在坚硬平坦的路面上行走,看在6分钟里可以走多长距离。这种测试方法还一直被用来预测即将进行肺移植患者的生存率、评估肌肉萎缩症的患病程度,以及评估心血管总体健康程度等。
  行走测试法被应用于许多试验和研究中,但即使是最大规模的研究也很少有超过1 000人参与。然而,在尤安·阿什利(Euan Ashley)于2015年3月启动的一项心血管研究项目中,短短的两周内他就收集到6 000人的测试结果。“这是很不同寻常的。”斯坦福大学心血管疾病中心负责人、遗传学家阿什利说道,“在过去,如果幸运的话,参与数据测试的病人通常只有数几百人而已。”
  阿什利希望,如此规模的统计数字,能够告诉他关于身体活动和心脏健康之间关系的很多信息。能够实现如此大规模数据研究的原因是因为:如今数以百万计的人们都配备有智能手机和健身追踪器或传感器,可以记录下人们的各种健身活动数据资料。通过医疗卫生保健研究人员的研究,试问从这类设备中可以得到哪些有收集价值的数据?数据的可靠性又如何?通过对成千上万人在各种日常活动中所收集数据的分析,他们还可以学到些什么呢?以及如何运用大数据算法来解读这些追踪器和传感器上的读数?
  到7月份为止,美国已有超过40000人报名参加了阿什利的研究,实验所用工具是一款针对心血管疾病而设计的iPhone应用程序MyHeart Counts。阿什利预计,随着这款应用程序在全国各地的推广和普及,参加人数还将继续大幅增加。这项由科学家设计、由研究所审查委员会批准、并要求知情同意的研究,要求参与者回答关于他们健康和风险因素的一些问题,并通过手机内的运动传感器收集参加者七天内活动情况的数据信息。还要求他们做6分钟步行试验,通过手机测量步行6分钟通过的距离。如果参与者已做过血检,可将相关数据信息输入,如胆固醇和葡萄糖水平等。每隔三个月,应用程序会重新测试并更新相关数据。

利用移动数据做更多的事情

  医生们都知道,身体活动是长期心脏健康的一个强有力的预测指标,阿什利说道。但目前还不甚清楚的是,什么样的运动才是最好的,还是不同的人群有着适合于自己的不同类型的锻炼形式。MyHeart Counts应用软件也许打开了回答这个问题的窗户。“我们可以通过分组实验来找到这种差异。”他说,“数据也许很多很嘈杂,但如果我们有足够多的数据,就可以从中发现相关蛛丝马迹。”
  庞大的数据量,使得这样的研究成为可能。传统的研究可能没有足够的数据量通过分组分群来获得具有统计学上显著意义的结果。比较罕见的事件可能不会发生在较小群体的样本中,或可能只能产生一个微弱的信号,最终消失在杂乱的统计噪声中。大数据可以克服这一不足,在足够大的数据集中,一些小错误可以轻易被消除掉。“你获得的数据可能很嘈杂,但如果数据足够多,你就可以找到代表某种意义的某个信号。”阿什利说。
  收集如此庞大的数据完全是有可能的,因为有一款称为研究工具箱(ResearchKit)的苹果软件可以用来开发用于这类研究的iPhone应用软件。MyHeart Counts就是ResearchKit开发并在同一天发布的5个应用软件之一,另几款软件正在试图通过对大数据的开发利用,展开对帕金森病、乳腺癌、糖尿病和哮喘的研究。
  帕金森病研究到7月共招募了约16 000名自愿者,这个实验用的也是行走测试,因为帕金森病的主要表现为运动障碍。测试实验中,让自愿者直线行走20步,通过手机的速度计和陀螺仪测量行走者的步态,评估他们的运动控制能力。同时要求他们每隔10秒钟对着手机叫一声“啊”,医生通过对他们发声震颤程度的测量,了解他们肌肉的紧张度。“使用移动设备上的传感器是一个很合适的办法。”总部设在华盛顿西雅图的一家非盈利生物医学研究咨询公司的数据开放倡导者约翰·威尔班克斯(John Wilbanks)说道。帕金森病应用程序mPower就是这家公司与纽约罗彻斯特大学的医生共同研发的,这个应用程序同时还使用调查问卷,通过与健身追踪器的连接收集更多数据。
  智能手机和智能手表的操作系统(如Windows系统和Android系统)编写有类似的应用程序。同样装有类似应用程序的还有不同公司开发的包括Basis、Fitbit和Jawbone在内的大量可穿戴健身设备。另外,研究人员还在开发可随时收集数据的其他类型的可穿戴传感器,包括临时性纹身和通过泪水测量血糖水平的隐形眼镜等。与此同时研究人员还加快了对现有设备的改装开发,如改造糖尿病患者使用的连续性葡萄糖监测仪,并将获得的数据添加到智能手机的综合数据资料库中。
  智能手机不仅仅能测量身体健康指标,研究人员如今正在尝试利用它来做更多的事情,例如,跟踪人的心理状态和情绪健康,通过倾听某人的声音来辨别压力程度,或通过追踪身体活动确定其社会互动情况,以发现是否有抑郁状况出现。

http://www.nature.com/nature/journal/v527/n7576_supp/images/527S12a-i2.jpg

美国东北大学的研究人员在实验室里通过一系列活动对传感器进行调校

  当今便携式设备越来越多地用于测量一系列人类活动,而如今的电脑计算机能力也强大到可轻松处理海量的数据,研究人员希望这些都将有助于对人类健康问题取得前所未有的深刻了解。

移动数据的测量目的与标准化

  面对越来越多令人眼花缭乱的各种各样的测量设备,研究人员既兴奋又发愁。“这是一种令人兴奋的混乱状况。”加州大学旧金山分校生物医学信息学系的系主任艾达·西姆(Ida Sim)说道。
  西姆是开放型移动医疗的创始人之一,移动医疗是一个开发处理和存储来自各种设备和应用程序的数据并研发数据标准化软件以解决目前测量设备和数据混乱现状的非盈利的公司。“大家都讨厌标准化,但如果没有它,很难准确地将数据整合在一起。”她说。对于一个需要正确解读一份葡萄糖水平检测报告读数的医生来说,重要的是要知道患者是否已经饿了很长时间。
  任何标准的建立都必须解决两个关键问题:一是来自某些设备的数据准确度有多高;二是测量目的是什么。如今的许多健康追踪器是为了告诉用户,他们今天走的步数是否比上周多一些,而不是为了收集符合实验室要求的测量数据。“这些健康追踪器所记录的只是一般性的运动状态,然后转换为步数计算,以了解今天行走的步数是否比昨天更多一些,如此而已。”波士顿东北大学研究个人健康信息的斯蒂芬·因蒂勒(Stephen Intille)说道。
  为更好地了解设备实际上的测量目的究竟是什么,因蒂勒带着一些自愿者进入他的实验室里,将各种各样的传感器连接到他们的双臂和双腿上,其中不仅有商业化的设备,还有其他实现室专用传感器,来记录他们的运动、心率、呼吸和其他数据。2至3小时之后,他读取了这些志愿者们行走、做家务和骑自行车等类似活动的测量数据。然后因蒂勒拿掉与自愿者连接的其中一些传感器,让他们回家,在之后的几天里,他们身上戴着的其余一些设备继续收集他们真实生活中的数据。在接下来的三个月里,他再次切断了与其中一两种设备的连接。
  通过这种方式,因蒂勒可以精确地发现商业化设备在某个特定活动中究竟记录的是什么。例如,某人熨衣服时,Fitbit监测器会产生一系列数据,而实验室设备记录的只是这人的心率和呼吸。如果计算机可以被训练用来在实验室里识别不同活动产生的不同的Fitbit读数,那么也可以用来识别人们在真实生活环境中的活动,并分析这些活动对人们身体健康的影响。
  “就我个人而言,我不认为如果没有与用户的交互活动,会有更好的效果。”因蒂勒说道。他的想法是,是否可以通过某种通话装置与健身跟踪器取得联系以获得数据,例如,在了解了某人的习惯之后,可以向他提出一些问题,比如:“您现在正在遛狗吗?”他还认为,为了获得更全面的数据,人们可能需要穿戴不止一种设备,也许一个戴在手腕上,另一个套在脚踝上。
  研究人员要获得对人们健康状况更多的了解,就需要更详细的数据信息。知道人们走了多少步,或行走速度的快慢,或在健身房里的活动强度,了解这些可能很容易,但要理解这些日常活动对人们健康的影响有多大,可能就不那么容易了,斯坦福大学长寿研究中心名誉教授、医学生理学家威廉·哈斯卡尔(William Haskell)说道。他亦是和因蒂勒一起验证商业追踪器测量的合作人。
  “对于低强度范围的活动,从站立到随意走动,我们所知甚少。”哈斯卡尔说道,“一天坐在办公桌前,只是随便立起来走动一下,或是绕着办公室好好地走几圈,哪个效果更好,我们并不知道。”
  早在40年前,哈斯卡尔就开始使用速度计跟踪运动,对于通过可穿戴设备获得数据他感到非常兴奋。“这样的技术已经来到我们面前,”他说,“我们要做的只是验证它,用它24小时观察人们的活动情况。”

移动数据与个性化治疗

  大量数据的获得可以提高对健康研究的力度,同时可穿戴技术的出现也拓展了数据收集的途径,通过24小时长期不间断地监测人们的日常活动,可以收集到之前难以获得的各种不同类型的数据。
  “大数据的意义不仅仅在于我们能够获得大量的数据,而且还在于这些数据来自于许多不同的来源。”西姆说道。
  病人来看病时,她可以和他们交流20分钟左右。但是,“他们不可能一直呆在我这里,对于他们其余时间里的活动情况,我一无所知。”她说,“我不知道在他们的日常生活中发生了些什么。”而不间断的数据收集可能最终改变这种状况,帮助医生更好地为患者定制个性化的治疗方案。西姆说道,但现在还有一个至关重要的缺失环节:还没有人设计出一种将有意义的数据从商业设备传送给医生的方法。“这类设备的设计完全不符合医生们的工作流程。”她说。
  但这种普遍收集的健康信息可以产生更广泛的社会效益。悄然出现且无处不在的各种新技术从成千上万个人身上收集到的大量数据,将产生对群体健康有重大意义的大量研究成果。阿什利已有了一个移动健康版的长达数十年的心脏病研究计划,以确定影响心脏病的各种危险因素。目前他已经开始对iphone收集到的数据和曾在斯坦福大学医学中心就医的iphone用户的基因组数据进行整合。
  因蒂勒相信,随着大数据集的创建,医疗卫生保健研究人员将能够回答一系列产生的新问题。“我们无法获得个人层面上的任何信息,”他说,“在能够检测到人们移动设备上的数据之前,这是根本不可能的,这是与我们以往处理医疗保健问题完全不同的一种方式。”

资料来源Nature

责任编辑 遥 醒