是否有人想过,如果圣诞老人给地球上的孩子送礼物是真实的,那么,莫非他还要先判断某个孩子过去一年的表现是否值得收到礼物?这是个大数据问题。如此,人类的先进算法有用武之地吗?
玛丽娜冻得直磨牙。她需要聚精会神。6个月来,她一直待在一个被冰封苔原包围的小村落里等待这一刻。房门吱嘎响,一团暖气缭绕地飘进寒冷的空气中。一名男子正咧嘴对她笑,似乎在展示他身上尺寸过大的红袍与脚上宽松的拖鞋。男子大概65岁,他说:“看来,你就是阿尔菲 · 申克每次进入村子时纠缠他的那个家伙。”
“我确实有罪,”她笑着说,“我叫玛丽娜 · 伯吉斯,是GDM公司的高级数据工程师。你是……”
“我显然不是你所期待的模样,”他轻拍肚子,“相信我,等到年底我的体重会长回来的。赶快进来吧,我正在煮茶。”
玛丽娜扫视了这间小屋,然后坐到壁炉前的扶手椅里。一切都显得如此普通。从挂在炉火上的旧水壶到盘旋上升的木楼梯,楼梯延伸进微微发亮的漩涡。好吧,漩涡很古怪。
“相当刺眼,对吧?”他边说边提起水壶倒茶水,“我试图挂上帘子,但帘子被吸了进去,无生命物体的跃迁比较差。其实人类也一样,所以不要做任何傻事。”他坐进另一把扶手椅,“阿尔菲解释了时间膨胀吧!”
玛丽娜点点头。
“我恐怕这场会面不得不简短。”
“我直奔正题吧!GDM公司专门研究利用深层神经网络来为复杂的人类数据建模。在你的案例中,模型输出会是二元分类,输入内容会是每个儿童在过去一年里的行为信息。从申克先生给我的训练数据——”
他咯咯笑起来,声音浑厚沙哑,“鬼祟的家伙!他没告诉我这件事。”
玛丽娜吞咽了口唾沫,但他似乎没有被惹恼。他若生气,会有点儿虚伪,毕竟他在没有询问参与者的情况下就创建了“名单”:这个复杂情况将数据置于法律的灰色地带。但为了获得合适的报酬,GDM会与灰色地带合作。“当然,数据是匿名的,行为细节减少到最低程度,从而不可能识别出个体身份。即便如此,我们还是达到了98%的分类准确度。”
他第一次露出惊讶的模样,“真的吗?”
“是的,这是基于一万个样本的交叉验证结果。对于数十亿的样本数,我们能做得更好。当然,你可以人工检查边缘案例,神经网络算法在那儿的可信度偏低。按我的理解,你的团队通常需要用一千年来处理名单?”
“是两千年。”他啜饮了口茶水,“我们要检查两遍,但正因如此,我们才要在膨胀的时间里做这件差事。”
“是的,申克先生解释过了。”玛丽娜将她那杯茶水放到一边,不再触碰,叠起双手放到膝头上,来阻止双手颤抖。“他还说,时间膨胀率无法匹敌日益增加的人口,导致你们最近的名单审查工作变得——很匆促。”
“那个小——”他吸了口气再缓缓呼出,“我不会否认。我们在50年代达到了稳定时间膨胀的极限。但人口一直在增长,而且……”他叹气道,“错误已经酿成。”
“这是个难以对付的情况。”她应该放一只手到他的膝头吗?不,这样做太过了。“但我们能帮上忙。之前数年的数据当训练数据绰绰有余,我们的系统在大约两周里就能处理完你需要的名单。”
“你提过边缘案例,数量有多少?”
“不到2%。我们预期将你们的工作量降低到1/50。”
“你们的神经网络算法如何提取行为背后的意图?在人工审查中,那是我们的瓶颈。”
“我不能完全告诉你。对于人类审查员来说,意图很清楚,但神经网络算法如何表示那个信息并非凭借直觉的过程。当然,结果不言而喻。”
“意图如此重要。”他沉思道,“根据举动背后的原因,同样的举动可能将你移到不同名单的最前面。”他又啜饮了口茶水,再次停顿,“我不能给你补偿。这违背规则。”
“我们并不需要金钱补偿。”
“你这么做是出于善心?”
玛丽娜犹豫不决,但是企图蒙骗某个知道你出生后每个行动的人不像是明智之举。“我们的酬劳是匿名处理后的名单。我们公司有许多获得行为数据的机制:设备追踪、网络活动、购物历史及通常那些手段。但你们的数据集规模是我无法领会的。它的价值无可比拟。”
“呃,我们掌握了一些甚至连GDM也不知道的诀窍。”他瞥了眼壁炉上的时钟,含混说道,“遗憾的是,我必须返回膨胀时间了,但谢谢你的到访。”
“不,谢谢你才对。”玛丽娜站起身。
“请在村子里再待一周。我会派阿尔菲过来安排。当然,今年我们会同时人工处理名单,再比较结果。接着,我们或许能在此基础上推进合作。”
“好极了!”玛丽娜说,试着保持声音平稳,“我期望与你合作。”
“我也一样。”他打开门,“我大概应该提醒你一下,我提过的那些诀窍能用来在任何时候抹除数据集,无论你将数据集存储在哪儿,无论你如何存储,都不管用。我希望你理解这一点。”
玛丽娜在门阶上停住脚步,转回身。“我也向你保证,我不会辜负你的信任。GDM在合乎伦理地使用数据方面的声誉是毫无瑕疵的。去年,我们帮助……”
他再次咯咯笑起来,声音像海一样低沉。“放轻松,玛丽娜,”他边说边关门,“这年头,名字登上淘气小孩名单是种时髦。”
资料来源Nature
___________________
本文作者皮普·库恩(Pip Coen)出生于英国,在美国取得神经科学博士学位,是2015年号角写作班毕业生。他的科幻小说作品曾发表于《奇幻与科幻小说》和《令人信服的科幻》。