我近年来采访的启明星里,70年代末及80年代这一时段的人比例越来越高。我明显感到,这个年龄段的人更少有传统的羁绊,他们更愿意从自己的视角去看周围的世界,去把握自己的人生道路。而且,由于教养相对较好的原因,这一批人普遍知书识礼,尽管面对的生存发展环境和机遇更为严苛,但他们普遍比较开放、乐观。这种感觉已有一段时间,而在我上周访问了去年入选启明星、来自宝信软件的系统架构师沈春锋(上图)后更加深了这一感觉。
(一)
沈春锋给我的第一印象是一个长得非常白净、言谈举止斯文有度的男孩,所以当他说自己是浙江绍兴人时,我就觉得真是对了,他就该是那个生活相对安逸、出绍兴师爷地方的人。79年出生的沈春锋是家里的独子,高中毕业前一直在农村的田园生活中长大。他的学习成绩一直名列前茅,初中经县里选拨进入奥数班,高中在县重点中学入读。高中时物理和数学都很好,当时以他的成绩可以保送到北大数学学院和南开数学系,但他还是更想到理工科更为优秀的清华去求学。这样1998年,他以优异的成绩考进当时清华大学非常热门的汽车工程专业。
清华本科读书期间,他在学好本专业课程的同时,参加了当时最有挑战性的学生业余科技比赛挑战杯,获得了一等奖。由于学习成绩优异,他获得报送本校研究生的资格。然而,此时的沈春锋却作出一个出人意料的决定,与未来的导师深入沟通后,通过了计算机系学术委员会的答辩,从汽车工程专业转到计算机专业。汽车工程到计算机专业跨度之大意味着他基本要从头开始,付出更多的努力才能进入一个新的领域,而这一切来自于他自己的坚持。
访问中他在解释自己当年的跨专业举动时说,汽车学院是一个集大成专业,本科有幸在那里学习获益良多,研究生时就希望在专业性上有所加强,所以想换个专业。“换专业其实很难,好在导师很开明”,也是在和导师作了交流后他选了计算机视觉作为专业方向。之所以选这个方向,春锋说也是想挑战一下自己:“机器视觉与人工智能一样,是一个非常难的技术领域。当前理论实用化的比例还很低,研究到目前为止还是一个很前沿的方向。选择这个课题,意味着将面临更多的挑战。”
就这样,从2002年至2008年,沈春锋在清华硕博连读,其间2007年有半年时间他受菲力浦公司邀请到德国亚琛做了为期半年的裸眼3D显示器方面的课题研究,回校后就投入了博士论文答辩的准备。小沈的博士论文集中在复杂光照环境下运动目标跟踪和识别的领域。光线的变化以及这种光照变化对算法的影响,被认为是机器视觉里最难的问题,比如在光线突然发生变化(如进入隧道)后如何跟踪和识别物体。小沈在博士论文中探讨了在复杂光照变化的环境下如何提取目标特征(把要跟踪的目标和其他物体区分开)。他还在论文中提供了一种算法,以在上述过程中尽可能减轻光照带来的负面干扰。
(二)
2008年,在清华园念了10年书拿到博士学位的沈春锋面临择业的选择。以他的专业背景如果想留京有很多机会,比如高校、研究所和外企。“当时也可以去其他学校做研究,但我想做点偏实用的工作,即使研究也希望集中在有应用前景的产品和技术,所以我就把公司放在学校前面,毕竟再顶尖的高校做的研究离实用化都会有距离。公司是有利润诉求的,做的是有实际需求驱动的研发,很少做纯理论型的研究,而大学则致力于前瞻性的技术探索,定位会有差异”。加上想到离家近一点的地方,这样上海就成为他主要的选择。
但他有一个非常确定的选择是不想去外企和私企,而独看好有实力的国企。访问中我一听到他这样的选项也有点惊诧,因为以他的年龄,至少不会对外企、私企有“成见”。沈春锋这样解释他的想法:因为在中国的外企核心的研发比例很少,而且成果都会归属于外方,对中国的技术发展没有太大的价值。而相对于私企,国企的发展平台无疑会更大一些,比较适合自己的发展。
至于为什么和宝钢属下的宝信软件结缘,小沈的解释是他本科生时曾拿过宝钢的学业综合奖学金,临近毕业时宝信软件来清华招生,宝信是国企又是软件业中的上市公司,离浙江也近。这些因素使这位清华才子与上海一家大型国企发生了交集。
2008年到宝信后,小沈一直在研发部,当时监控平台是公司的主打产品,所谓监控平台就是在工业环境中,通过计算机采集数据,同时进行分析和处理的系统软件,以实时监控生产环境中机器的运行状态。这种监控平台也可以用于监控轨道交通中车辆的运行、石化领域中反应炉的化学反应、采掘行业传送带的传输等情况。这套系统在宝信已经做了十几年,已经从专门针对工业制造,扩展到了其他大型的工程领域。但到了小沈进入宝信后,这套当家产品遇到了一个瓶颈,即客户希望接入的设备越来越多,存储的数据体量也越来越大,而且需要实现数据的长久保存。与此同时,客户普遍希望针对海量数据,能够实现数据的快速存储、查询和分析。
为解决这些难题,在公司内部的一次合理化建议的头脑风暴会议中,入职一年的沈春锋提出了建“实时数据库”的想法,即完全从底层开始设计一种新型的数据库,专门存储带时间信息的海量记录,成为面向生产型企业和物联网中需要海量时序数据处理的数据中心。据小沈介绍,国外有类似产品,售价都在100万以上,而且只能用于单台服务器。多年专业训练的直觉让沈春锋敏锐地觉察到公司应在这方面加大投入,突破实时数据库领域核心技术的研发,并拥有自主的解决方案。
这个合理化建议居然得到了公司高层的破格采纳,并授权沈春锋组建一个团队进行技术攻关。得到信任的这几个年轻人仅用半年时间,就完成了实时数据库核心部分的架构设计,理论测算得到一台服务器每秒可存储1 000万条数据。这个理论测算结果令小沈和他的伙伴们兴奋不已,因为即使是最好水平的国外实时数据库,也只能达到每秒百万条数据的存储当量,而当时业内通用的甲骨文公司的数据库只能达到万条量级。
在后一个半年,沈春锋小组攻下了最核心部件――数据存储内核的开发。这意味着他们解决了一个最大的难题:大容量数据如何快速、准确地存入硬盘。所谓快速是每秒时间中能存入1 000万条数据。其中的难点在于,首先这些海量数据要通过网络能进得来,然后是对这些数据要做快速压缩,并存入硬盘。针对硬盘的缓存系统,沈春锋他们设计了一个让大规模数据能在磁盘里达到近似连续分布的系统。小沈透露说,这其中最主要的是算法,而这方面工作直接得益于他在清华研究生期间受到的算法方面的训练。
就这样,沈春锋小组拼搏了一年后圆满完成了任务。性能得到第三方认证,并做了配套的数据加工、展示、计算工作后,他们的软件系统已实现了商品化,主要应用于工业制造、交通枢纽等领域,而价格仅是国外同类产品的三分之一。这套系统除了工业制造业,物联网领域也有广泛的应用前景,如车联网已经用了他们自主研发的这套系统对新能源车进行监控。这个实时数据库的研发项目在投放市场后每年都为公司创造了不可忽视的产值。凭借过硬的技术指标,这一实时数据库产品获得了2011年在波兰举行的华沙国际发明奖金奖。
作为这一技术及产品创造者的沈春锋比一般人更清楚这个产品的价值:不在于仅仅卖出多少套软件,更在于有了这个技术后,公司可以承接一些原来因数据难以快速存储而无法承接的项目。如今,成都、上海地铁的部分已经应用了他们的技术,实现了大数据的分析和预警。
也因为如此突出的业绩,入职三年后的沈春锋就被公司聘为系统架构师,去年更升任技术总监,并被评为公司优秀员工。而这一切似乎又印证了沈春锋的国企观:国企的舞台是最能锻炼人的。我的经历也能证明,因为宝信的领导不仅有在新领域中投入的魄力,还能开明地倾听来自基层员工的意见,在这种体制下,创新的想法才能得到尊重。
(三)
从前年开始,沈春锋的研发重点已从大数据的存储转向数据分析,去年他申报成功的启明星项目也是发力在数据分析。谈到数据分析,这其实更是大数据时代的核心所在,而沈春锋依然是基于公司研发的立场来看待数据分析,且听他分析:我想做的数据分析(启明星是其中一部分),一块是把非结构化数据(如图片、视频)变成数值化可分析的数据。比如图像等非结构化数据,一帧图像由数不清的像素点组成,量非常大,只有把大量的这些以点状形式呈现的无法计算的数据识别转化成数值化可分析的数据,才有分析的价值。还有一块是对工业数据做质量分析(如检测生产过程的稳定状态)以及发现生产过程中的异常情况等。
在小沈看来,现在大数据讲的人很多,但是做这方面实际工作的人却很少,而做工业过程数据分析的更少。而实际上工业制造及其优化是大数据最能发挥作用的领域,再加上宝信的背景,所以,沈春锋觉得自己不能缺席。“如果假以时日,我们真的在工业过程的数据分析方面形成特色,解决应用中遇到的实际问题,则一定会在竞争激烈的工业软件领域形成自己的优势。”
从坚持参加高考,研究生时选择新的专业方向,到坚定地选择国企,成功挑战数据存储领域的难题,以及接下来对工业数据分析的思路,这些在我看来是很典型地反映了这一代年轻人身上最好的特征,务实而乐观,不盲从且有自己独立的想法。而当我试图再从沈春锋那里得到一些求证时,这位博士腼腆一笑:“这或许跟我从小的成长环境有关,来自农村的环境更能体会到只有春耕的付出,才能有秋收的喜悦。”
江世亮采写自2014年6月29日