英国的e-科学项目
如前所述,在英国的e-科学计划中,每一个研究委员会都会资助许多在他们各自的应用领域中的领头项目。在20多个预期项目中,已经有8个项目在进行之中,其余的项目将在今后的6个月中进行。PPARC资助两个e-科学领头项目(重点放在粒子物理学和天文学);EPSRC资助6个项目,包括从基础科学到工程学科等范围。
在本节中,我们对那些得到资助以便为e-科学核心计划设定范围的领头项目作一概述。作为PPARC资助项目(已经在引言中作过讨论),GridPP是英国粒子物理学家的一个合作项目——旨在建立一个世界范围网格的英国部分,以支持LHC试验。英国的这一项目与欧盟的DataGrid项目和CERN项目密切合作。英国的天文学家在AstroGrid的“虚拟观测站”项目中走到了一起。显然,他们与美国的NVO和欧洲和AVO项目亦有密切的合作关系。与此同时,PPARC和e-科学的核心计划通力合作,以开发一种通用的符合建筑学原理的理念和一种核心网格中间件的一般基础。
工程和物理科学的领头项目
EPSRC资助的6项领头项目:
1.RealityGrid——研究凝聚态物质和材料的一种工具
这一项目由彼得 · 康文克(Peter Convency)教授领导,参与这一项目的是一个由QMW和爱丁堡大学、拉夫伯勒大学、曼彻斯特大学和牛津大学组成的大学联合体。项目的目标是:使复杂的凝聚态物质在分子水平和中尺度上进行实际模型设计成为可能,而且可为新材料的发现指明方向。把高性能的计算设备同显像设备结合起来,对这一项目来说十分重要——可以对那些需要同试验数据进行比较和协调的问题作模型设计提供一种模拟的环境。RealityGrid在与工业界合作方面已见成果。
2.Comb-e-Chem结构性能图谱法:组合化学与网格
Comb-e-Chem项目所涉及的问题是,通过组合方法合成新的化合物。它是一个由南安普敦大学和布里斯托尔大学合作的项目,该项目的领导人是杰里米 · 弗雷(Jeremy Frey)博士。这个大学联合体又与Roche Discovery,Welwyn,Pfizer和IBM公司合作。组合方法为产生大量的具有独创性的化学知识提供了新的机遇。为此,大量的原始数据需要积累、整合和模型化,以便达到最高的效率。这一项目打算开发一个整合性的平台,它能将现有的结构和性能数据资源在一种以网格为基础的信息和知识共享的环境中结合在一起。
对这种平台的第一个要求是,支持基于同电子实验室和e-工作日志设备结合的新数据的收集,包括过程和产品数据。下一步是通过以网格为基础的定量A和模拟模型设计来整合数据的产生,以扩大试验数据的来源。考虑到更大的适用环境,开发某种通道已经势在必行,这种通道可以透明地进入数据检索、在线模型设计和试验设计,以扩大具有科学兴趣的新领域(按要求建立在服务基础上的网格计算基础设备上,便以延伸到实验室中的器件和数据库与计算资源中去)。
3.分散的飞机维修环境:DAME
在这方面合作的大学有:约克大学、牛津大学、谢菲尔德大学和利兹大学,吉姆 · 奥斯汀(Jim Austin)教授是这一项目的领导人。此项目旨在建立一种以网格为基础的分散的飞机发动机诊断系统。该项目针对的是性能问题,譬如有实时需要的大规模数据处理。
通过这一项目可以得到一种通用的分散的诊断网格应用、一种用于飞机发动机维修的燃气透平示范器和用于分散数据搜寻和诊断的技术。分散的诊断是一个普遍存在的问题,它在医学、运输和制造业诸多领域中是很重要的,希望在这一项目中得到的经验和创造的工具能适合在这些领域的应用。
4.实现最优化和工程设计检测(GEODISE)
GEODISE是南安普敦大学、牛津大学和曼彻斯特大学与BAE系统、罗尔斯-罗依斯公司和Fluent公司之间的一个合作项目。这一项目的目标是:能够提供与智能知识库与最新型、最优化的检测工具,以及产业优势分析代码和分散的计算和数据资源的无缝对接。
工程设计检测和最优化是一种使工程模型设计和分析能被用来产生改进设计效果的方法。在今后的2~5年中,智能检测工具将变成所有工程系统中的一个重要组件,并将通过建立、执行和后处理设计、检测,以达到最优化活动的过程来引导用户。这样的系统一般要求大规模分散模拟并与工具相配合,便于从知识库中得到的信息来描述和改善设计。而这些工具的硬件往往是分散的,而且受到供应链中多种因素的制约。
评估一项单一的设计,可能需要分析109个字节的数据,而为了改进设计方法则需要1012个字节的分散数据的同化作用(assimilation)。这后一个目标的实现无疑会引起智能检测工具的发展。重点应用领域将是计算流体动力学(CFD),它与工业界有明显的关系。
5.发现网(Discovery Net)——一种高通量信息学的e-科学试验床
发现网领头计划具有与其他项目完全不同的目的。它将重点放在高通量上,旨在设计、开发和实现一种先进的基础设施,以支持对大量的高通量器件产生的关键数据作实时处理、解释、整合、直观化和搜寻。该项目将包括新的器件和技术:生物学中的生物芯片、生物化学和组合化学中的高通量测试技术和能源与环境科学、遥感和地质学中的高通量传感器。这一领头项目还包括许多应用研究:蛋白质折叠芯片(Protein Folding Chips)和采用LFII技术的SNP芯片分析,以蛋白质为基础的荧光微阵列数据、空气传感数据、可再生能源数据和地球灾害预测数据分析。该项目的组织者是以伊克 · 格奥(Yike Guo)博士为首的伦敦皇家学院研究小组和工业伙伴Infosense Ltd等公司之间进行的。
6.my网格:直接支持e-科学家
这一领头项目由曼彻斯特大学、南安普敦大学、诺丁汉大学、纽卡斯尔大学和谢菲尔德大学与欧洲生物信息学研究所等单位参与。my网格的目标是设计、开发和展示具有比现有的网格基础设施更高级的功能的设备,以便对在利用复杂而分散的资源方面工作的科学家提供支持。在这一项目的实施中,要开发一种e-科学家的工作平台。旨在支持以下几方面的工作:科学的试验研究方法,证据收集和结果同化作用;科学家对公共信息的利用;以及在科学合作方面使必威在线网站首页网址 的组合能解决必需紧急研究的问题。
这种工作平台的一个新的特征是,为与资源选择、数据处理和程序制定(process enactment)有关的个性化设备作准备,myGrid的设计和开发活动,将会受到生物信息学应用的推动。myGrid将开发两种应用环境,一是支持功能基因组数据的分析;二是支持一种图形数据库的解读。这两项任务都要求对科学的方法作明确的表达和界定,并具有挑战性。这一项目的工业合作伙伴是GSK、AstraZeneca、IBM和SUN公司。
粒子物理和天文学领头项目
PPARC并不像ESPRC那样支持广泛的科学领域,它只有两项领头项目,这两项受资助的项目是:
1.GridPP项目
GridPP是来自英国和欧洲原子核研究组织(CERN)的粒子物理学家和计算机科学家的一个合作项目。GridPP的目标是,建立某种英国网格并传送网格中间件及硬件基础设备,使能够对引言中所述的CERN大型强子对撞机(LHC)项目的网格样机作测试。GridPP项目设计成能与英国现有的粒子物理学计划衔接起来,如此能对网格技术进行早期部署和充分测试成为可能。该项目利用的是Globus工具包,而且英国的许多GridPP中心同时也是英国的e-科学网格中心。因此,有许多种影响研究计划和技术的方式。
2.AstroGrid项目
AstroGrid是爱丁堡大学、莱斯特大学、剑桥大学、昆斯贝尔法斯特大学、UCL大学和曼彻斯特大学的天文学家和计算机科学家同RAL公司的一个合作项目。AstroGrid的目标是,建立一种网格基础设施,它能使“虚拟观测台”把通往天文数据库的接口统一起来,并提供远程接通和数据的同化作用。虚拟观测台是一个全球性的课题,而AstroGrid项目的实施无疑是英国对推进全球虚拟观测所作重要的贡献。
PPARC和EPSRC领头项目涉及许多学科和网格技术领域,在所有的应用领域中,都有一个明确的要求,那就是对支持数据处理和进入联合数据库的需要。而现有的网格中间件,在这方面能够提供的支持还十分有限。
[Future Generation Computing Systems,2002年第18卷]