使用多媒质技术是计算机发展的必然

多媒质技术是90年代计算机的时代特征,它使计算机的发展进入一个崭新的阶段。

多媒质在英语中叫做multimedia。由于medium一词在中文中可译为媒质、媒体、媒介、介质等等,所以有人也把多媒质叫做多媒体、多介质等等。笔者认为medium的各种译名中还是有区别的。例如各种传播新闻消息的手段,如报纸、广播等应当称为新闻媒介。而在热机中传递能量的物质,如水受热变为水蒸气,水蒸气受热膨胀推动活塞做功。在这里水(水蒸气)起了把热能变换为机械能的作用,这种传递能量的物质便被称为工作介质。

在计算机领域中,medium有两种含义。—是指用以存储信息的实体,如磁带、磁盘、光盘、半导体存储器;二是指承载信息的载体,如数值、文字、声音、图形、图像等,为了避免混淆,前者应译为媒体、后者应译为媒质。multimedia一词乃是指计算机所能处理的信息,可以由数值、文字、声音、图形、图像等多种媒质承载。所以理应译为多媒质。

计算机是用来处理信息的,而信息必须依附于一定的载体上。如上所述,客观世界中可以承载信息的媒质有多种多样,但人们认识世界、改造世界,只能从简单到复杂、从低级到高级地逐步发展。

在计算机发展初期,人们只能利用数值这种媒质来承载信息。那时,信息只能通过0和1这两种符号来表示,也就是在纸带或卡片上用打孔或不打孔来表示某种信息。这种用0、1数值承载的信息,输入输出全是一些枯燥无味的0和1,很不直观、很不方便。输入输出的内容很难理解,而且容易出错,出错了也不容易发现。这一阶段也就是使用机器语言的时代。由于有上述种种映点,使得这一阶段的计算机应用只能限于极少数的计算机专业人员。

50年代中期,出现了高级程序设计语言,开始了能够用文字作为媒质来承载信息,这时,人们可以用文字(例如英文)来编写源程序,输入到计算机里,而计算机处理的结果也可以用文字表示来输出。这一阶段也就是使用高级语言的时代。这时,人同计算机的交往便直观、容易得多了。计算机的应用也就扩大到具有一定文化水平的一般科技人员了。

但是,使用文字这种媒质同计算机交往,对于文化水平较低的、特别是非英语国家的公众来说,仍然是件很困难的事情。

因此,从80年代开始,人们便致力于使声音、图形、图像等多种媒质所承载的信息,都能够利用计算机来处理、声音、图形、图像等所能承载的信息,不仅远比数字、文字承载的信息丰富多彩,而且它们也是人们在日常生活中最经常、最大量使用的承载信息的媒质。因此利用多媒质将使计算机的应用更为直观、容易,也就是同人的友好性更强。这就使得一般文化水平较低的公众,包括儿童在内,都能使用计算机、为计算机的更广泛普及奠定了基础。

从以上介绍可以看出,无论从普及计算机应用的角度来看,还是从拓宽计算机能够处理的信息类型看,利用多媒质技术都是计算机发展的必然。这也标志着计算机的发展进入一个崭新阶段。

当然,90年代多媒质技术所以成为计算机的时代特征,一方面是客观的需要,另一方面80年代的技术发展使得利用多媒质成为可能,才使得90年代计算机能够普遍使用多媒质技术。

最早致力于使用多媒质技术的,要数美国的App-le计算机公司。它在发展个人机方面,采取了同IBM完全不同的方针。

IBM是把个人计算机看做同大、中型计算机配套使用的,作为后者的终端来看待,而Apple则把个人计算机当作启发个人创造性的最高级工具来开发、普及,希望它有助于改变人们的学习和工作方式。

Apple在1984年开发的Macintosh个人计算机首先使用了多媒质技术,取得很大成功。在美国受到包括儿童在内的广大用户的欢迎,获得了巨大市场,成为唯一能同IBM相抗衡的力量。

Apple使用多媒质技术成功的经验,使世界所有计算机厂家都不能无视这一动向 · 由于使用多媒质技术肯定是今后计算机的发展方向,而多媒质个人机拥有极其广大的市场潜力,同时开发多媒质技术要花费巨大的资金和人力,这就促使昔日的势不两立对手,世界上头号和二号个人机厂家IBM和Apple于1991年7月宣布进行合作。IBM将利用Apple在使用多媒质方面的丰富经验,而Apple将利用IBM在硬件上的优势,1991年10月公布的两家合作具体内容中,有一项便是联合成立多媒质技术研究所。

现在多媒质技术不仅普遍应用于个人机、工作站中,而且Cray Research公司于1991年11月19日发表的世界上当前最快的巨型计算机“Y-MPC90系列”中(每秒进行240亿次浮点运算),也使用了多媒质技术。

使用多媒质的技术关键

声音、图形,特别是运动的图像中,所承载的信息量,远比数值符号、文字中承载的信息量多得多。例如,目前已在个人机中使用的1024×768像素的VGA显示器,显示黑白图像时每帧图像的信息量便达约1兆位(比特),如用八位表示灰度则信息量便扩大到约1兆字节,如为彩色图像,侧信息量又得增大好几倍。另外,图像和声音信息还要求实时处理,因为音响和语音的播放不能中断、电视图像要求以视频速度更新图像数据。这样大量的数据(信息量)的实时处理、传播和存取,当然对计算机硬件要提出一系列要求。如要求计算机能够进行高速信号处理、拥有大容量的内存和外存、满足实时大量数据传输的传输频带宽度。一般认为,只有个人机的数据传输速度从目前的每秒150千字节提高到600千字节,数据的存储容量从目前的600兆字节提高到4000兆字节,个人机才有充分的能力来处理运动的图像。

提高硬件的性能是实现多媒质技术必不可少的手段。但是单纯依靠提高硬件性能不仅是一种笨方法,而且还不是一蹴而就便可实现的。因此,解决信息量过大、传输频带宽度不够等问题更为通用和彻底的方法,便是对图像和声音进行压缩编码。这样,将使计算机能像处理文本数据那样处理图形和图像,图形和图像有可能方便地在电话线上传输,这就打开了多媒质技术同电视、卫星通信等结合的可能性,并使计算机同家用电器融为一体,为它向家庭普及开辟广泛的道路。

但是,信息的实时压缩编码要求非常高的处理速度。例如,闬25 MHz的68030处理器把25兆字节的图像压缩到1/25,要花15分钟。因此就需要使用专用的DSP(数字信号处理器)芯片。例如,用C-Cube Microsystem生产的C-Cube图像压缩处理器可以在1秒内完成相同的处理。

目前最主要的图像压缩技术有三种 · 第一是JPEG(连接图像专家小组)提出的规格,第二是MPEG(运动图像专家小组)提出的规格,第三是英特尔提出的并受到IBM支持的DVI(数字视像交互)规格。其中以DVI最有前途。

JPEG是由ISO(国际标准化组织)和CCITT(国际电报电话咨询委员会)共同进行标准化的彩色静止图像的压缩技术规格。可把数据压缩到1/10至1/30,可以实现实时再生。

MPEG是由ISO和CCITT共同进行标准化的彩色运动图像的压缩技术规格。可用每秒144千字节的速度传输彩色运动图像,并可用每秒32千字节的速度传输16位量化、48 kHz取样的立体声声音。

DVI是由英特尔(Intel)开发的彩色运动图像的压缩规格。图像传输速度只要求每秒17千字节便够了。可以用每秒1.9千字节的速度再生AD-PCM的立体声声音。还支持JPEC规格。通过DVI压缩数据后,CD-ROM(利用袖珍光盘的只读存储器)便可再现75分钟的动画。

DVI中用以压缩动画的算法有两种:PLV(生产层次视像)和RTV(实时视像)。PLV是把图像数据先送到英特尔公司,由该公司用并行计算机iPSC进行压缩。所以用这种算法时,用户自己不进行压缩而只能再现。RTV是实时进行数据压缩、扩大的方式。用这种算法时,用户既可以进行录制,也可以进行再现。但用RTV得到的图像质量不如PLV的。在静止图像方面,英特尔采用了自己的压缩算法。在1991年3月生产的新芯片中,对JPEG作了修改。

由于DVI得到英特尔和IBM的共同支持,所以非常可能成为数字化动画技术的标准、但是由于:(1)不少厂家都在准备开发MPEG规格的芯片;(2)采用PLV算法必须依赖英特尔进行数据压缩;(3)采用RTV时,压缩用的和再现用的两种插板,加起来高达几千美元。因此如何才能真正使DVI成为标准而获得普及,尚不得而知。

多媒质技术应用现状和展望

多媒质技术将使计算机同电视、音响、电话、传真等融合在一起,因此它将给人类社会带来巨大变化。下面就多媒质技术的不同方面,介绍各国专家在1991年10月召开的“1991年多媒质国际会议”上所作的论述和展望。由此可看到多媒质美好前景,

英特尔公司DVI部门推销负责人斯达法认为,多媒质产业诞生才几年,目前市场规模还非常小,但是今后肯定会大大发展。特别从1991年起,已经在各种各样技术领域中腾飞。

在多媒质发展中最关键的是,把运动图像进行实时压缩和扩大的视像处理技术。多媒质的魅力就在于能促进相互交往。像电视、录像、电话等,都非常需要采用多媒质技术来提高其相互交往的功能 · 但这需要有用户能够控制多种多样数据(指承载于多种媒质上的信息)的环境。

目前,实现这样的环境还有一定困难,例如同电视的对话性(交互性)还只限于开关和选择频道而已。就是对计算机也主要用于控制文字方面的信息。

为了打破这种局面,各软件公司进行了种种尝试,英国在上万家酒吧中使用了可以取出所收藏的游戏节目和各种相片的电子邮政软件,便是一个很好的例子。

从这些游戏节目中可以看到,要发展多媒质需要有以下三个条件:(1)要有数字化的音像技术、(2)高质量、(3)系统价格便宜。

其中,作为音像的媒体最好使用CD-ROM。但是,目前的CD-ROM只能记录30秒左右的运动图像信息,所以必须采用图像压缩技术。

在1990年出现的一些压缩算法(逻辑构造)中,几乎不增加硬件负担而且压缩率高的、静止图像用的“JPEG”规格,今后将被广泛使用。

在运动图像压缩方面,最初获得推广的是“D压缩”算法,但它将被图像质量更好的“PLV39”所取代。为了适应压缩算法的革新,英特尔对CPU作了一些改进,使得能够改写视像芯片中的程序。如“i750 B系列”、“Action media2”等都能达到这样要求,而

且具有低价格、高质量、通用性等特点。今后,为了使它们得到实用化,要使其能支持重要的标准。

英特尔公司的运动图像压缩技术,目前还属于第二代,1992年将过渡到第三代。现在英特尔正以自己的图像压缩技术为主,推进DVI事业。有200家公司支持这一工作,其中主要的硬件厂家有IBM、Tandy、NCR等。

索尼的多媒质负责人士井利忠认为多媒质技术在人际交流中的效果和所蕴藏的信息量都是空前的。例如一个人在电视上的演讲,可以只有静止画面和声音,或只配上口形动作,也可以有完全的动作。这三种情况下所需的信息量,同演讲内容用文字表示时的信息量相比,分别为2万倍、5万倍、280万倍。当然,其效果也是完全不同的。

最后一种情况当然感人最深,演讲时目光的含意,讲话结束时的表情等所起的效果,都是其他情况所没有的。这些对电影工作者来说都是很清楚的,而计算机工作者往往不知道该怎样处理。

人的日常谈话,往往是很杂乱的。如果把它写成文字许多是毫无意义的。但是如果写成文章照本宣科,肯定许多人会打瞌睡。这说明“逻辑信息”和“形象信息”之间存在差别。同样的演讲在电视中播放比起单纯播音将更吸引人。

现在在索尼公司内部,在有6000台计算机的网络中,广泛地使用电子邮件。其中最令人难忘的是“面对面”交往方式。这种“面对面”地交往,也就是运用多媒质技术所要达到的目标,希望通过它能起到扣动人的心弦的效果。当然,由于信息量增加了280万倍,需要采用各种压缩技术。

因为使用计算机的是人,而人是有感情的,因此发展下去,所有计算机都要使用多媒质技术。当然,多媒质时代具体是什么样,现在还处于“群盲摸像”众说纷纭的状态。但是不管怎么说,像CDI(飞利浦使用的多媒质系统)和FM-TOWNS(富士通开发的多媒质个人机)都属于这一范畴。不过今后也许都将统一于更生动的“移动小泡(removebubble)”中

应该说,目前还没有能在家庭中普及的便宜的多媒质个人机。索尼现在正准备推出“Quarter L”个人机,它把CD-ROM、XA、MPEG等结合在一起,是种利用多媒质的范例。它把数据压缩到三十分之一,可以使用文档数据的10万倍信息。

由于多媒质涉及到人的感情,发展多媒质事业,除了科技人员外,还需要艺术工作者配合。

日本主要软件公司ASCII的创业者之一塚本庆—郎认为发展多媒质事业首先要发展编辑软件(用以编制多媒质节目的工具)和取景软件(viewer)。取景软件又分两类,一是通过电视监视器直接把电视节目拿过来观赏的消极取景软件,另一是像计算机所做的那样,把各种情景重新编排构成新节目的积极取景炊件。不仅使用于电视监视器,今后从游戏机到电视台都要使用取景软件。到那时候,也许主动式监视器将更有用。

软件在今后将获得更大发展。现在日本多媒质软件的销售额,以个人机游戏软件为主,达到每年360亿日元(接近3亿美元)。由于多媒质化的发展迅速,估计到2000年时可达到28600亿日元(约212亿美元)。谁将开发这种软件、谁将发行这种软件呢?

目前从事这种工作的,有游戏软件公司、书刊出版社、音响唱片公司、录像电影公司等。然而,今后多媒质市场将不是面对大众的大路货,而是针对每个人特殊爱好的有个性的产品,因此需要有崭新的人才加入这一领域。

但是,目前还不具备让新手制作多媒质软件的环境。制作多媒质软件所需要的道具太贵,而且也不容易操作。同时也不容易取得有关资料。为了使新手也能编制多媒质软件,最好设立像“智慧馆”这样的场所,它设有多媒质数据库,可以把以前的信息和数据进行再加工,编制成针对各个人爱好的节目。在这里可以完成只靠个人力量无法完成的工作。

为了多媒质的今后发展,设立这种供大家使用的创作场所,也许是最重要的。

迪斯尼世界软件公司副经理迈尔斯认为他的母公司迪斯尼就是靠制作米老鼠和唐老鸭这样动画片而发家的,靠建立富有特色的游乐园而闻名于世。现在迪斯尼软件公司在编制交互式(对话型)软件上,也正在取得成绩,现在正在编制各种探险软件,它可以同制作录像节目一起进行。但和录像节目不一样,观赏者本人可以作为主人公自由地体验作品世界,就是说它是交互式的人工现实作品。

此外,还提供面向IBM个人机的画图工具“Anima Studio。”这是一种使普通人也能在个人机上容易地制作动画片的软件。在这里,迪斯尼许多著名的形象都被使用。还有供幼儿用的“米老鼠ABC”玩具软件,和供小学生用的“米老鼠游戏”软件等。

多媒质事业是非常令人鼓舞的事业,但要取得成功还要解决许多课题。在这里,可以参考获得迅速发展的电视、音响、电子游戏等得以普及的经验。它们获得成功的共同点有:(1)大量提供软件(节目)、(2)迅速标准化、(3)使消费者很容易明白它有什么好处。也只有做到这些多媒质市场才能迅速扩大。

多媒质产品的用户大致上可分为三类。一是对多媒质抱有希望并理解它的个人机用户,这部分人的数百还比较少。二是电子游戏机类的用户。三是不属于上面两类的用户,这是人数最多的用户群。等到这一类人也都使用多媒质产品时,便是多媒质取得完全成功之日。

要做到这一点需要什么呢?今以迪斯尼的动画片“灰姑娘”为例说明。这一作品所以有魅力,在于故事的情节、人物的个性和举动。这些都是影响观众感情的关键,为了达到有感染力,需要使用最高技术。

过去的迪斯尼世界留下一句格言“要使趣味贯穿于故事的始终”。多媒质软件理所当然地也取决于故事内容,因此必须锤炼“说话”的艺术。

以现有媒质同多媒质比较便可看出多媒质长处。例如某一故事,可以分别制成录像版和游戏版。录像版可以拍得很逼真,但它是完全由制作者创作的作品,游戏版则可受观赏者控制,把自己的感情也往里灌输,这就是多媒质的魅力。

罗加斯阿兹中心(美国经营多媒质的大企业)负责人格洛沙认为罗加斯阿兹中心(LAEC)的基本信条是“不要使任何人对期待感到怀疑和失望”。人要通过实际体验才能树立信心。重要的是给不同的人以不同的体验,多媒质技术就能解决这一问题。

LAEC正和《国家地理》杂志共同编制教学用的地理软件“GTV”,可放映2小时,由1600张照片和200张地图组成,它可以通过实时放映以崭新的方法进行地理教学。它不仅调动了学生学习积极性,还能刺激教师的创造性。

还编制了游览虚拟城市的软件。在这个城市里人人通过对话为了共同目标完成共同的工作。通过游览的体验,给人以愉快的享受。

LAEC的基本目标是“给人愉快”和“高质量”。

在电影方面,有“Teminate-2”这样特殊摄影。它能给观众以过去无法想象的体验。要做到这一点,硬件的开发也很重要。

LAEC对现有的VR(虚拟现实)宣传抱有疑问。VR被说得超过技术上的魅力。它不就是用了“数据工具”、“手套”、“风镜”、“头盔”之类的东西吗?(虚拟现实是人戴上显示头盔后,可以看到计算机软件所给出的虚拟景象,而戴上传感手套的手作不同动作就会呈现不同景象)。

VR的宣传使人对它抱以过大希望,而现在的技术还做不到。原因在于对VR的概念想象超过技术开发速度。

LAEC已能依靠已有技术给人提供新的体验,给人以比他所期待的还要多的体验是最为重要的。