登陆注册
15796700000025

第25章 计算机和互联网的前沿技术在数字图书馆的应用(1)

(第一节)传统图书馆的自动化技术在数字图书馆的延伸与创新

我国图书馆界专家大多认为,数字图书馆必须有三个技术基础:一是图书馆管理的自动化,二是文献信息的数字化,三是信息传输网络化。这其中图书馆自动化和信息传输网络化也是图书馆管理自动化的主要特征,只不过在自动化阶段程度低,在数字化阶段程度高而已。尽管如本书上一章所述,传统图书馆自动化与数字图书馆存在一些根本区别,但是这种区别并不是本质区别,而是一种发展中的区别,决定图书馆存在与消亡的根本因素是社会政治、经济、科学技术和文化发展的需求。传统图书馆和数字图书馆都以信息的收集、整理、组织加工和传递为核心和主要任务的,尽管由于信息和网络技术的发展和应用,使二者在工作模式和范畴等方面出现诸多差别,但在本质上传统图书馆与数字图书馆存在一种发展的持续性,这些差别恰恰代表了传统图书馆面临各种新技术的挑战,必须适应社会发展的需求,充分应用各种信息技术和网络环境才是进行发展与创新的方向。

从图书馆的整个发展来看,“数字图书馆”与“自动化图书馆”等名词一样,将成为图书馆发展过程中某一个发展阶段的标志。并不是一种图书馆的替代名词或一种新的图书馆类型,它只代表了某些具有转折性影响的新技术应用于图书馆的开始,而当这些新技术成熟和广泛应用普及后,这些名词和概念也将逐步消失。我们现在所理解的“数字图书馆”某些功能和表现形式,也将随着有关信息技术的普及应用而消失。所以,传统图书馆的自动化管理的相关技术,虽然还被自然地带进数字图书馆,但如果不向前延伸和发展,不在新的领域里有所创新,就不能在飞速发展的信息技术革命中有立足之地。

一、Z39.50的发展与变革

Z39.50是信息检索应用服务定义和协议规范的简称,最初由美国国会图书馆等机构开发。1998年以版本1成为美国国家标准,截至2001年已发布了四版。国家标准化组织(ISO)1996年将其采纳为国际标准,定名为ISO23950。

Z39.50起源于图书馆界,最初是针对图书馆机读目录简称(MARC)数据库共享而开发的标准,现在其主要应用领域仍然是图书馆的联机书目检索服务。MARC起源于美国国会图书馆1965年1月提出的“标准机器可读目录记录款式的建议”,1971年MARC格式被确定为美国国家标准;1973年,它被ISO审定为国际标准,即著名的“ISO 2709”。

Z39.50协议具有丰富的语义,良好的互操作性和强大的功能,协议屏蔽了不同的服务提供者的数据库间的异构性,使用户能够以统一的接口查询所有的Z39.50服务器。采Z39.50协议还有一个很重要的优势,就是实现了真正的联机编目,节省了大量的编目时间,提高了编目质量。

Z39.50通过对编码方式和内容语义的标准化来实现不同系统间的互操作。在Z39.50中,协议数据单元都通过ASN.1进行定义,并以基本编码方式(Basic Encoding Rules,BER)进行对ASN.1的序列化。该协议规定了11类信息检索服务功能:初始化、搜索、浏览、检索、删除结果集、访问控制、记帐/资源控制、排序、解释、扩展服务和终止。

Z39.50初衷主要是为了满足检索USMARC格式的书目信息而提出OSI应用层协议;其目的是通过规范查询格式,简化检索过程,实现异构信息系统之间的通信,在图书馆领域有着较为广泛的应用,尤其是一些著名的图书馆都提供基于Z39.50协议的服务。Z39.50标准是一种开放的网络应用协议,支持MARC语法,支持元数据检索,所定义的一些服务具有独立性,通过自我编码和解码及一定的机制,灵活动态地选择和容纳多个检索系统,并发的发出检索请求,将返回的结果进行整合以统一的方式输出给用户。这样,用户通过屏蔽异构信息间的差异来达到资源整合,形成统一的、完全有效的操作范式。这种范式不仅具有商业搜索引擎的高动态更新、即时获取信息等特点,也拥有传统图书情报领域对信息资源高质量的开发和利用的优点,从而实现对Web上的异构数据库进行检索,实现信息资源有效共享和利用。

在2001年国际Z39.50实施小组会议上,有专家提出了以Web服务方式实现Z39.50的一些规范。这些规范的基础是Z39.50和XML,HTTP的Web技术,被称为新一代的Z39.50,又称“基于XML的Z39.50”,其最终目的是通过新标准来整合和检索不同的地域的网络信息资源,使其更容易被数字图书馆的远程查询技术所利用。新的标准在通讯数据编码方面有很大的变化,几乎完全放弃了原Z39.50标准所依据的编码方案,使用可读性强的XML格式文本作为通讯编码格式,简化了编码和编码过程。Z39.50与XML技术的结合,是网络环境下未来数据库通讯技术发展的主流方向。

由此可见,Z39.50在自动化图书馆时期主要是为了检索不同系统软件间MARC格式的文献书目数据,而到了数字化图书馆,是要通过Z39.50和万维网浏览器远程访问书刊的全文数据库,从过去的书目数据检索到全文检索。

二、多媒体信息存贮和检索技术

在前一章提及数字图书馆文献和信息的存贮检索和阅读,不仅仅局限于过去的用眼“视”,而且可用耳“听”,将来甚至可以用鼻子“闻”。要实现这些,需要强大而前沿的技术支撑。

20世纪90年代,国外就有人开始了基于内容的多媒体信息检索方面的研究。过去,人们习惯用概念和词句来查询文献信息,现在可以用视觉(如一幅山水图,可代替一篇散文让读者去品味),听觉(一首歌曲,一部交响乐让人去感受氛围)。所以,计算机通过扫描仪、摄像机、数码像机、话筒在线输入静态或动态(影视)的图像、音频作为查询的样本和条件。

多媒体具有各种视觉和听觉特征以及其他时间和空间关系的特征。对于同一种特征,有不同的表示方法。例如,同样是颜色特征,可以有直方图特征、颜色集、主颜色等多种特征表示法,它们从不同的角度表示媒体的特征,而如何有机地组织这些多种特征,使应用能够调用合适的特征表示来支持查询,并按照用户的查询要求合并各种特征的检索结果,是一个值得研究的问题,综合利用两种和多种媒体的特征,容易达到较高的检索率。典型的例子是检索足球比赛中的进球镜头,如果仅仅利用视频特征,则难度很大,但如果综合考虑到音频特征,检测出观众的欢呼声和解说员兴奋的关键词,就容易准确定位。因此,这里的问题是,如何综合利用多种异构特征支持用户的查询?各种单一特征的查询结果如何融合?如何利用特征之间的互补能力提高检索效率?如何既考虑一般性特征,又考虑特定领域的特征?

综合还意味着采纳其他学科领域的成果,如传统的基于文本的信息检索技术、知识发现、人工智能等领域中的方法,像布尔检索模型、多个异构特征查询表达和检索执行、知识库、分类和聚类算法、用户交互行为的机器学习等。

在学校教育教学中,这种技术尤显重要。课程教材改革后,教师备课授课方式发生了较大变化,用多媒体课件来授课,则是再好不过的现代化教具了。但在制作这些课件时,就需要在数字图书馆查询本馆及网上多媒体信息资源,组合编辑成自己的教学课件。这就要数字图书馆提供大型媒体库和集成检索中超常规数据库的索引能力。这对计算机、网络和交互检索的软件接口提出了极高的要求。由于这些新技术不断地被提出,不断地被攻克,才使得数字图书馆在人们的认识上和实践中,不停地得到发展。我们学校图书馆的人更要学习和了解这些新知识,才能为学校图书馆现代化建设中提供科学的意见和方案。

三、声频、视频传输中的流媒体技术

当图书馆计算机自动化发展到声像资料的借阅播放阶段时,传统图书馆文献收藏和读者服务管理及技术也发生了重大的变化。然而,在传统图书馆自动化管理中的声像阅览,是用磁带和光盘进行自然播放,技术要求相对低,而到了数字图书馆,读者搜索阅读浏览和收听的视频动态图像及声频音乐等,并不是用磁带和光碟在播放器上播放,而是检索和远程访问。从网站的多媒体资源库通过网络传输与适时收视电视台播放的节目不一样,用户不再是被动接收,而是个性化地发出检索要求,到对方多媒体库中边“抓”,边看和边听。视听内容的请求方,只要有所约定的权限或存贮方愿意无偿提供,那么这两端全都是无人管理的自动搜索和自动播放。因此就要用到先进的流媒体技术。

流媒体简单来说就是应用流技术在网络上传输的多媒体文件,使用它,我们可不再象以前那样访问存储在服务器上的媒体文件时,要等到整个文件传输到用户端才能开始播放。它总是将大的文件分成较小的部分,依次发送到客户端。客户端使用的流媒体播放器在接收到一定量的文件数据包后就会开始播放,而不用等接收完全部的数据才开始。这样就能满足媒体播放的实时性,并且流媒体采用了先进的数据缓冲技术,当数据到达媒体播放器后,它会自动在系统缓存中存储一定量的信息数据,然后流媒体器才从缓存中索取数据进行播放。这样一来,即使网络传输偶尔出现问题,只要缓存中还有数据,媒体就能平滑流畅地播放了。流媒体运用了先进的压缩和解压缩技术,数据压缩方式和JPEG格式图像的压缩格式很相似,只在播放时,才是由流媒体释放器进行实时的解压缩。这样可以使声音和视频文件在保证质量的前提下,压缩到很小。通常可以做到WAV和AVI文件的3%~5%,也只有这样才能适用用户的收视和收听甚至放大播放。在学校,数字图书馆的流媒体技术可以直接运用到教育教学中去。用了这项技术,教师在备课时可方便地搜索下载音频画面,还可在进行多媒体教学时,实时地接收搜索到的画面并当场演示,还可以形成网络教学中的师生互动。显示出数字图书馆强大的生命力和活力。

四、依托互联网,实现以OPAC为中心的信息门户技术信息门户(英文为Portal)是目前比较流行的全球互联网(Web)的服务模式。人们对其的了解,首先是“一揽子”即综合解决的界面。本书将在最后二节论及的复合图书馆信息检索平台加以详述,即是此理论的一个实践尝试。其实,信息门户的内涵远不止于此。通过信息门户种种的理论和实践,有专家提出信息门户“五C”(Five c"s)定义,即五个信息门户概念的英文单词的首字母;用户化(又称个性化),Customization;沟通化,communication;商务化,commerce;社会化,community和兼容化,Conatiblity。“五C”中的前四个,强调了信息门户的服务理念,服务范围和深度,最后一个“C”—兼容化,却道出了数字图书馆系统在使用不同平台并检索不同资源库数字信息时,将相关技术与服务实行无缝衍接,为用户创造一个统一完整而又友好界面的美好前景。

OPAC是英文Online public Access Catalog的英文缩写。即联机公用图书馆目录。传统图书馆自动化系统上的OPAC本来仅提供图书馆馆藏书目文献查询。随着Internet网的发展,OPAC的内容不断扩展,许多图书馆的OPAC上增加报刊题录索引等检索工具,有的还增加了全文数据库和特藏资料。目前在我国学校图书馆使用的计算机自动化管理软件中,只有一、两家有真正的联机目录查询,特别是通过Z3950的Server端被别人远程的调用,并融入到数字图书馆的文献及信息检索功能中去。传统的OPAC从提供馆藏查询到网上联机查询,再进一步提供外部的数字资源的链接。OPAC在原来的图书馆自动化管理系统中只是个不起眼的角色,而随着互联网的发展,OPAC已从图书馆计算机自动化系统的边缘产品变成整个系统的核心。因为随着中小学图书馆办馆理念和服务方式的改进,其工作重心已从过去的以收藏为主到流通为主。随着自动化和数字图书馆的出现,又将会从实体文献的流通到传统文献的目录和网络信息资源的查询利用为主。图书馆计算机自动化管理,把Z3950和馆际互借(ISO10161/10161)等标准性协议磨合并改进后带入数字图书馆的门槛,使用户间的远程互操作成为现实。

图书馆的自动化也好,数字图书馆也好,都把越来越多的文献和信息交互检索技术建立在OPAC上,并把“五C”服务作为努力目标。因此而逐步构筑成一个个图书馆的信息“门户”。

我国学校图书馆,大多数都是人少,书少,传统图书馆的服务不到位,一方面,着重抓针对青少年的藏书建设,另一方面,可以面对新信息技术的出现,跨步到利用数字图书馆资源的时代,因为数字图书馆的信息资源,无需人人重复建设,只要合适的检索平台,只要有合法的链接权限,就能利用“信息门户”技术,实现学校教学信息资源的共建共享。

(第二节)基于XML的元数据是数字图书馆资源著录的标准语言

随着科学技术的迅猛发展,人类社会进入了一个网络信息化的时代,大量的电子读物正以几何级数膨胀。尽管印刷型资料仍呈现快速的增长速度,可是据美国微软公司的预测,10年后50%的阅读材料将是电子读物和网络数字信息。那么,图书馆在向网络化数字化方面发展的道路上应该怎样去吸收和利用日臻庞大的信息资源呢?因此,在我国图书馆界,对计算机自动化管理中的前沿技术之一的元数据的需求呼声越来越高。在国外,已经有大量的图书馆用元数据来著录书刊和电子信息,并使元数据成为广大非图书馆专业的网络使用者逐步掌握的著录方式。为此,学校图书馆同志要了解图书馆网络化、数字化,就必须了解元数据这一新型的,以非书文献和网络信息著录为主要对象的著录方式。

同类推荐
  • “洛学”教育思想与教育论著选读

    “洛学”教育思想与教育论著选读

    教师职业化、专业化是当今世界教育改革共同关注的热点和焦点问题之一。教师职业素质素养达到基本要求和提高,是当前教育改革和课程改革的急迫要求。为此,我们组织相关专家重新系统地、较完整地遍选、编译、评注了这套适合中小学教师职业阅读的《中外教育名家名作精读丛书》。每种含教育家的生平、教育事迹、教育成就、教育思想评析和经典教育论著选读及注解解读导读两部分。这对于全面深刻和原原本本地了解学习、运用教育家的思想和著作是十分有益的。
  • 子女思想道德教育

    子女思想道德教育

    党的十六大报告把全面建设小康社会确定为21世纪头20年的奋斗目标。小康社会有其标准,教育是其中重要的标准之一,而扫盲是教育标准的一个重要方面。扫除文盲,提高成人识字率是当今国际社会衡量一个国家社会进步、经济发展和人民生活水平的重要指标,是社会文明程度的标志。
  • 享受思维的盛宴

    享受思维的盛宴

    思维能力是各种能力的核心。思维包括分析、综合、概括、抽象、推理、想象等过程。我们应通过概念的形成、规律的得出、模型的建立、知识的应用等培养思维能力。因此,在学习过程中,不但要学到知识,还要学到科学的思维方法,发展思维能力。
  • 法国中小学教育特色与借鉴

    法国中小学教育特色与借鉴

    本书内容包括:法国中小学教育概述,社会生活中的能力培养——素质教育,自由开放的教育形式,“研究性学习”在法国等。
  • 现代化进程中的中国人文学科

    现代化进程中的中国人文学科

    本书是一部研究中国史学现代化的学术著作。作者将中国史学放在世界现代化运动的背景中加以考察,系统地论述了中国史学现代化的“四段进程”与“三大流派”,论述了史学与经学的关系,东西文化交融与马克思主义史学对中国史学的影响,以及文化经世致用、抑制主义、民族史学的形成与发展等重大问题。全书论点鲜明、脉络清楚,视野独特,集中了华东师范大学人文学院与历史系多位著名教授近年来的研究成果,具有相当的学术价值,不愧为“211工程”国家级的重点科研项目之一。
热门推荐
  • 培养孩子好性格的经典故事(青少年心灵成长直通车)

    培养孩子好性格的经典故事(青少年心灵成长直通车)

    《培养孩子好性格的经典故事》系列从成长中可能遇到的问题出发,内容涵盖了勤奋、坚强、自信、乐观等诸多与孩子健康成长密切相关的方面,人选的故事通俗易懂,道理清晰明了,版式活泼多样,容易激发孩子强烈的阅读兴趣,能够起到极好的教育和熏陶作用,对于提高孩子的文化素养、拓展孩子的知识面大有帮助。好习惯成就好未来,孩子从小养成良好的习惯,成就大事业将不再是遥不可及的梦想。生命需要鼓舞,心灵需要滋润。《国民阅读文库·青少年心灵成长直通车:培养孩子好性格的经典故事》图书的故事极具启蒙意义,可以启迪孩子的心灵,开发孩子的潜能,塑造孩子健康的人格,为孩子健康茁壮成长创造必要的条件。愿孩子们拥有一次快乐的阅读之旅。
  • 启迪学生思考人生的故事全集——健康成长的力量

    启迪学生思考人生的故事全集——健康成长的力量

    人生仿佛是四季的轮回,生命的状态便是这四季的写照。每个人都有属于自己的春、夏、秋、冬,不必为沐浴春风而得意,也不必为置身冬季而叹息,人生中的每一个季节都是我们必经的过程,生命中的每一个时刻都是值得我们珍藏的记忆。
  • 宝贝发飙:误惹极品总裁

    宝贝发飙:误惹极品总裁

    总裁爱上了宝贝妈,这是真的?天才宝宝恶斗极品总裁了开始,新的序幕拉开了!
  • 商铺投资创富手册

    商铺投资创富手册

    本书不是可以亦步亦趋完成投资的工作流程表,而是在深入分析国内商铺投资现状的基础上,对商铺投资的政策和法律、投资种类、投资技术、投资财务和后期经营风险,进行了系统的解析,并提出了应对和防范的措施,以帮助提高投资决策能力,规避风险,实现精明投资,不失为商业房地产投资操作的“金手指”!
  • 超级系统之神级学霸

    超级系统之神级学霸

    什么叫学霸,仅仅是高分吗?当然不是。学霸就是学什么牛什么,超出一切领域。统统都到我的碗里来。谈钱?你竟然和拥有超级系统的学霸谈钱,乙肝疫苗够不够,常态磁悬浮科技够不够,要的就是黑科技,要的就是碾压力!“我注定成为一个传奇!”这是许义醒过来的第一句话。(推荐期间,每天两章哦~~时间应该是早上起床后,晚上睡觉前!)
  • 君恩策

    君恩策

    她一朝穿越竟成了稚子女童。他是当朝最年轻的相爷,一次意外阴差阳错将穿越而来的她认为义女。一见误终身,从此她踏上无尽的执著,是不舍放弃也是不能放弃,他成了她穿越的全部意义。是谁轻声呼唤饱含深情,也再难救赎她那颗冰凉彻骨的心。有人愿为她放弃后宫佳丽三千,有人愿为她出生入死,亦有人孤苦了漫漫一生将偏执坚持到底走不出心魔。而她,最终又该如何抉择,何去何从?本文结局略悲,剧情偏狗血…尽管不客气地喷好了。(又名:幻世花海断肠劫,算是《君赐与》的前传)
  • 猎魂师记

    猎魂师记

    一个以猎魂师为梦想的少年无意之中踏入了江湖错乱,庙堂复杂的世界之中,看这位少年如何力挽狂澜,改变自己,改变这个世界。
  • 五星级爱情

    五星级爱情

    作品以五星级酒店美女总经理顾晟玉的大学时代、创业园地、职场拼杀三段感情历程为主线,以富二代、红三代男生贾璞、大学同学徐亮和同事小高三个不同性格的男主人公的追求展开故事情节,通过豪门恩怨、职场倾轧、校园恋情等生活背景,用唯美的画面和曲折的故事情节,展示了草原风情、都市奢华、浪漫大学时代带给主人公的思考和对美好事物的向往。塑造了主人公美丽、善良、睿智、坚韧、无敌的个性。
  • 极速天神

    极速天神

    一个简单弱小的速度天赋。在刘景手里,却是化作了超强的战斗力,无限分身,以及那永恒的虚拟国度。这是关于极速天神的故事。
  • 都市超级幽默:名人笑话俱乐部

    都市超级幽默:名人笑话俱乐部

    英国作家萨克雷有句名言:“生活是一面镜子,你对它笑,它就对你笑;你对它哭,它也对你哭。”我们许多人总是在推迟我们的快乐——无限期地推迟。只要你打开本书,不论是信手翻阅,还是仔细阅读,你可以马上开心地笑起来。