登陆注册
19084100000078

第78章 医学信息资源的利用(4)

17.4搜索引擎

17.4.1搜索引擎概述

随着网络日益融入人们的日常生活和工作,作为一个信息平台,网络内容不断丰富,整个网络逐渐堆积成一个前所未有的超大型信息库。因此怎样快速有效地从海量数据中找出所需的信息成为一大难题,搜索引擎正是为了解决“信息丰富、知识贫乏”的奇怪现象而出现的技术。网络搜索引擎的问世,为互联网信息资源的有效管理和利用提供了巨大的工具支持。

1)搜索引擎的基本含义

搜索引擎(Search Engines)是基于Web 平台提供网络信息检索服务的工具或系统,它以一定的策略在互联网中搜集、发现信息,对信息进行理解、提取、组织和处理,并为用户提供检索服务,从而起到信息导航的目的。从用户的角度来看,它就是一个帮助人们进行信息检索的工具。

搜索引擎的历史,是与互联网早期的文件检索工具“Archie”息息相关的。搜索引擎的核心是提供网络导航服务,目前它所涉及的主题越来越广,不仅能够提供网站搜索服务,还提供新闻、网页、图片、多媒体、音频、视频、电子邮件地址、在线图书馆以及其他网络资源等服务。

2)搜索引擎的工作原理

搜索引擎是通过自动索引程序广泛搜集网络信息资源,经过一系列的判断、选择、标引、加工、分类、组织等处理后形成供检索用的数据库,创建目录索引,并以Web 页面的形式向用户提供有关的信息资源导航、目录索引及检索界面;用户可以根据自己的信息检索需求,按照该搜索引擎的句法要求,通过检索界面输入想要查找的检索项、提问式;系统检索软件接受用户提交的检索提问后,按照本系统的句法规定对用户输入的字符串、运算符、标识符、空格等进行识别和判断后,代理检索者在数据库中查找,并对检索结果进行评估比较,按与检索结果的相关程度排序后提供给检索者。

3)搜索引擎的类型

(1)按检索内容可分为综合性搜索引擎和专业性搜索引擎

①综合性搜索引擎。它主要以Web 网页和新闻组为搜索对象,不受主题和信息类型的限制,信息覆盖范围大,适用用户广。如Google、百度、雅虎、AltaVista、搜狐、新浪、网易等均属于综合性搜索引擎。近年来,综合性搜索引擎有超大规模发展趋势,如Google 就是一个杰出的代表。

②专业搜索引擎。它是根据学科专业特点,针对某一专门领域或主题将Internet 上信息资源进行搜集、整理而成的搜索引擎,一般经过人工筛选和评价,针对性较强,适用于专业人员查找专业信息。在20世纪90年代中期,人们把数据库技术、Web 技术、传统医学信息组织的有关理论和方法有机地结合起来,以致专门用于搜索网上医学信息资源的医学专业引擎应运而生,如Medical Matrix、Medscape、CliniWeb International、Health Web、Medconnect、Mdchoice 等。

(2)按检索功能可分为全文式搜索引擎、目录索引类搜索引擎①全文式搜索引擎(full‐text search engine)。是指能够对网站的每个网页或网页中的每个单词进行查询的搜索引擎。它们都是通过从互联网上提取的各个网站的信息(以网页文字为主)而建立的数据库中,检索与用户查询条件匹配的相关记录,然后按一定的排列顺序将结果返回给用户。这种方式构成的数据库不需要人工干预,数据库庞大,搜索范围广泛,提供的信息多且全,查全率较高,但查准率偏低,缺乏清晰的层次结构,查询结果中的重复链接也较多。国外具代表性的有Google、Fast/AllTheWeb、AltaVista 等,国内着名的有百度(Baidu)。

②目录索引类搜索引擎(search index/directory)。亦称为Web 目录(Web Directory)或Web 指南(Web Guides),是利用传统的信息分类方式,采用人工干预,将各个网络站点按其内容特征逐级划分为不同主题的类目,最终组成一个树状结构的系统目录;用户检索时,只要点击其树状结构的顶层,即可逐层展开,直到查到所需信息。Yahoo 是其最早的、也是最具代表性的目录式搜索引擎。这种搜索引擎在信息采集、编排、HTML 编码等方面大多由人工编制和维护,以致其数据库收集的网站有限,查全率偏低,但查准率较高。因此有人称之为“专题查询”或“分类查询”,特别适合于那些希望了解某一方面或范围内信息但又没有明确搜索目的的用户使用。

(3)按检索范围划分为独立搜索引擎和元搜索引擎

①独立搜索引擎。也称常规搜索引擎或单一搜索引擎,它仅限在单个搜索引擎建立的数据库中进行信息查询,根据该数据库的内容反馈出相应的检索信息或链接站点,其查询的语言及规则必须符合该数据库的特定要求。如目前常见的Yahoo、Infoseek、Lycos等均属于独立搜索引擎。

②元搜索引擎(metasearch engines):也称集成搜索引擎,它是建立在异地搜索引擎基础上的虚拟智能整体,本身不一定建立网络信息索引数据库。检索时,用户通过统一的检索界面,可同时链接多个或多种独立搜索引擎进行查询,将检索结果作出相关度排序后显示给用户。元搜索引擎对用户输入的检索词有两种处理方式,一种是并行处理,即同时将检索词传送给多个独立搜索引擎进行搜索;另一种是串行处理,即依次将检索词传送给多个独立搜索引擎进行搜索。二者的共同缺点是查询时间长。但近年来,元搜索引擎试图在改进用户界面、扩大搜索范围、消除重复信息等方面的努力越来越受到人们的关注。

典型的元搜索引擎有metasearch、metacrawler、digisearch 等。

17.4.2Internet 常用搜索引擎及其使用

Google(http ://www.google.com)

Google 是由英文单词googol 变化而来,“googol”是美国数学家Edward Kasner 的侄儿Milton Sirotta 创造的一个词,表示1后边带有100个零的巨大数字,隐喻着Google 公司试图征服因特网上无穷无尽信息资料的雄心壮志。Google 由美国Stanford 大学计算机科学系的Larry Page和Sergey Brine 博士于1998年5月创建,以其强大的功能、丰富的资源赢得了越来越多的用户。

Google 是目前世界上最优秀的搜索引擎,每天使用88种语言回答超过2亿个搜索请求,索引的网页超过了30亿。在信息检索中它可以搜索万维网(WWW)上的Web 页、新闻、讨论、产品、图形、声频或视频等资料。其特点是搜索速度很快,同时由于它维护了一个含时间变量的数据库,从而保证所查询的信息是处于最新的状态。

Google 富于创新的搜索技术和典雅的用户界面设计使其从当今的第一代搜索引擎中脱颖而出。Google 主页简洁明晰,检索框上栏设有网站(Web)、图像(Images)、地图(Maps)、新闻(News)以及更多网上论坛(Groups)、视频(Video)、图书(Books)、照片(Photos)、文献(Documents)等选项,便于用户直接按其所需进行检索。

1)关键词检索

(1)基本检索(Google Search):在主页检索框内直接输入检索词后,即可检出所需相关网站,且每个搜索结果都包含从该网页抽出的一段摘要,提供了搜索关键词在网页中的上下文。Google 检索不仅简洁方便,而且严谨细致,可帮助用户找到最重要、最相关的信息。

值得一提的还有Google 的“手气不错”设置,单击该按钮后,系统将检出Google 推荐的最佳相关网站,用户完全看不到其他的搜索结果。使用“手气不错”检索时,系统用于搜索网页的时间较少,而用于检查网页的时间较多。例如,要查找Stanford 大学的主页,只需在搜索字段中输入“Stanford”后,Google 将直接带您进入Stanford 大学的主页:www.

stanford.edu。

(2)高级检索(Advanced Search):Google 高级检索界面设置了10多个选项,读者只需按其显示的菜单提示即可完成检索。其内容包括:

①Find web pages that have 爥:搜索结果限定。

②But don摧t show pages that have 爥:希望排除的字词,相当于使用逻辑not。

③Need more tools :检索中需要选择的工具。

④Date,usage rights,numeric range,and more :检索中的可选工具。

⑤Topic‐specific search engines from Google :特定主题检索。

在Google 搜索关键词的结果页面上,不仅显示查询结果的数量、搜索时间等,还将检索结果按其相关程度顺序显示,包括网站分类目录、网页标题、网络地址、网页摘要及其网页文本的大小,其中被检字串还用红色或醒目的高亮字符显示,以方便阅读。

此外,Google 的一些特殊功能诸如网页快照(Cached)、类似网页(Similar Pages)、查找PDF 文件等也在其结果页面上予以体现。

2)分类检索

Google 的网页目录收录了150多万个网站的网页。这些网页目录以先进的网络搜索技术为基础,由“网页级别”进行技术分析,将查询到的网页依照其重要性程度的不同顺序排列出来。同时,在网页目录内也能享受“Google 搜索”的功能,即可以选择通过Google 的搜索引擎进行语词检索。在主页中点击“more”下的网页目录,即进入分类目录的检索界面。用户在网页目录中通过逐层点击即可查询所需内容。

3)图像检索

要使用图像检索,只需在主页上点击“图像(Images)”按钮,即进入图像检索界面。使用Google 图像检索可以搜索超过3.9亿个图像、照片信息。用户在检索框内输入检索词后回车或点击“Google 搜索”按钮,即可看到以缩略图形式排列的检索结果。单击要查看图片的缩略图,就会看到放大的图像,还可以看到原始图像所在的页面。

图像检索还提供高级检索界面,可对查询页面、图像大小、图像类型、图像颜色及网域等内容进行限定检索。检索结果可采用gif、jpg、pdf 等格式下载,并有相关网页的链接。

同类推荐
  • 中学文科课程资源-诗中酒

    中学文科课程资源-诗中酒

    诗词是阐述心灵的文学艺术,而诗人、词人则需要掌握成熟的艺术技巧,并按照严格韵律要求,用凝练的语言、绵密的章法、充沛的情感以及丰富的意象来高度集中地表现社会生活和人类精神世界。中国诗起源于先秦,鼎盛于唐代。中国词起源于隋唐,流行于宋代。
  • 开阔眼界的战争故事

    开阔眼界的战争故事

    《开阔眼界的战争故事》纵观历史风云,多少战争的故事讲述的不只是死亡、毁灭与武器,讲述的还有人们在突然面临人类最古怪的发明——战争——是怎样做的。
  • 新课程师资培训教程-高中数学优秀课例

    新课程师资培训教程-高中数学优秀课例

    为新课程实施和提高教师专业化水平而精心编写,选取了大量教案,内容上充分体现了知识性和趣味性。接受课改新理念,感受课改新思维,使用课改新教材,至始至终课改给人一种焕然一新的感觉。它是一次革命,一场对话,一座平台,一把迈向成功教育的钥匙。
  • 影响青少年一生的中华典故——英雄故事

    影响青少年一生的中华典故——英雄故事

    中华文明源远流长,历史文化典籍中的典故也是数不胜数。本书编者在先秦到晚清的文化典籍中穿梭往来,精选出数千则典故,并对每则典故的出处、故事、含义、用法进行了详解。为了方便读者查阅,根据含义的异同对这些典故进行了分类,使读者用起来方便快捷、得心应手。一书在手,尽览中国语言文化的博大精深。
  • 学生球类运动学习手册—教你毽球·壁球

    学生球类运动学习手册—教你毽球·壁球

    球类体育运动的起源很早,中国在2300年前,即春秋战国时代,就有了足球运动,当时的足球叫“蹴鞠”,至汉代,蹴鞠运动发展到了鼎盛时期,有了专业足球队、竞赛规则,还设立了裁判员。汉代,我国的踢毽子运动也十分盛行,至清末,参加的人越来越多,人们不仅用踢毽子锻炼身体,而且还把它和书画、下棋、放风筝、养花鸟、唱二黄等相提并论,可见对其的宠爱程度。
热门推荐
  • 琉璃碎朱雀生

    琉璃碎朱雀生

    三年的修真却没有修出一点灵力,难道她真的是个废柴吗?不,她不是。她是即将浴火重生的朱雀,当她再次觉醒,她要叫世人看看。什么才是,真正的强者!
  • 问何是也非也

    问何是也非也

    (你是携绝世神兵走天涯,还是与我相和旷世之音?)猎猎的风吹过去年你我模糊的影子,回忆四散开去,未曾留下半点痕迹。……橘色丛林掩着不为人知的秘密,却还是走漏了风声。风不肯心息,零乱曾经。这世上多少滚烫热情,冷却在无情有思里。一步一血印。还有多少够滴?——前尘遗梦?旧事猎猎的风吹,吹不彻冷夜相别。——凡,我是多么希望,时光能随回忆流转,我们再这样,从头走一遍。赏水天相接、晨暮星月,至花事已了、世界尽头。
  • 豪情水浒

    豪情水浒

    《幻石神游记2·豪情水浒》,女娲用五色石子补天遗漏的一块神石,历经千年沉睡后,化身为21世纪一个时尚、炫酷、睿智的初中二年级光头学生——幻石,他天质聪明,悟性极高,又通神仙法术,将世间的诸多知识汇集到了自己幻化出的一台万能笔记本电脑中。春雨纷纷时节,幻石来到一家古色古香的酒馆,巧遇了中国古典名著的十个作者。带着强烈的好奇心,幻石一一通过名著作者,穿越到了名著中,与书中的人物一同展开了无数搞笑、惊险、正义等探险旅程。原著中的人物命运会因幻石的到来改写吗?幻石进入古典原著中又会有怎么的改变?神游中,又有多少离奇惊险的情节和谜底等待我们去发现?一切尽在精彩的《幻石神游记》
  • 神州破晓

    神州破晓

    神州浩土,当今之世,正邪对立,仙魔互斥。如今天下正道三大领袖门派之首【苍穹至尊】苍云门于梁州布下仙阵,并号令天下修仙者伏击一名正道叛徒,此人名叫陆岳,就连魔道的修魔者也要不惜任何代价追而杀之。陆岳同时被仙魔两道追杀,天下虽大已然没有任何藏身之所。本书的故事便是从陆岳逃亡开始,正与邪的仙魔大战,对与错的矛盾冲突,一曲波澜壮阔的仙灵乐章在神州响起,一段精彩纷呈的侠义传奇正在书写。琳琅满目的灵宝武器,天马行空的心法仙阵,世间罕见的奇珍异兽,你心中的仙与侠,尽在此书中!
  • 高冷酷少拽甜心

    高冷酷少拽甜心

    他是天之骄子,高冷酷帅。她是落魄千金,狼狈不堪。当他遇上她,高冷酷帅还能高冷吗?答案是肯定的——不能在她面前那就是一头狼,一头腹黑到极至的狼。当某女指的他鼻子骂的时候,他说老婆说什么就是什么,简直是三观不存。可是当某女的嘴巴里蹦出另一个人的名字时,某狼马上扑倒,各种无节操无下限。因为某狼的原则:只要她不触碰某狼的底线即使错了也是对了,一切唯老婆命是从。
  • 你还有我,直到永远

    你还有我,直到永远

    就算全世界都将你抛弃,你还有我,直到到达生命的尽头,我也会陪你走到最后。
  • 颠倒鸾凤:君后太嚣张

    颠倒鸾凤:君后太嚣张

    五年前,她遭人暗算却命不该绝,失忆坎坷一波波来袭。待她回忆一切,黑如曜石的双眸意外坚定,红唇勾起嗜血的情怀:敢伤她?自不量力。五年后,她带着两只活宝闯走大街,见到登徒子便徒手袭去,黑丝凌乱刹那唯美。“娘亲,有人喜欢你。”“乖,喜欢娘亲的都是白痴。”追妻晌久的某妻奴幽幽说道:“娘子,儿子他说想要个妹妹。”“你自己生。”
  • 此生有你,足以

    此生有你,足以

    晨光中学的完美校花上官纤雪,在一次意外的情况下,遇到了自己的未婚夫端木泽。端木泽的诡异身世,家庭的争端…………。一系列的意外事件让上官纤雪不知所措。还好,她们,从未放弃过彼此。
  • 中国古代著名作品(世界文学百科)

    中国古代著名作品(世界文学百科)

    本套书系共计24册,包括三大部分。第一部分“文学大师篇”,主要包括中国古代著名作家、中国现代著名作家、世界古代著名作家、亚非现代著名作家、美洲现代著名作家、俄苏现代著名作家、中欧现代著名作家、西欧现代著名作家、南北欧现代著名作家等内容;第二部分“文学作品篇”,主要包括中国古代著名作品、中国现代著名作品、世界古代著名作品、亚非现代著名作品、美洲现代著名作品、俄苏现代著名作品、西欧现代著名作品、中北欧现代著名作品、东南欧现代著名作品等内容;第三部分“文学简史篇”,主要包括中国古代文学简史、中国近代文学简史、中国现代文学简史、世界古代文学简史、世界近代文学简史、世界现代文学简史等内容。
  • 重生之嫡女罂粟

    重生之嫡女罂粟

    当丈夫与庶妹勾搭在一起后,上官妍卿终于明白了,这一切不过是一场骗局。含泪服下毒酒,发誓来生要他们血债血偿。一朝重生,看她如何护亲人周全。昔日拥有圣母心的清纯小百合已无,地狱罂粟粉墨登场!