• 2.34 MB
  • 2022-07-27 发布

[初中教育]哈工程-信息检索课件

  • 55页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档由用户上传,淘文库整理发布,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,请立即联系网站客服。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细阅读内容确认后进行付费下载。
  4. 网站客服QQ:403074932
问题反馈人文类图书少、图书陈旧电子阅览室网速慢电子书图书排架问题随书光盘问题占座电梯图书预约\n第一次实习反馈第一题普遍不错,但有个别同学缺乏对材料的整理能力,无用信息太多。第二题期刊数量是变化的,但数量级一般稳定第三题很多同学受到scopus的误导第四题理解上有歧义第五题要求是英文全文数据库,但还是有很多同学列举了很多文摘库、引文库第六题普遍答的不好,很多同学表达了想法、感受、给予评价,带有强烈的主观色彩\n参考答案CNKI之-维普万方之-单库名称中国学术期刊网络出版总库中文期刊数据库数字化期刊收刊数量9317种14556种6744种学科门类文理工农医理工农医理工农医部分人文收录起始年1915年《清华大学学报》(自然科学版)1989年1982年\n三:校园网范围内可以访问到几种电子书数据库,请从收录种数、学科等方面描述它们的异同;四:校园网内可以访问到几种中文期刊数据库,收录年限分别是?在该平台上分别还可以访问到哪些资源?五:校园网范围内可以访问到哪些英文全文数据库,请列举其中8个并说明其所属的公司或学会。六:根据你的了解为图书馆电子资源做个综述。\n信息检索的基本过程前期准备第一步:分析检索课题第二步:选择数据库第三步:确定检索策略第四步:实施检索第五步:获取与利用第六步:管理与评价熟悉图书馆、知识的准备、课题的选择分析课题、明确信息需求及研究范围;提炼关键词试检、确定检索词、编制表达式目录、索引、文摘、全文检索策略调整文献传递科学引用、参考文献管理\n数据库及数据库检索数据库概述数据库的结构数据库的类型数据库的内容与范围检索途径检索标识数据库功能数据库的检索技术检索结果的处理数据库的个性化功能数据库的帮助文件检索方法与策略\n一数据库概述数据库是发展历史最久、影响最广的一种电子信息资源,它产生于20世纪50年代末60年代初,在70年代得到迅速发展,到80年代逐步走向成熟。数据库(Database)是长期储存在计算机内、有组织的、可共享的数据集合。一个数据库就是一个电子仓储。与传统的印刷型文献相比,数据库只不过是充分利用了现代信息技术处处理手段,为知识内容更换了存储介质,并基于数据库的有序结构、专业内容、索引和词表功能等通过检索界面为用户提供更加便捷的信息服务。\n二数据库的结构文档(File)是数据库中数据组织存储的基本形式,是数据和信息有序集合,由若干条记录组成,一个或若干个文档构成一个数据库。记录(Record)是数据库的基本单元,是对某一实体属性进行描述的结果。字段(Field)是记录的基本组成单元,是有关一篇文献或称一条记录的基本数据单元,每一个字段都反映该篇文献的一个方面的信息,组合在一起形成对一篇文献信息的内容特征和外表特征的完整描述。一个数据库可以有一个或多个文档,一个文档由若干条记录构成,而一条记录由若干字段构成。\n三数据库的类型(1)参考数据库(ReferenceDatabase)参考数据库是指包含各种数据、信息或知识的原始来源和属性的数据库,它会引导检索者到另一信息源以获得原文或者其他细节。一般来说,参考数据库主要是针对印刷型出版物开发的。参考数据库主要包括:书目数据库、文摘数据库、索引数据库。书目数据库主要是针对图书进行内容及存储地点的报道与揭示,如馆藏机读目录数据库;文摘和索引数据库则针对期刊论文、会议论文、学位论文等进行内容提炼和属性加工。它提供确定的文献来源信息,供人们查阅和检索,但一般不提供原始文献的馆藏信息。如剑桥科学文摘数据库(CSA)、工程索引数据库(EI)等等。\n(2)全文数据库(Full-TextDatabase)全文数据库是指收录有原始文献全文的数据库。以期刊论文、会议论文、学位论文、研究报告、法律条文和案例、商业信息等为主。\n(3)事实和数值型数据库(Factual/NumericDatabase)事实型数据库是以提供可用的事实为目的的一类数据库。此处的“事实”可以是既有数字又有文字的统计资料,也可以是文字的知识资料或信息资料,也可以是一篇叙述性文献,如:万方数据中的中国企业公司与产品数据库数值型数据库是以数值为主要内容的数据库,除存储各类数值如科学技术数据、社会资源数据、商业经济、地理环境数据外,还存储运算公式、图谱、表格等。如金融、证券系列数据库中的货币兑换、化学物质结构数据库、生物蛋白质序列数据库等,大多属于此类。事实与数值数据库的作用就是提供对特定的事实或数值的检索与利用,直接面向问题以特定的事实或数字回答用户的查询。从某种程度上说,事实及数值数据库的作用大致相当于传统的参考工具书。\n四数据库的内容与范围在选择数据库资源时,需要考虑以下几个问题:(1)数据库的主题范围如果只是一般性了解,可以阅读数据库主页上的简介。如果需要进行具体深入的了解,可以浏览数据库设置的分类列表、主题列表以及刊名列表。(2)数据库的时间范围可以在数据库的时间限定里通过下拉列表来查看。\n(3)数据库的数据类型数据库仅提供文摘还是可以提供全文,提供的内容仅是文本,还是兼有图表、公式等等。(4)数据库的更新频率一般情况下,文摘类数据库更新快,如EI、SCI都是周更新;全文类数据库中,如果是由集成商提供的一般均会滞后,如果是学、协会主办的电子期刊,就会与印刷版同步更新甚至会有网络预印本(电子版先于印刷版发布的称为网络预印本)。\n五检索途径一般包括文献信息的内容特征和外表特征途径。内容特征途径外表特征途径主题途径分类途径代码途径其他途径编号途径机构名称途径责任者途径题名途径\n六检索标识检索标识,即检索词,是指能表达检索课题主题概念和信息需求的名词术语、分类号、名称及代码等的总称,包括主题词、关键词、名称、分类号、分子式、专利号及各种号码等。它与检索途径相对应,是检索途径的具体化。如主题途径的检索标识就是主题词,分类途径的检索标识就是分类号,著者途径的检索标识是著者姓名,其他依此类推。\n弄清什么是检索课题、检索词及字段了解意大利著名作家艾珂的生平及作品艾柯—作者(著者、责任者)字段检索入口检索途径检索词检索标识检索课题\n七数据库功能数据库功能是指数据库在交互界面上提供给用户的基本功能。一般包括浏览与检索两大功能。\n浏览(Browse)浏览是由系统提供一个树状结构的概念等级体系,用户可以沿着这棵树进入不同的分支,到达叶子节点,并在节点看到检索结果列表。浏览功能最重要的作用就是为用户提供一个知识体系,让用户可以俯瞰全貌,了解某一方面的信息总体情况。最常见的分类浏览、期刊导航等都是数据库浏览功能的体现。\n\n检索功能与系统的检索技术紧密结合。常见的的检索功能有:初级检索、高级检索、专家检索、辅助检索、二次检索、组合检索、跨库检索等。\n①初级检索-高级检索-专家检索初级检索(primarysearch)又称为基本检索(basicsearch)、快速检索(quicksearch)、简单检索(simplesearch),初级检索为用户提供一个相对单一的检索界面,帮助非专业或初入门用户方便地提交检索提问。页面上通常只有一个检索词输入框,只能限定在一个字段中,或在系统指定的字段中进行检索,提交检索词后,系统将提问发送到指定的一个或几个字段中进行匹配运算。高级检索的形式与功能与初级检索基本一致,本质并无差别,只是增加了逻辑关系的选择。用户只需要在下拉列表中点选即可实现不同字段之间的组配检索、检索操作更为灵活方便,检索结果更为精确、全面。\n\n专家检索为专业人员设计。仅在检索界面提供一个输入框,需要自行编制检索表达式执行检索。专家检索对检索者的要求较高,检索者需要对数据库的检索规则相对熟悉。\n②辅助检索辅助检索,顾名思义,只是检索的辅助选项,一般可以通过词表、索引和各种检索限定来进行。a.词表检索(thesaurus)按照现代检索语言的发展,目前数据库通用的是叙词语言,基于叙词语言提供词表检索或同义词索引。通过词表,有助于选择数据库索引的规范词,也能提供相关词、上位词、下位词\nb.索引检索(index)索引是一个线性的表单,可以将任何一个字段中的具体概念按字母顺序线性排列起来,不分等级。用户通过检索,可以定位在索引中的任意某个位置,并浏览在这个位置附近的所有内容,进而查询所选内容对应的结果列表。索引的种类很多,如人名索引、出版物索引、地名索引、主题索引、机构索引等\n\nc.限定检索条件(limiter)数据库通常会以菜单的方式将所有限定的内容排列出来,以供检索时进行选择,最常见的检索限定包括出版时间、更新时间、主题范围、文献类型、语种、来源文献范围等等\n③二次检索(RefinedSearch)又称“在结果内检索”在检索结果内进一步检索,使结果更精炼、准确。\n④组合检索(combinedsearch)在一个不间断的检索操作过程中,数据库会自动记录每一次检索所用的策略、时间、检出记录数。用户可以根据需要在此基础上进行合并检索。合并检索时,每一个单独检索所用的限制条件,在合并检索时会同时满足。如下图,先行执行了S1与S2两个检索操作,S3是执行S2与S1的“与”运算。具体操作步骤是在S2执行结束的当前状态下,选中S1前的“添加至检索中”的复选框,点击“合并检索”后的“添加”按钮。需要注意的是,并不是所有的数据库系统都有这项功能。\n\n⑤跨库检索\n八信息检索技术布尔逻辑检索位置算符检索截词检索与词根检索字段检索全文检索其他检索技巧\n例:在维普数据库查找有关UFO的资料概念分析:UFO不明飞行物\n1布尔逻辑检索布尔逻辑检索即运用布尔逻辑算符对检索词进行逻辑组配,表达两个概念之间的逻辑关系。AANDBA*BAORBA+BANOTBA-BABABAB\n课堂练习WTO框架下的中国市场经济WTO中国市场经济对宋词韵律的美学思考宋词韵律美学潜器的文献普查潜器潜水器水下机器人\n在EI中了解一下我校师生发表论文的情况\nEi数据库的位置算符:near/0与onear/0 near/0词间顺序不固定onear/0词间顺利固定Harbinonear/0Engineeringonear/0University\n2位置算符检索位置算符检索即运用位置算符表示两个检索词间的位置邻近关系,又叫邻接检索。这种检索技术通常只出现在西文数据库,在全文检索中应用较多。如果说布尔逻辑算符是表示两个概念之间的逻辑关系的话,位置算符表示的是两个概念在信息中的实际物理位置关系。\n3截词检索(truncation)与词根检索(stemming)用截词符号“?”“*”或“$”加在检索词的前后或中间,以检索一组概念相关或同一词根的词。这种检索技术可以扩大检索范围,提高查全率,主要用于西文数据库检索。中文数据库通常不使用这种技术。\n\n4字段(field)检索字段检索即指定检索词出现的字段,被指定的字段也称检索入口、检索点、检索途径。检索时,系统只对指定字段进行匹配运算,提高了效率和查准率。在数据库中,字段名称通常放置在下拉菜单中。检索字段可以几个字段同时使用,以提高查准率,这种方式通常出现在数据库的复杂检索或高级检索中。\n\n5全文检索全文检索是指直接对原文进行检索,从而更加深入到语言细节中去。它扩展了用户查询的自由度,使用户能对原文的所有内容进行检索,检索更直接、更彻底。全文检索技术通常用于全文数据库和搜索引擎中,使用全文检索可能会提高查全率,但同样也会有很多不相关的信息出现。因此在标引工作做得比较好的数据库中,这种方法是在进行其它字段的检索后,仍无法得到满意的结果时才会使用。\n6其他检索技术嵌套技术(优先算符nesting):即用括号将优先检索的检索式括起来,系统会首先检索括号中的概念。也有检索系统会使用默认布尔逻辑算符顺序或二次检索方式来提供优先运算方式。\n大小写敏感(casesensitive):指西文检索系统中对用户检索式包含的大小写的处理方法。不同的系统处理方式不同。例如:检索词为“Apple”,有些系统严格地按照用户输入的大小写来处理,则检索结果只是“苹果”计算机、“苹果”牛仔裤或其他苹果品牌,这就是大小写敏感。有些系统的检出结果还会包括苹果等植物名称,就是大小写不敏感。\n禁用词表(stopwords):在西文数据库检索中,系统对信息进行标引时,不能做标引词或检索词的语词,包括介词、冠词、代词、连接词、某些形容词或副词等。这部分词语由于使用频率过高,不能反映信息的实际内容,即使用户输入,系统也不会对其进行检索,又称停用词。如aaninfortheshouldshewellonly等。由禁用词构成的词表成为禁用词表,不同检索系统的禁用词表略有不同,要注意查看。\n九数据库的个性化功能注册个人帐户存储检索历史定制个性化服务\n十数据库的帮助文件了解某个数据库的具体使用,详读数据库的帮助文件。\n检索方法与策略\n1信息检索方法概述所谓检索方法,就是制定正确、恰当的检索策略,为检索过程进行指导,目的是为了优化检索过程,提高检索效率,全面、准确、快速、低成本地找到所需信息。检索策略是为实现检索目的而制定的具体检索方案。编制检索策略主要包括检索方式的选择、检索范围的限定、信息资源的取舍、确定检索词以及利用相应检索语言编制检索表达式等环节。对于一个具体的检索过程而言,编制出一个好的检索策略,使其能够确切地反映检索需求,就有可能使检索者以最短的时间和最低的成本获取最满意的检索结果。编制检索策略对检索过程能否顺利进行具有举足轻重的重要影响。\n2信息检索策略的制定与实施分析课题选择数据库确定检索词构造检索表达式确定检索途径对检索策略进行调整实施并输出检索结果\n编制检索表达式检索式(formula、profile、statement)是检索策略的逻辑表达式,是用来表达用户检索提问的,由基于检索概念产生的检索词和各种组配算符构成。检索式的好坏决定着检索质量。组配算符(operator)就是布尔逻辑算符、截词符(通配符)、位置算符、嵌套算符(优先算符)几种。前两种较为常用。利用相应的检索算符将选定的检索词表达并连结起来,构成能够准确反映检索者真实意图的可供计算机执行的检索表达式。\n确定检索途径所谓确定检索途径,就是确定从反映文献特征的哪一个侧面着手进行检索。拟好检索式以后,就要选择检索点(accesspoint),即选择检索途径或检索入口,也称检索字段(field)。常用的检索入口如题名、著者、主题词、关键词、引文、文摘、全文、出版年、ISSN与ISBN、分类号以及一些其他专业用检索点。\n调整检索策略所谓调整检索策略,就是根据反馈的检索结果,反复对检索式进行调整,直至得到满意的结果。对检索数量比较少的结果,可以进行扩检,提高查全率。(1)增加一些检索词(2)调整组配算符(3)使用截词检索(4)取消或放宽一些检索限定(5)增加或修改检索入口对检索结果数量过多的检索结果,考虑进行缩检,提高查准率,具体方法与扩检相反。\n举 例一个研究生在做论文题:“数字图书馆中的元数据体系与互操作研究”,这是一个计算机科学、信息科学方面的课题,请你帮助他在维普数据库中找到最新的参考文献。

相关文档