信息组织辅导课程总复习


    本科《信息组织》课程总复习 第1章 概论 (一)本章学习目标 1.理解信息组织的必要性、信息组织的研究领域; 2.熟练掌握信息组织的常见类型、信息资源处理的基本方法; 3.学会区分信息组织与信息检索、检索系统的资源单元方式和标识单元方式、先组式与后组式、目录、索引、数据库的不同; 3.能运用上述理论方法理解各种信息组织系统与检索工具的组成原理。 (二)本章重点要点 1.信息组织概念及其必要性; 2.信息组织与信息检索的关系(参看图1-1); 3.按标识特征区分的两种基本检索工具类型,按检索途径区分的检索工具类型; 4信息处理的基本方法。 (三)本章练习题 ○名词解释 (1)信息组织:是根据信息检索的需要,对信息资源的内容特征等进行分析、选择、标引、处理,使之成为有序信息集合的过程。 (2)信息检索:是根据一定需要从检索系统中检出相关信息资源的过程。 (3)数据:是经过直接观察获得的关于客观对象的记述,是未经处理的对于事实的表述。 (4)信息:是经过处理的数据或人们交流的知识,是有意义的数据。 (5)目录:是记录、报道与揭示文献的工具,主要有收藏目录与书目。 (6)索引:是揭示文献集合或文献中有检索意义的文献单元或信息内容的查询工具。 (7)检索语言:是由表达信息资源主题概念及其相互关系的词汇和规则组成的人工语言。 ○思考题 1.信息组织与信息检索有什么关系? (1)信息组织是信息检索的基础和前提,只有对信息资源进行处理和有序化信息系统之后,才能准确有效查找相关信息资源;(2)信息检索则是信息组织出发点与归宿,用户的检索需要是组织信息的主要依据。 2.信息组织有哪些职能与作用?(1)信息组织的职能:1)集中和揭示信息资源的内容特征,通过控制和处理信息,提高信息资源的价值; 2)建立信息资源收藏系统和检索工具,便于信息资源的开发与利用; 3)信息组织使用的控制语言及各种规范是一种知识序化结构,是信息组织的语言保障和质量保障。 4)信息组织能够克服现代社会信息的海量性、无序性和污染性,解决它与人们对信息需求的专业性、选择性和及时性的矛盾。 (2)信息组织的作用:1)信息资源组织:资源描述、内容浓缩、提供检索点;2)检索工具组织 3.按照提供的检索途径,信息组织可分为哪些类型? 题名检索工具(系统)、责任者检索工具(系统)、分类检索工具(系统)、主题检索工具(系统)、引文检索工具(系统)等。 4.按照标识特征,检索工具可以分哪两种基本类型? (1)以信息资源的外部特征(形式特征)为检索依据,提供以信息资源形式特征为标识检索途径。常见的信息资源形式特征有责任者名(即作者和与资源形成相关的人或机构,如译者、改编者、修订者等)、题名、机构名、标准书号、专利号、文献登录号(或顺序号)等。 (2)以信息资源的主题内容特征为检索依据,提供从资源内容进行检索的途径,主要有分类法、主题法。 5.简述信息资源处理的基本方法。 (1)信息资源处理是信息组织和揭示的基础,它以处理过的信息记录作为原信息的替代物来组织信息系统; (2)信息处理的基本方法: 1)描述信息资源,以便识别与确认它,主要方法是著录、编写题录和资源形式特征的描述; 2)浓缩信息资源内容,主要方法是编写内容提要或文摘,供用户了解、选择和判断信息资源; 3)提供检索点。主要方法是确定特定资源的标索特征(或标识)与可检信息。信息资源的检索点有代表其内容特征和形式特征的各种标识,如题名、责任者、分类号、主题词或关键词等。 第2章信息组织原理 (一)本章学习目标 1.理解信息组织的基本要求和规范控制的依据; 2.熟练掌握信息组织的控制与规范方法及信息组织的特点; 3.学会信息组织的描述控制、词汇控制、句法控制方法,以及检全率、检准率的计算方法; 3.能运用信息组织控制方法对常见词汇进行规范控制。 (二)本章重点要点 1.信息组织的描述控制、词汇控制、句法控制; 2.概念的内涵与外延、概念之间的关系,概念的限制与概括、分析与综合。 (三)本章练习题 `○名词解释: (1)检全率:是指一次检索中检出的与提问相关的信息资源数量占系统中所有与提问相关的信息资源数量的比例,用公式表示为:检全率=检出的相关信息资源量/系统中相关信息资源总量数×100%。 (2)检准率;是指检出的相关信息资源的数量,占检出的全部信息资源数量的比例。用公式表示为:检准率=检出的相关信息资源数/检出的信息资源总数×100% (3)联系符号:为了防止主题词之间出误组配而使用的揭示同一文献主题之间联系强度的专用符号。 (4)职能符号:是一种表示主题标识在组配中的句法职能而规定的辅助符号。 (5)轮排转换:依次把检索语句中每一个有检索意义的词轮流排列在检索位置上。 (6)引用次序:指复合主题标引或检索时,各个主题因素的组合次序。 ○问答题: 1简述对信息组织的要求。 (1)检全率。是指一次检索中检出的与提问相关的信息资源数量占系统中所有与提问相关的信息资源数量的比例。检全率是衡量检索系统检索能力和检索效率的重要指标; (2)检准率。是指检出的相关信息资源的数量,占检出的全部信息资源数量的比例。检准率是衡量检索系统排除与提问无关的的信息的能力,较高的检准率可以节省用户时间,提高系统效率。 (3)检索速度和系统的及时性。检索速度是指用户从实施检索到得到结果化费的时间,它是衡量系统检索速度与使用效果的重要参数。它与系统响应检索的能力、检全率、检准率、资源组织的全理性等因素有关。系统的及时性是指检索工具处理信息和提供信息所用时间较短,能快速纳入、处理和提供信息。 (4)系统易用性。是指标引人员使用检索系统描述、标引资源是否方便和易用;用户使用系统的简易性、方便性与获取信息的容易程度。系统易用性是系统性能的主要因素,决定系统设计改进和发展方向。 (5)检索的成本效益。是指检索系统的成本和效益之比。检索成本包括系统设备费、标引处理费、检索运行费;检索效益指检索系统创造经济效益和社会效益。好的检索系统是低成本高效益的系统。 2简述信息资源组织中的规范控制应包括哪些方面? (1)描述控制:即对描述记录的内容、描述方进行的控制。包括描述项目、描述文字、描述级别、描述格式的控制;(2)词汇控制:即根据标引和检索的需要,对自然语言中的的词汇进行优选、规范、揭示相关性的过程。主要方法有同义控制、词义控制、词间关系控制;(3)句法控制:即根据信息资源标引和检索需要,按一定的组词造句规则对检索语句的组合方式作出的规定。常用的句法措施有确定引用次序、使用辅助符号、以及句式转换(轮排转换、链式转换、分析转换) 3词汇控制的范围是什么? (1)词汇控制:即根据标引和检索的需要,对自然语言中的的词汇进行优选、规范、揭示相关性的过程。 (2)词汇控制的主要措施包括: 1)同义控制,是对字面形式不同而含义相同的词进行控制,使检索系统中一个概念只有一个词语表达。包括对同义词、准同义词及部分专指词与泛指词进行的控制。同义控制常用的方法是在几个词中选取一个作为规范词,在规范词和非规范词之间建立用代参照,便于用户从非规范词找到规范词。同义控制的作用是可以克服一义多词的自然语言现象,把相同内容或特征的信息资源集中在一起。 2)词义控制,是对同形异义词和语义含糊的词进行控制,使词义明确,一个词语只表示一个概念,以控制一词多义现象。词义控制常用的方法是在词后加限义词,在词下增加含义注释和范围注释。 3)词间关系控制,是揭示词汇之间的等级、等同、相关关系,使之成为语义相关的系统。在主题法中词间关系控制采用设置参照、倒置标题、主标题-副标题以及编制词汇索引系统,如词族索引、范畴索引、轮排索引等。分类语言主要通过类目体系显示词语间的从属、并列、相关关系,用类目参照显示语词概念的横向联系。 (3)词汇控制还应包括词量控制、词组选择与使用控制、词汇专指度控制等。 4句法控制的方法主要有哪些? 句法控制是根据信息资源标引和检索的需要,按照一定的组词造句规则,对检索词的组合方式做出的规定。常见的句法措施有确定引用次序、使用辅助符号和句式转换。 (1)引用次序,是指复合主题标引和检索时,各个主题因素的组合次序。在分类法中引用次序是指类目划分标准使用的先后次序或各主题分面在组配时的先后次序;在主题法中是指字顺检索系统中主标题与各级子标题组合的次序。 (2)辅助符号,是揭示主题概念之间的关系意义、进行检索操作的符号。常见的有: 1)关系符号,是一种用于揭示词语组配中形成的关系类型的符号,通过对组配中关系类型的表达,对标引词进行控制,说明组配性质并有一定的排序功能。 2)联系符号,是一种揭示同一文献主题之间联系强度的符号,可以防止主题词之间出现误组配。 3)职能符号,是一种表示主题标识在组配中的句法职能的符号,可以明确一个标识串(句子)中各主题因素的施动-受动作用,明确法含义,提高检准率。 (3)句式转换,是为了使检索句子各个有意义的词素能成为检索入口字,通过对语句中词语位置的变动来增加检索点。常见的有: 1)轮排转换,将检索语句中每个有意义的词依次排在检索入口,其他词在保持相对位置的情况下移动。 2)链式转换,以逐次折卸句子链环的方法,将每个有检索意义的的词语依次排在检索入口。 3)分析转换,在一个检索词句中,每次抽取少量的词组配成标题,依次把每个有检索意义的词排在检索位置上。 5阐述文献保证原则和用户保证原则。 (1)标识的数量以及类目的级别应考虑信息源的采集与收藏情况,并与信息源的数量呈正比。 (2)安排类目的次序也要考虑信息源的实际情况,如文献多的类目排在文献少的类目之前。 n实施该原则的前提是必须了解文献源以及文献主题的数量情况,为此,可以采用文献调查、词汇收集、标引频率统计等手段。 n(3)在选择分类标准及其引用次序,确定类目的专指度,安排标识的排列次序等方面考虑用户的使用特点。 第3章信息描述 (一)本章学习目标 1.理解信息描述概念、意义与作用,以及信息描述的规范、HTML、XML的基本格式和DTD和RDF的基本概念; 2.熟练掌握基本描述项目、检索点、计算机编码中的MARC格式和DC格式; 3.学会文献描述的基本项目和计算机编码的基本方法; 4.能运用《文献著录总则》格式描述一般文献,能运用简单的HTML格式描述文件。 (二)本章重点要点 1.信息描述基本项目、描述级次; 2.检索点的选择与参照法,名称规范档的控制方法; 3.HTML、XML、DTD、RDF的格式 (三)本章练习题 ○名词解释: 1.DC:是都柏林元素集的简称,1995年3月在美国小镇都柏林创建的元数据描述方法。 2.ISBD是《国际标准书目著录》的英文缩写,由国际图联(IFLA)1969年制定的供各类信息资源描述用的国际标准。 3.XML是可扩展标记语言的简称,是W3C倡议的、在SGML基础上发展起来的新一代计算机标记语言。 4.MARC是机读编目格式的简称,是根据文献特点和信息交换需要设立的标准计算机可读文档格式。 5.DTD是文件类型定义的简称,原是SGML的重要组成部分,后来成为W3C 的XML1。0一部分。 6.RDF是资源描述框架的简称,是W3C在1999年颁布的一个建议,它用资源-属性-属性值来定义一个资源的基本描述框架。 7.名称规范档是对描述记录中的名称标目(人名、机构名和资源名)进行规控制的工具。 8.检索点是指检索信息资源使用的题名、责任者、分类号、主题词等供检索使用的各种数据。 (二)问答题: 1 什么是元数据,其作用是什么? (1)元数据是关于数据的数据,或关于数据结构化的数据。信息描述记录就是元数据结构化描述的结果。 (2)元数据(或信息描述)的作用就是以元数据为中介,对信息资源的各元素进行修改、组织或检索等各种操作,包括: 1)识别。通过个别化描述和确认,让用户可以识别该被组织的资源; 2)定位。提供资源的位置信息,便于用户访问该资源或其相关资源。常见的定位方法有:资源顺序号、数据库中的位置、网络地址或其他链接地址。 3)检索。通过描述数据组织检索工具、向用户提供检索点或检索途径,在网络或电子检索系统中,可以通过词语匹配等检索技术实现多种特征的检索。 4)选择。用户可以通过描述记录中的各种特征,判罪资源价值,确定是否需要。 2.简述我国《文献著录总则》和《DC》的基本著录项目。 (1)《文献著录总则》规定的基本项目有9个:题名和责任者项,版本项,文献特殊细节项,出版发行项,载体形态项,丛编项,附注项,文献标准编号及有关记载项,提要项; (2)DC将一般文件的描述项目分为15大项:题名,作者或创作者,主题和关键词,描述,出版者,其他参与者,日期,资源类型,格式,资源标识,来源,语言,关联,覆盖范围,权限管理。 3 简述题名检索点和个人责任者检索点的选择方法。 (1)题名检索点的选择方法: 1)正题名可以直接选作标目,交替题名也可选作标目; 2)适当选择有检索意义的副题名和附注项中的合辑题名作标目; 3)并列题名一般不选作标目; 4)一种资源的题名检点数量要控制在二个以下。 (2)个人责任者检索点的选择方法是: 1)一资源的唯一责任者、二人合著的责任者均可选作标目,但三人以一的合作者只能以第一责任者为标目; 2)其他责任者(注者、译者、编译者、校点者、整理者、绘图者、摄影者等)如有需要也可选作标目; 3)附注项著录的责任者和其他有关责任者一般不作标目,必要时著名学者和著名著作的责任者可以选作标目; 4)以书名命名的编写组和无检索价值的临时写作团体不作标目; 5)丛书综合著录时,综合款目的标目责任者的选择与单书相同;丛书分散著录时,单书作者可作为责任者按单书检索点的选择原则处理;如丛书编者为出版社则不编编制综合款目;分析款目的责任者如果不同于原书责任者,则作为分析款目的责任者标目; 4.什么是参照法?它有哪些类型? (1)参照法是一种指引使用者从一个标目去查找另一个标目的方法,它可以加强检索系统中相关资源的联系,或者说明检索系统的编制和利用方法。 (2)参照法一般分为三种类型: 1)单纯参照(直接参照),是从不用作标目的标识去查找用作标目的标识的参照。它的基本形式为:×××(非正式标目) 见 ×××(正式标目),单纯参照可以增加检索入口,规范题名中的别名简名和人名中的笔名、别名等检索标目; 2)相关参照(兼互参照):是从一个使用的标目参见一个或几个相关使用标目的参照方法。它的基本形式为:×××(正式标目) 参见 ×××(另一正式标目)。相关参照的作用是:可以揭示检索点之间的联系,指引使用者从一个检索对象去查找更多的相关检索对象,从而建立起检索标目与相关标目的联系,可以扩大或缩小检索范围。 3)一般参照(普通参照)是对检索工具某些编制事项的说明,介绍用户掌握检索系统的使用方法。 5 简述编制名称规范档的过程。 名称规范档是对描述记录中的名称标目(人名、机构名和资源名)进行规控制的工具。规范文档编制是长期积累的起来的,一般的编制过程是:一件资源描述后,选定一个名称为正式标目,并把该选定名称的不同形式和与它相关的标目(名称),通过名称范档或参照款目联系起来(即引向这个名称)。 6.名称规范档一般由哪些款目构成?规范控制的方法 (1)名称规范档通常由规范款目、参照款目、说明款目三种类型组成; (2)常用的规范控制方法有: 1)编制规范款目。规范款目是检索工具中使用的统一标目及其有关参照的完整记录,它由七个著录项目组成(见43页样例); 2)编制参照款目。参照款目是在检索系统中引导用户从非规范标目查找相应的规范标目,或从一个规范标目查找另一个相关规范标目的一种款目。它有三个著录项目(见43页样例); 3)编制说明款目。说明款目是关于规范档标目选择方法、目录使用方法、组织原则等编制规范的说明(见44页样例)。 7.简述CNMARC格式的结构组成。 (1)CNMARC是中国机读编目格式的简称,是根据文献特点和信息交换需要设立的标准计算机可读文档格式。 (2)CNMARC生成的书目基本结构由四部分组成: 1)记录头标区:是关记录类型、目录级别、记录完整程度的数据,字符数24个; 2)地址目次区:由计算机自动生成的数据字段区有关情况的记录,记录每个字段长度、起始位置等; 3)数据字段区:记录文献各种数据,包括编目数据、主题数据、分类数据等,是MARC格式书目的主体。该区数据由人工输入,由十个功能块组成。 4)数据字段区内的每个字段由字段标识符、子字段 标识符、指示符、分隔符组成。 字段标识符由区分不同字段的三位数字组成,相同功能块的字段具人相同的首字符;子字段标识符由两个字符组成,首字符由国际标准通用的专用符号“$”组成,第二个字符为字母或数字;指示符由两位数字或字母组成,表示某些数据的操作信息,未定义指示符用空格表示;分隔符用来分隔不同的数据集合,有字段分隔符“*”,表示一个字段结束,记录分隔符“#”,表示一条记录结束。 第4章信息描述工作 (一)本章学习目标 1.理解信息描述工作的要求、程序以及联机编目中CORE系统的功能、元数据创建方式、信息描述工作流程; 2.熟练掌握信息描述的类型(或方式)、题名、责任者、出版项等的描述方法; 3.学会用CNMARC与DC各个字段与元素间互换描述简单的文献或其他资源; 4.能运用CORE、CNMARK与DC结合描述简单的文献或其他资源。 (二)本章重点要点 1.信息描述工作程序; 2.信息描述中各个基本项目的描述方法; (三)本章练习题 一 名词解释: 1.CORC 是OCLC的协作联机资源编目的简称,是以网络资源为对象的联机资源编目系统。 2.联机编目是在联机状态下进行编目操作、提供编目数据、建立联机检索工具并提供各种信息描述产品的信息描述活动。 3.集中编目是由中心编目机构进行编目,向其他合作机构提供编目数据的编目方法 4.共享编目是由多个编目机构共同进行编目活动,各参与机构共同协作并分享(即利用)编目成果的编目形式。 二 问答题: 1 简述信息描述工作的要求。 (1)信息描述工作要保证元数据创建的质量,客观反映信息资源的特征,严格按元数据规范操作;做到: 准确。信息资源的描述应真实反映信息资源的特征,记录数据必须来源于记录对象,能为用户提供可资判断的客观数据; 规范。信息资源的描述应严格遵守相应的描述规范,尽可依照规范文档的格式或控制词表提供规定; 完备。即描述项目必较完备,可以从各种特征对数据进行检索操作。 2 简述信息描述工作的程序。 (1)查重 查核系统,确定要处理的信息资源是否已收入系统。其作用避免重复劳动,保证资源描述和标引的一致性。 *使用工具是工作目录、编目数据库,查核时按题目名、责任者、统一书号(如ISBN)检查,网络资源可使用URI。 *如系统已收入,采用原来的描术结果输入系统; *如文献是原资源的不同版本或网页已更新,在原来描术的基础上增补调整后输入系统; 如是新资源,则重新描述与标引后输入系统。 (2)描述 按新资源(系统中没有的)的不同特点,根据描述规范加以处理。 *描述工作程序应严格按著录标准和标引工具的规定进行; *描述工作可以参考被描述文献的CIP数据,网络资源按DC或其它规范描述,可以采用复制、修改、调整等方式使用已有的电子资源描述记录。 (3)标引 在对资源进行主题分析的基础上,依据一定的类表词表和标引规范对资源赋予标识的工作。 (4)复核 检查描述和标引是否符合要求,按系统要求对文献进行必要的处理后再将描述结果输入系统。 复核内容有:描述项目的准确性和完备性,标引结果与系统要求的相符性等。 *手检工具要对标目进行加工,编制参照等,机检系统通常要建立标引数据的临时库,复核后才能输入系统。 3 简述题名项、责任者项的描述方法。 (1)题名一般有正题名、并列题名、副题名及说明题名等类型,这些类型题名的描述方法是: 1)正题名有单纯题名、交替题名、合订题名等,单纯题名是题名前后无任何附加文字的单一题名,可以直接著录(即作为标目);交替题名是一个文献有两个或两个以上的名称,可以直接作为正题名的一部分著录,两题名中间以“又名”连接;合订题名又称合辑题名、集合题名,是指书名页上有两个或多个题名,可以按照不同情况加以处理:①两个题名为同一作者所作而构成的合订题名,则两题名可以连续著录,中间以“;”号隔开;②两题名为两个作者所作而构成的合订题名,则先著录第一个题目名和作者,再著录第二个题名和作者,中间以“·”号隔开;③如合订题名由三个或三个以上的篇名组成,则只著录第一题名与责任者,其他题名和责任者在附注项著录。 2)并列题名又称对照题名、平行题名,是指在书名页上与正题名语种不同的题名。并列题名著录在正题名之后,以“=”连接。 3)副题名是解释、说明题名的文字或从属于正题名的题名,著录时应在正题名之后用“:”号为标识。 (2)责任者项由责任者和责任方式组成,责任者是对资源创建负有责任的个人或团体,通常分为个人和团体责任者;责任方式是指对资源创建所作的贡献类型,传统责任方式有著、编、改编、译注等。 责任者的一般描述方法是: 1)传统著录方式中,清以前各代的责任者应记录朝代,外国责任者要记录国别; 2)单一责任者以该责任者为标目;两个责任者可以同时选为标目,在第二责任者前加“,”为标记;个以上的责任者只著录第一责任者; 3)当资源有多个责任者时,要区分主要责任者和其他责任者;处理主要责任者(可以有多个)和其他责任者的一般原则是:翻译作品、注释作品、汇编作品以原著者为第一责任者,既有主编又有编辑者的作品以主编为第一责任者;法律法规以制订者为第一责任者;音乐作品以词作者为第一责任者,但无词的曲谱以曲作者为第一责任者。 第5章分类法 (一)本章学习目标 1.理解分类和信息资源分类的特征、分类法的类型、及特点; 2.熟练掌握类目体系、标记符号、类目体系的内容,以及网络分类法与传统分类法的不同特点和类目组织、揭示形式的变化; 3.学会区分不同类型的分类法及其结构; 4.能运用上述理论对《中国图书馆图书分类法》(简称《中图法》,英文缩写CLC)结构、标记符号进行分析。 (二)本章重点要点 1.分类法类目体系与标记符号和引用次序的重要作用; 2.同类类目排列的方法、类目关系的处理; 3.网络分类法与与传统分类法相比的主要特点和揭示形式的变化 (三)本章练习题 一 名词解释: 1.分类:是指按照事物的属性或特征进行区分和类聚, 并将区分结果按定次序予以组织的活动。 2.信息资源分类:是从主题内容角度组织和揭示信息 资源的方法。 3.等级体系分类法:是一种将所有类目组织成一个等级系统,并采用列举方式编制的分类法。 4.分面分类法:是一种按照分析兼综合原则编制的分类法。 5.标记符号:是分类法中标记类目的次序、关系和位置的符号。 6.交替类目:是分类法在一个知识门类设置使用类目,同时在相应门类下设置供选择使用的类目。 7.相关索引:是一种不仅可以从主题名称出发查找对应的类目,而且可以将被分类体系分散的该主题各方面的类目加以集中的工具。 8.层累制:是按照类目相应的等级配置相应位数的号码,类号可以反映类目次序和等级的标记制度。 二 问答题: 1 一部完整的分类法应有哪几部分组成? 按照分类法各部分的功能,可以将分类法分为类目体系、标记符号、说明和注释及类目索引四个部分。 2 分类标记的要求、种类和标记制度类型有哪些? (1)分类标记号码的要求是:简明性,即号码要简短明确、顺序性强、易读易记、排检方便,实用性强;号码达到简明性要求的主要方法是:使用有固定次序的单一符号系统可使号码便于排检,选择基数较大的符号系统可使号码简短,均衡配置号码,适度降低类目划分层次,采用全面或局部放弃号码的表达性(即等级等);表达性,即号码能反映类目的排列次序和结构特点;容纳性,是符号系统能满足根据需要对类目体系进行增补变动及时配给相应号码的能力;助记性,即类表中同一含义的主题配置相同的号码,便于记忆; (2)分类法标记符号的种类主要有单纯号码和混合号码两种。单纯号码是只用一种具有固定次序的符号系统,通常有单纯数字或单纯字母两种;混合号码是指使用两种或两种以上具有固定次序的符号系统构成的号码,一般由数字和字母结合编号。 (3)标记制度的类型一般有顺序标记制、层累标记制、顺序-层累标记制和分面标记制等类型; 顺序标记制按照类目在分类体系中的次序配置号码,类号不揭示类目等级或其他关系,只表示类目的次序的编号方法;层累标记制按照类目划分等级配置相应位数号码,类号可以反映类目次序和等级的标记方法; 顺序-层累标记制:是将层累制与顺序制结合起来的一种标记制度,它吸取层累制与顺序制的优点,使符号具有一定的简明性、容纳性和表达性;分面标记制以特定的符号或组配方式表示各个主题因素所属的分面,使号码不仅能够揭指类目的次序和等级,而且能够显类目的分面结构。 3 引用次序在分类体系建立中有什么作用?分类法 对横向关系的处理采用了哪些方式? (1)引用次序在分类体系建立的作用是: 1)决定着类目体系的展开方式与类目体系的结构,可以直接影响分类体系的性能; 2)引用次序决定选择何种标准建立体系及其先后次序,因而决定着按什么方式集中信息资源; 3)决定着为用户提供何种检索途径,它与分类法的适用性有着密切关系。 因此,应优先选择某一学科、事物的主要属性或具有检索意义的属性作为分类标准。 (2)分类法对横向关系的处理的主要方法是: 1)设置交替类目,使之充分揭示类目之间的联系,保持学科的完整性,又能相对集中同一学科的资源。这种方法解决了类目体系单线序列和事物多向从属的矛盾,可以体现多重从属的事物的联系,便于工作于从不同角度查找类目,使分类法具有按实际需要选项择使用的灵活性; 2)建立参照,指明类目之间除从属、并列交替之外其他联系,参照方法使内容之间有密切联系并被分散的类目揭示出来,加强这些类目之间的联系; 3)设置选择类目,即在主题内容按不同方式处理时,指明可供选项技的不同处理办法供选择使用,这种方法有助于根据需要灵活以灵活方式组织相关资源,增加分类体秒的灵活性; 4)设置选择性类表,即根据不同用户的需要,为一主题或学科领域同时编制不同的类表供选择使用,这种方法有助于增加类目体系的灵活性和适用性; 5)规定类目的归属,即根据需要规定某些主题内容的处理规律或原则,有利于以统一的方法组织信息资源。 4 文献分类法类目之间有哪些关系,它们的表现有哪些? (1)类目之间的关系主要有:从属关系,即类目体系中一个类与其直接区分出来的子类之间的关系;并列关系,是类目体系中同位类之间构成的关系;交替关系,是指交替类目与相应的使用类目之间形成的关系;相关关系,是指类目之间除从属、并列、交替等关系之外其他联系; (2)上述关系在类目体系中体现为:从属、并列关系是类目体系的主要关系,揭示类目之间的纵向联系,类目从属关系以上位类、下位类表现出来,类目并列关系以同位类表现出来;类目交替关系、类目相关关系是类目体系主要关系的补充,揭示了类目之间的横向联系;在类目体系中,交替关系以交替类目与使用类目体现出同一关系主题内容的资源的可选择性;相关关系以类目参照体现类目之间的交叉等联系。 5 网络分类工具与传统分类法有哪些不同?在类目组织和揭示形式上有哪些变化? (1)网络分类工具与传统分类法的不同表现在: 1)揭示角度不同。网络分类法改变了传统分类法以学科为中心建立体系的方法,以主题为中心或者以主题结合学科的方式组织体系; 2)类目设置的特点不同。网络分类法改变了传统分类法以资源和用户情况设置类目、重视类目设置的逻辑性、系统性的方式,在类目设置中体现网络资源形式的类目,简化了类目等级,类目设置的概括性、实用性强; 3)类目体系展开的形式不同。网络分类法改变了传统分类法主要采用线性序列的类目体系,采用超文本链接横向揭示资源,类目体系采用多维结构,多角度设置类目、展开体系,用网状结构代替了传统的线性结构; 4)同位类排列不同。网络分类法改变了传统分类法按类目关系排列同位类的方法,按字顺排列类目; 5)适用特点不同。网络分类法与传统分类法相比,更重视类目体系的普遍普适用性,重视普通用户的信息需求,以普通人的日常生活需求为中心展开类目体系;在资源选择、类目排列、类名选择上体现终端、用户的使用需要,在多维结构、横向关系揭示上体现方便用户需求的易用性。 (2)在类目组织和揭示形式上,网络分类法的主要变化是: 1)网络分类法改进主题之间多维关系的揭示,采用超文本链接使类目之间的多维联系以网状结构显示出来; 2)从多个角度组织信息资源,利用链接,从不同属性、角度设置类目,使用户可以从不同角度查找同一事物; 3)采用多表列类(轮排),网络分类法改变了传统分类法固定引用次序的方式,有选择地同时建立多个不同引用次序的类目体系,可以提供多个检索入口,使分类体系具有不同的功能; 4)设置镜象类目,对某些重点类目或热点类目突出反映,使分类法具有较强的适用性和灵活性; 5)动态组织分类体系,包括动态设置类目和动态揭示类间关系,使由某些原因临时显得重要的类目提前设类或根据动态情况对某些热点关系类间的显示,提高了类目的动态性、灵活性和实用性; 6)用于联结不同的检索系统。使用超文本技术,可以通过类目与相关系统中的相应术语的链接,实现类目索引、标题表、叙词表、自然语言系统及其他分类系统等之间兼容互换,这种联结可以增加各种系统的联系,增加检索入口,提高分类系统的使用效率,主题词和类目的对应还可以为分类自动标引提供基本工具; 7)联结说明与规则系统,通过链接,把分类体系与相关的说明文字联结,为分类标引提供方便的标引工具。 第6章数字图书馆的信息组织 第6章 数字图书馆信息组织 一、本章学习目标 1.理解数字图书馆的基本概念; 2.熟悉数字图书馆的基本体系结构与技术体系结构,及各组成部分的作用; 3.熟悉数字图书馆的基本技术方法。 二、本章重点要点 1.数字图书馆的基本体系结构、技术体系结构及各组成部分的作用; 2.数字图书馆的基本技术方法 三、本章练习题 (一)名词解释 1 数字图书馆 2 数字对象 3 数据集市 4 数据提取 5 非结构化数据库技术 (二)思考题 1 数字图书馆有哪些特征? 2 数字图书馆的资源组织有何特点?为什么? 3 结合数字图书馆的基本结构图,说明各部分的作用。 三、本章练习题 (一)名词解释 1 数字图书馆:数字图书馆(Digital Library DL)是采用现代信息技术的、超大规模的、分布的、可以跨库检索的数字信息资源系统。 2 数字对象:是组织管理数字信息的方式、构成计算机存储与处理数字信息及功能实现所需要的完整数据结构。 3 数据集市(Data Market):是面向主题(部门)的、在逻辑上或物理上划分出来的数据仓库中的数据子集 4 数据提取(Data Extraction):数据库仓库按分析的主题来组织数据,只提取系统分析必要的那部分按主题组织需要的数据。 5 非结构化数据库技术:是能够存储和管理形式多样的非结构化数据的技术,它把结构化与非结构化数据都作为资源来进行管理。 6.数据清洗(Data Cleaning):就是将错误的、不一致的数据送入数据仓库前予以更正可删除。 (二)思考题 1 数字图书馆有哪些特征? 答:数字图书馆的特征是: ①数字化:数字图书馆是一个内容丰富的、组织化的、多媒体形式的数字化系统,它的资源、工作过程和服务提供都是数字化的,它集中了不同载体、不同地理位置的资源,以数字化存储、以网络实现连接和共享,本质上是一个数字化、网络化的信息空间。 ②网络化:数字图书馆是以网络为依托、以资源共享为目标的数字化系统、设计时重视网络功能的需求与实现。通常在网络环境中具备浏览器的浏览与检索功能、广泛采用Z39.50标准、网上的各种应用协议、通信协议、数据交换标准、数据传输、编码和压缩,使它真正成 为各种网络技术和标准的集成系统。 ③分布式系统:采用关系数据库管理系统,结构上采用分布式数据访问和数据库连接;支持开放式应用开发与多语种利用;支持规范控制、规范记录;系统集成化程度高。 ③ 海量资源和分布式资源存储结构:数字图书馆处理的数据是海量的,估计一般的资源量可达到1012~15字节,它的资源包括持续倍增的网络资源,也包括不断增长的数字化的传统资源。 海量资源使数据存储必须以大量的分布式数据库群把资源存放在不同的计算机上,每个计算机负责特定资源的收集、加工、存储、利用和维护工作; ④按用户需求提供服务(最好是交互式的自动界面): 用户通过数字图书馆的交互界面提出服务请求,数字图书馆使用高效的检索系统,为用户提供迅速、准确、个性化的服务。 2 数字图书馆的资源组织有何特点?为什么? 答:数字图书馆信息组织的特点是: ①以用户为中心组织信息资源: 数字图书馆为每位用户提供个性化的信息服务,针对每个用户的每个需求从海量资源中查找符合用户需求的资源,而且它提供的资源不是一般的单一资源,而是关于某种问题的知识点;②信息资源加工处理自动化:数字图书馆的信息资源描述、自动分类、自动聚类、元数据自动抽取等对资源进行加工处理应尽可能自动化。 ③智能查询服务:数字图书馆的海量信息资源要求提供高效的智能检索服务,如设计良好的数字图书馆既能满足对图形、图象、视频的关键词、主题词查询,而且能够通过颜色、纹理、形状、关键帧等来查找;同时,查询还要求能够实现无缝跨库连接,使用户能够方便、快速、准确地查到所有存储在数字图书馆的分布式资源。 3 结合数字图书馆的基本结构图,说明各部分的作用。 答:(1)图略,见本章;(2)1)用户系统定义面向用户和系统管理员使用的两类界面,用户端通常是互联网浏览器,在浏览器上实现与DL系统的服务交互,执行请求与服务;2)检索系统是DL系统的核心功能,检索系统在网络环境中采用分布式检索或并行检索系统结构。3)名字解析系统负责将URN转换为存储数字对象的网络物理地址,并实现URN的注册管理功能,以保证它的唯一性;4)数据存储系统存储与管理数字对象及其他信息,通过数据存储系统存取协议实现对数字信息的管理,同时实施访问控制和安全管理功能。 第6章国内外主要分类法介绍 (一)本章学习目标 1.理解CLC、DDC、UDC、LCC、CC的基本情况; 2.熟练掌握CLC、DDC、UDC、LCC、CC的基本特点; 3.学会分析比较各主要分类法的体系结构与标记符号的优劣; 4.能运用《中图法》分析其结构及使用方法。 (二)本章重点要点 1.国外主要分类法的基本特点; 2.《中图法》的体系结构及基本特点。 (三)本章练习题 1.简述DDC在分类法发展中的贡献及其管理上的成功经验。 DDC在分类法发展中的贡献及其管理上的成功经验是: 类目体系完整,覆盖全部知识、文献;类目详尽,等级分明,便于理解使用;首创以简明的号码标记类目的方法,便于图书排架、目录组织和检索;首次采用数字层累标记制,通用性好,易排易检,易于扩充、组配,具有较强的助记性、等级性;首创了类目相关索引,提供了从字顺角度查找类目的途径,便利分类表的使用;首次使用了复分与仿分方法;成立了长设机构,不断修订更新,保持分类法的长久生命力。 2.简要论述冒号分类法的分面理论要点及特点。 (1)CC分面理论的核心内容,是阮冈纳赞提出的概概念分析兼综合原则,以及他的分面分析分面标记方法; (2)分析兼综合的基本思想是:任何复杂的主题都可以分解为基本的主题单元,而简单的主题单元又可以组配成任何复杂的主题;因此分类法的类目可以用基本的主题单元表示,按一定序列组织并配置号码,分类时,先分析析文献主题成分,然后利用已分面的主题概念组配表达文献主题; (3)为了类目体系和标引有一定的规律和层次,阮冈纳赞又提出了五种基本范畴即本体(personality)、物质(matter)、动力(energy)、空间(space)、时间(time),五种基本范畴代表一般主题的五个基本分面,并分别用“,”、“;”、“:”、“ · ”、“ ‘ ”表示这五种基本范畴; (4)为了表达各主题之间的关系,CC提出了相的概念,相是一个基本类派生出来部分,相关系则表示主题之间联结形成的关系,CC把相关系分为五种:一般、倾向、比较、差异和影响关系。每一种关系又可细分为:主题相关、面内相关、类列内相关的关系。其中主题相关指两个基本类的关系;面内相关指同一面中两个点的关系;类列内相关指同一类列中两个类列点的关系。相的连接符号为:首相用“&”表示第一相与第二相的连接符号,再分别用15个小写字母来表示各种相的关系。 3.《中图法》类目体系及标记符号有何特点? 第7章分类标引与分类检索工具 (一)本章学习目标 1.理解分类标引工作的要求、标引工作程序和分类排架; 2.熟练掌握类目辨析方法、分类标引规则和分类检索系统; 3.学会辨析类目关系以及各类文献的分类原则; 4.能运用分类规则使用《中图法》为一般文献配置类号。 (二)本章重点要点 1.类目辨析方法; 2.分类标引的工作程序和分类标引规则; 3.分类检索工具的显示方法和检索途径。 (三)本章练习题 一.名词解释: 单主题 多主题 联结主题 二.思考题: 1 对分类标引有哪些要求? 为了保证标引质量,对分类标引的基本要求是: 准确即归类要正确,归入的学科专业无误;要确切,标引的类号专指度最高、最能代表其内容; 充分即信息源中有价值主题的揭示要充分; 一致即同一主题内容的资源的标引结果应一致; 适用即标引要适应系统的特点和用户的检索需要。 2 分类标引工作程序应分哪些步骤? 为了确保标引工作质量,分类标引工作程序应严格按如下步骤进行: 1)查重,在资源描述时要核查是否为已处理过的信息资源,以避免重复劳动,提高效率; 2)主题分析,对要处理的资源内容特征进行分析,确定其主题概念; 3)转换主题概念即归类,根据主题分析确定的主题概念,将要处理的资源归入所使用分类法的相应类目; 4)确定标识即给号,根据确定的类目给要处理的资源标引相应的类号; 5)审核,由专人对每种文献的标引结果逐项进行审查。 3.分类标引的基本规则有哪些? (1)按学科属性原则 分类标引必须首先以其内容的学科或专业属性为主要标准,只有在不适于以学科属性为区分标准时, 才考虑以其它方面的性质(如体裁、地域、时代、语文等)作为分类标准; (2)专指性原则 文献分类标引必须符合专指的要求。即将文献分入恰如其分的类,而不能分入范围大于或小于文献实际内容的类目;要区分总论与专论,不要将专论性的文献归入总论类;还要区分是阐述一般原理的,还是阐述具体问题的,不要把研究具体问题的文献归入阐述一般原理的类; (3)实用性原则 文献分类标引必须使文献尽其用,即要根据读者的需要将文献分入最大用途的类; (5)系统性与逻辑性原则 文献分类标引必须体现分类法的系统性、等级性和次 第性。凡能归入某一类的文献,必带有其上位类的属性。也就是说,凡能归入某一类的文献,一定也能归入其上位类; (6)不能单凭题名或篇名的含苞欲放义归类,因为不少题名仅有象征意义,不能确切反映文献内容。 4.简述多主题信息资源的一般标引规则。 (1)多主题信息资源是指同时论述两个或两个以上事物对象的信息资源,主要有并列关系、从属关系、联结主题等类型; (2)多主题信息资源的一般标引规则是: 1)并列主题是指一个资源同时论述两个或两个以上独立的主题,如果论述两个独立主题并有直接的上位类,则归入上位类,否则则按重点论述的主题或在前的主题归类,同时为另一主题作附加分类;同时论述三个或三个以上的并列主题,可以归入其上位类或概括性类目; 2)从属关系多主题资源,是指一个资源同时论述一个大主题一个小主题且大主题可以包含小主题,一般按大主题归类,但是论述重点是小主题的,可按小主题归类; 3)联结关系的多主题是指一个资源论述两个或两个以上具有应用、比较、影响、因果等关系的主题。归类时,应用关系的主题,一般按应用到的主题归类,但综合论述一主题多方面应用的,仍按该主题归类;比较关系的多主题资源,一般按作者重点论述的主题归类;因果及影响关系的多主题资源,一般按受影响的主题或结果的主题归类。 5.举例说明参考工具书应如何归类? 第8章主题法 一.本章学习目标 1.理解主题法的特征、叙词表的结构、编制与维护; 2.熟练掌握标题法、元词法、叙词法的基本特点,以及范畴索引、词族索引、轮排索引、分类主题一体化词表的特点或作用,叙词语言的词汇控制方法; 3.学会区分各种类型的主题法,以及叙词表的字顺表、各种索引的使用方法; 4.能运用《汉语主题词表》标引简单的文献。 二.本章重点要点 1.标题法、元词法、叙词法的基本特征; 2.范畴索引、词族索引、轮排索引、分类主题一体化词表的特点或作用; 3.叙词语言的词汇选择、词形控制与词义控制以及词间关系控制方法。 三.本章练习题 (一)名词解释: (1)主题法:主题法是直接以表达主题内容的语词作为检索标识、以字顺为主要检索途径的标引和检索信息资源的方法。 (2)叙词法:叙词法是一种从自然语言中精选出来的、经过严格规范处理的叙词作为文献主题的标识,通过概念组配的方式表达文献主题的主题法。 (3)概念组配:概念组配是在概念分析的基础上进行概念的综合。 (4)范畴索引:范畴索引又称分类索引、范畴表,是一种按照词汇所属的 学科或专业范畴编制的概略分类系统,是从分类角度查找叙词的辅助工具。 (5)词族索引:词族索引是一种以词族为款目单元,按照款目词的字顺排列,可以从等级关系的角度查词 的索引。 (二)思考题: 1 主题法的特点是什么?主题法有哪些基本类型? (1)主题法的主要特征是:直接以语词作为检索标识, 以字顺作为主要的检索途径;以特定的事物、问题、现象、主题为中心集中信息资源;通过参照系统等方式揭示主题词之间的关系; (2)主题法的类型主要有标题法、元词法、叙词法、关键词法等 2 叙词表一般由哪些(宏观结构)部分组成?叙词表 组成基本要求是什么? (1)叙词表一般由字顺显示部分和系统显示部分组成前者主要有字顺表、专有叙词表、双或多语种对照索引,后者主要由范畴索引、词族索引、轮排索引、分类主题一体化词表等部分组成; (2)好的叙词表的基本要求是:功能完备,各组成部分功能结合,使词表具有各种必要的功能;功能互补,词表各组成部分功能有效,性能互补,在整体功能上效果良好;结构简明,各组成部分没有或少有重复词表结构整体性好,既结构简明,又功能完备;编制和管理方便;易于掌握,易于使用。 3.简要说明叙词语言的词汇控制方法。 叙词语言的词汇控制方法主要有: (1)词汇选择。词汇选择的原则是客观性、可预见性、实用性、单义性、成族性、专指性和科学性等;词汇选择的类型是以名词为主,必要时也收录少量形容词。叙词可以分为普通名词和专有名词两种。对于专有名词或专有叙词可单独编制专有叙词表。 叙词表中收录词组的原则是:保留学科领域中使用频率较高的词组;凡经分解后,分解后的单词有一方没有独立检索意义,或改变它在词组中的原义,或组配结果可能有歧义的,应该在叙词表中收录词组;有检索价值的专有名词,一般可直接使用; (2)词形控制与词义控制。1)词形控制是指根据主题标引与检索的需要对语词的形式及构成成分作出的规定,以方便语词的排检。主要内容有:规定语词形体,一般以通行的字体为准;规定外来语和数字的用法,一般选规范的译名,如果外文的名词术语更通用,也可以直接选用原文;规定标点符号的用法,一般只在必要时使用()、——、· 等符号,另有规定的除外;规定词序,一般使用自然词序,不用倒置词序;规定外文的词形,主要是规定单复数、名词形式等;规定词长,使语词保持在规定的长度以内;2)同义控制,是指在语义相同而词形不同的语词之间,只能优选其中的一个作为正式的叙词,其余的可作为非叙词收入叙词表,作为查找入口。同义控制的内容包括同义词之间的控制和准同义词之间的控制。一般同义词之间的控制主法是选取较通用的一个作为正式叙词;学名与俗称、新称与旧称、全称与简称、不同译名、产品型号与代号等词汇的控制,一般选择学名、新称、全称、规范译名、产品型号等作为正式叙词;词组与 对应的组配形式之间,一般选取对应的组配形式;准同义词之间的控制主要有近义词的优选,即选通用 的词作为叙词; 反义词之间的优选一般选表示正面含义的词为叙词;太专指词并入泛指词;3)词义控制主要是对一义多词现象进行控制,使其具有明确性和单 义性。 主要内容有:加限义词;加含义注释、用法注释或历史注释。 (3)词间关系控制,是对叙词与非叙词词间关系的显示与规范,它是使叙叙词系统化的重要手段。叙词语言使用了参照系统、范畴索引、词族索引、轮排索引、词族图等多种方式显示词间关系,从而形成完整的语义网络。语词之间主要有三种关系:等同关系、等级关系、相关关系。在《汉语主题词表》中,等同关系用“用”(Y)“代”(D)两币符号表示,等级关系用“属”(S)、“分”(F)、“族”(Z)三种符号表示,相关关系用“参”(C)表示。 4.为什么说叙词法是多种信息标引与检索语言的综合? (1)叙词法是一种在综合多种检索语言技术方法基础上发展起来的新型词汇控制系统,它总结了各种标引和检索的经验,综合了多种检索语言的优点,结合新兴的计算机技术来构造它的结构和方法体系;它的参照系统最为完备,索引形式多样,还编制了各种分类主题目一体化的对应词表,使之成为结构完备、功能丰富的检索语言; (2)叙词法吸取了元词法的组配技术,把元词法的字面组配和反记法发展为概念组配与倒排档;它也吸取了体系分类法的学科分类和等级结构的方法,编制了范畴索引、词汇索引和词汇分类表;同时它广泛吸取了先组式标题和参照方法、关键词法的轮排技术、分面分类法的分面技术等,使之成为最具优势的检索语言。 5.分别简析标题法与叙词法的特点。 (1)标题法的主要优点是:用受控的自然语言作标识,直观地表达主题概念,直接地标引文献;以字顺序列组织标识,提供直接的主题检索途径;主要用参照系统间接显示标题所表达的主题概念之间的关系,形成语义网络;按事物集中文献,不是按学科集中;提供先组式的主题标识,标识含义比较明确,选用标识比较容易;标引所用的标题不必都是标题表中列举的现成标题,必要时可以自拟标题; 标题法的不足是:采用列举方式,往往会带来词汇量大,专指度低,修订难度大;大量采用先组式标题,只能从规定的组配次序入手查找,无法进行多途径检索、多因素检索。 (2)叙词法的优点: 1)结构完备,词汇控制严格;采用概念组配,避免了字面组配带来的一些误差,保证了组配语义的准确性;设置了完善的参照系统,同时使用多种方法显示概念间的关系,有利于提高查全率与查准率; 2)组配准确,标引能力强,能准确、专指地标引和揭示各种主题内容;灵活的叙词组配,使叙词语言有较强的表达能力,能 专指、及时地表达复杂、新颖的主题; 3)检索效率高,允许多因素检索、多途径检索,使检索具有灵活性; 4)对检索系统的适应能力强, 能同时使用于标识单元方式与文献单元方式的检索系统,能较好地适应机检系统和手检系统的需要。 叙词法的缺点是:由于词汇控制严格,词表编制和管理的要求高,编制和管理成本高;文献标引需要在概念分析的基础上进行,增加了标引的难度。 6.简析概念组配与字面组配的区别。 概念组配与字面组配的主要区别是: (1)两者的本质不同,前者重在拆义,后者在于拆词。它是利用构词法进行词的分拆与组合。概念组配本质是在概念分析的基础上进行概念的综合; (2)两者的词汇单元不同。单元词是不能再分的词汇单元,而叙词则以表达事物的基本概念为基础的。 第9章国内外主要主题词表介绍 (一)本章学习目标 1.理解LCSH、MeSH、《中分表》的发展、结构与特点。 2.熟练掌握《汉表》的发展、结构与特点; 3.学会熟悉和使用《汉表》; 4.能运用《汉表》标引简单的文献。 (二)本章重点要点 1.LCSH、MeSH、《中分表》的发展、结构与特点; 2.熟悉《汉表》,能运用《汉表》标引简单的文献。 (三)本章练习题 1.简述LCSH的结构特点和自由浮动标题的类型。 (1)LCSH的结构特点是:整体结构由主表、副表、和使用说明组成,主表是它的主体,包括导言和字顺表,副表和使用说明另收入《主题编目手册(标题部分)》中;LCSH的款目结构由标题目与非标题、分类号、注释、参照项组成; (2)LCSH的自由浮动标题四种类型:一是通用自由浮动复分表,由形式子标题和论旨子标题两种,由一般子标题复分使用,使用范围在各子标题下注明;二是特定范畴自由浮动复分表,只适用特定范畴的标题如人物、种族、团体、地名等复分使用;三是类型示范标题表,在某类标题中有代表性的标题下列出示范标题供同类标题仿照使用;四是多款目标题,某些标题有多个类似的子标题,并以举例方式规定其复分办法。 2.评价MeSH的特点。 (1)MeSH的优点是:词表是在医学文献标引的基础上编制的,符合医学文献标引的需要;树形结构表级别深,有利于从分类角度查词;设置了多种参照,全面建立语义关系,提高了检索效率;注释种类多样,说明详尽,有利于提高标引质量,也便于回溯性检索。 (2)MeSH的不足之处是:作为一部从标题法脱胎而来的叙词表,仍带有不少标题表的特点,产生了形式上不一致,简明性不够的缺点;副主题的使用除了在部分主标题下列出之外,同时还采用副标题组配的形式,且使用范围常有变化,增加了标引的难度。 第10章主题标引与主题检索工具 一.本章学习目标 1.理解主题标引的作用、标引方式和主题手工检索工具的编制方法; 2.熟练掌握主题标引方法、主题标引规则、主题检索系统的结构和功能; 3.学会区分主题标引与分类标引的区别、主题分析方法主题结构与公式、主题概念转换方法,各类文献的主题标引原则; 4.能运用各种主题标引规则使用《汉表》标引一般文献。 二.本章重点要点 1.主题分析与主题结构中各主题要素的一般公式、主题要素的转换方法; 2.主题标引的查词规则、组配规则各种主题与类型的信息资源标引规则; 3.主题目检索系统的结构与功能。 三.本章练习题 (一)名词解释: 综合标引 分析标引 隐含主题 (二)思考题 1 主题标引的概念转换有哪些基本的方式和规则? (1)主题概念的转换有两种方式,一种是直接转换,即直接用叙词表的一个叙词来表达,一种是分解转换,即需要用叙词表中的几个叙词组配表达,着涉及到对主题概念的分解转换的问题; (2)主题概念分解转换的规则是:必须进行概念分, 避免字面分拆;必须根据概念内涵析出最专指的分解 形式。 2.简析主题分析中主题的类型和主题结构分析方法。 3 简述组配标引的组配规则 主题标引的组配规则是:主题标引的组配必须是概念组配;在几个相互组配的主题词之间,其概念必须有交叉或限定的逻辑关系,不能采取单纯的字面拼合组 配或随意组配;应优先选用在概念上具有交叉关系的交叉组配方式,在不能采取交叉组配方式时,才考虑采用限定组配方式;必须选用与文献主题关系最密切、最邻近的主题词,不能选用泛指的主题词进行越级组配;对并列多主题文献进行分组标引;组配必须概念清楚、确切,只能具有一个含义,若组配的结果具有多个含义时,应考虑改用上位或近义的主题标 引,或者是增补新的专指主题词标引;组配次序,应依据国家标准中主题分面组配公式,即:“主体因素(A)通用因素(B)位置因素(C)时间因素(D)文献类型因素(E)”确定其次序,多个主体因素的主题可依逻辑顺序确定其次序,在难以确定逻辑顺序时,可采用自然语言顺序。 4 简述标引选词的专指性与优先顺序的规则。 标引选词的专指性与优先顺序的规则是:首先选取与 文献内容主题概念相对应的、最专指的词标引;词表 中没有专指词时,可选用与其最直接相关的、最邻近 的主题词进行组配标引(参见组配规则);在词表中 没有恰当的主题词组配,可考虑选用一个最直接的上 位主题词进行上位标引或近义的题词进行靠词标引; 如果以上都不合适时,可以采用增词标引。 第11章自然语言标引与检索 一.本章学习目标 1.理解自然语言标引和检索的类型、关键词索引的 编制步骤及关键词法的特点、文本检索的实现方式, 自动主题标引和自动分类标引的类型; 2.熟练掌握各类关键词法款目(或文件名)的排列方法、关键词法的性能,文本检索技术、后控词表的词汇控制方式、特点、词汇控制的内容和结构、词汇处理方式,自然语言与控制语言的性能比较,自然语言与受控语言结合的趋势; 3.学会处理后控词表的词汇(等同关系与等级关系)和句法及词表的应用形式,能比较分析自然语言与受控语言的性能; 4.能运用关键词技术排列各种文件,能处理后控词表的词汇。 二.本章重点要点 1.各类关键词法的款目(或文件名)排列方法、关键词法的性能; 2.文本检索技术的常见检索方法; 3.后控词表的词汇控制方式、特点、词汇控制的内容和结构、词汇处理方式; 4.自然语言与控制语言的性能比较,自然语言与受控语言结合的趋势。 三.本章练习题 一.名词解释 1后控词表:是在自然语言检索系统中,供在检索时进行控制的一种词表。 2文本检索:又称自然语言检索,指不对文献进行任何标引,直接依据自然语言中的语词实施匹配查找的系统。 3自由标引:不要词表,在严格的标引规则指导下,由标引人员直接选取自然语言中的词语进行标引。 4概念检索:在检索中利用用户的检索词进行检索的同时,结合使用该词的同义词进行检索,可以查全该检索词的所有资源。 (二)思考题 1.用于标引和检索的自然语言有哪些类型?各类自然语言主要应用于哪些方面? (1)用于自然语言标引与检索的类型有:关键词法、文本检索、 自由标引、 自然语言入口词检索和自动标引等; (2)各类自然语言主要应用于:关键词语言主要用 于编制关键词索引,关键词索引编制思想是将关键词 不加规范化或只作极少量的规范化处理,按字顺排, 提供检索途径的方法;文本检索主要用于自然语言检 索,即不对文献进行任何标引,直接依据自然语言中 的语词实施匹配查找的系统。常见的文本检索技术有布尔检索、截词检索、精确检索、限定范围检索、调整检索包括容错检索、过滤检索、概念检索、自然语句检索等方面、相关检索等。 2.后控词表有何特点?它有哪些主要的编制方式? (1)后控词表的特点是:1)后控性,即在后控词表中,标引与检索用词是自然语言,控制词是人工语言,这与先控语言里控制词的情形相反;2)成长性或动态性,是指后控词表词汇的不断更新、结构显示的不断深化。起初,所控制的词量有限,随着自然语言发展与变化,就需定期对新增的自然语言进行控制,对其结构的显示也逐步细化与深化。后控词表被称为不断增长的词表;3)灵活性。由于受控词表主要用于对自然语言检索标识的控制,不用于标引,其分类体系就可灵活变动,显示方式也可灵活多样,且逐步丰富;4)易用性,具有面向文献和用户的特点,利用后控词表进行自然语言检索,可自由地扩大、缩小检索范围,提高检索效率,减轻检索者智力负担;5)低成本性,是指编制与维护后控词表的费用低于先控词表;6)词间关系不同与传统词表,在后控词表中,等同关系的显示,实际上不是用代关系,而是一种互见关系;7)入口词丰富,词汇控制不如先控词表严格。 (2)后控词表编制方式有:1) 积累式。指通过对检索用词的不断积累,由人工整理成词汇表的方式。随着积累词汇的丰富,后控词表不使用效果会越来越好。2)抽词式。指将自由标引、自动抽词标引或通过从词典,工具书抽取的自然语言词汇,经过整理而成的后控词表。3)嫁接式。将自然检索标识与某种先控词汇表(类表或主题词表)相对应而形成的后控词表。它是以原先控表作基本框架,建立自然语言检索标识与原控制词的参照关系,其自然语言词汇作为“用”项加以显示;4)替代品式。是以某种叙词表作为后控词表的代用品使用。该方式因叙词表对使用中的自然语言检索标识不进行规范,其使用效果大打折扣;5)混合式。采用以上某几种方式的结合形式形成的后控词表。其中,对自然语言检索标识的覆盖度(网罗度)、结构控制度、(语义关系揭示的充分程度)、检索途径多样化程度是衡量一部后控词表质量的重要指标。 3.自然语言与受控语言为何要结合起来?二者结合的发展趋势如何? (1)自然语言与受控语言结合的原因是由两种语言的优势与不足决定的,自然语言信息的主要优点是:专指度高,处理速度快,可以提供更多的检索点,系统费用低,词汇及时更新,面向用户能力高;它的主要缺陷是:语词与概念不一一对应,存在着大量一词多义、一义多词及词义含糊现象,影响检索效率;检索点多,会检出大量无关文献,影响检准率;对词间关系不控制,不便进行扩检、缩检;词汇量大,必然会给词汇的加工、管理带来困难;自然语言不具有文献资源的组织功能,不能进行图书排架工作。而同时, 受控语言具有自然语言没有的优点:通过词汇控制,使得检索结果更准确,提高检准率和检全率;通过词间关系控制,可以在计算机检索系统中显示 示的关系结构,方便用户的扩检与缩检,以满足不同的检索需求;压缩词量,使得词汇所占空间或篇幅较小,便于进行各种处理;某些种类的受控语言,如分类语言,还具有对信息资源集合本身进行系统组织的功能和理的功能;然而受控语言却有自然语言没有的缺陷:标引速度慢,对标引人员的要求高,难以满足使用文献量大的信息组织部门的需要;受控词表编制与维护的成本高;更新速度不如自然语言等。 (2)自然语言和受控语言结合的方式有: 1)两者并存,建立平行的系统,即在检索系统中同时使用文本检索、自由词标引、受控标引等多种检索方式,向用户提供分类号、叙词、关键词等检索途径,供用户选用; 2)建立杂交的系统,同时在一个检索系统中采用控制词汇和自由词进行标引和检索; 3)使用后控词表,即在组织检索系统时采用自然语言,在检索阶段对检索词实施控制(后控); 4)自动赋词标引,利用计算机编制的机内词表在标引阶段对标引词进行控制。 4.简述信息组织发展的趋势? (1)分面组配化 1)分面组配方法成为各种信息组织体系的基础,传统分类法和词表朝分面组配方向不断改造,应用分面组配原理编制的新型分类法和词表越来越多; 2)分面技术普遍用于各种叙词表、本体论、主题网关等; (2)分类主题一体化 1)主题和分类方法相结合,广泛应用于网站主页、搜索引擎等。 2)叙词表普遍编制了范畴表,分类法和主题词的对应表也得到较多的应用; 3)本体论(Ontology)、网页分类和网络本体语言(OWL)都从不同角度利用了词语字顺排序方法和概念等级方法来建立体系或处理词间关系。 (3)计算机化与电子化 1)计算机辅助编制、管理分类表和叙词表,普遍实现了电子化,加快了分类法和叙词表在联机检索和网络检索中的应用,开展了自动分类和自动标引研究,信息组织已实现了从手工环境到到电子环境的转变; 2)机器处理信息资源和信息组织的自动化已基本实现。 (4)标准化与形式化 1)编制和使用统一的或兼容类表和词表,类表和词表的编制日趋标准化和标引规则标准化; 2)形式化是信息组织使用的语言具有机器可理解性,便于计算机阅读和处理; (5)自然语言化与结构化相结合 1)分类语言与主题语言普遍增加自然语言的份量,主题标引和分类标引更多地使用自然语言,基于文献题名、文献内容或全文的自动标引技术的应用日趋广泛; 2)各种大型信息组织工具广泛使用了词汇关系处理方法和模拟机器语言的表示方法,建立各种词语概念体系,使检索语言日趋结构化。 (6)个性化与临时性信息组织 信息组织一方面强调适应用户需要和特点,突出个兴趣和特点,另一方面各种信息组织在文档描述时已形成结构化的知识点,在搜索时形成临时性的组织排序。 (7)信息组织的其他发展趋势: ˜信息组织的有序化、优化功能更加强大; ˜信息组织工作日趋规范化、自动化、网络化、协作化与社会化; ˜信息组织产品日趋标准化与多样化、体系化与特色化、商品化与多元化; ˜信息组织语言日益兼容化、自然语言化与智能化。 第12章现代信息组织的发展 本文档由香当网(https://www.xiangdang.net)用户上传

    下载文档到电脑,查找使用更方便

    文档的实际排版效果,会与网站的显示效果略有不同!!

    需要 2 香币 [ 分享文档获得香币 ]

    下载文档

    相关文档

    哲学课程辅导

    第一节 辨证的唯物论----唯物主义和唯心主义 课程辅导 一、基本概念:  哲学,世界观,方法论,哲学基本问题,唯物主义,唯心主义,可知论,不可知论,古代朴素唯物主义,近代形而上学唯物主...

    2年前   
    705    0

    小升初总复习资料(3)

    小升初语文总复习资料汇总第一部分:语音知识一、汉语拼音方案二、整体认读音节(共16个)三、儿化四、轻声五、变调六、“啊”的语音变化第二部分:汉字知识第三部分:词语知识第四部分:句子知识一、句子...

    6个月前   
    343    0

    初中数学总复习计划

    初中数学总复习计划  初中数学总复习计划  2005年3月  初中数学总复习是完成初中三年数学教学任务之后的一个系统、完善、深化所学内容的关键环节。重视并认真完成这个阶段的教学任务,不仅有利于...

    8年前   
    85    0

    期末总复习2 单位的转化

    期末总复习2方法技能提升卷2单位的转化一、我会填。(每空2分,共24分)1.在(  )里填上合适的单位。2.直尺上刻度0到10的距离是(  )厘米,也就是1(  )。3.铁钉的长度是(  )厘...

    1年前   
    356    0

    中考政治总复习2

    中考政治总复习2编辑日期:2012/5/4  作者:通讯员    阅读次数: 41 次  [ 关 闭 ]第二部分:法律常识一、法律60、法律的含义:法律是由国家制定,靠国家强制力保证实施,对全...

    2周前   
    82    0

    《伤仲永》总复习(有答案)

    1、文学常识:《伤仲永》选自《 》作者是“唐宋八大家”之一的 。他是 朝的 , , 。字 ,号 ...

    1年前   
    486    0

    中考政治总复习3

    中考政治总复习3第三部分:品质常识(一)道德品质交往(一)(一)我与家庭111、为什么要孝敬父母?①父母把子女看成自己生命的一部分,关心子女胜过关心自己。父母对子女的爱是世界上最无私、最真挚的...

    3周前   
    110    0

    2011高三物理总复习安排

    2011高三物理总复习安排  高三物理总复习的指导思想就是通过物理总复习,把握物理概念及其相互关系,熟练把握物理规律、公式及应用,总结解题方法与技巧,从而提高分析问题和解决问题的能力。  一、...

    10年前   
    168    0

    6A语文总复习

    .《祖父和我》 【文学常识】萧红,现代作家,代表作品《生死场》、《呼 兰河传》 【中心思想】本文向我们展示了一副充满情趣的祖孙生活场 面,抒发了作者对亲情的赞美以及对自由的向往。

    2年前   
    531    0

    初中化学总复习要点

    1、化学变化:生成了其它物质的变化2、物理变化:没有生成其它物质的变化3、物理性质:不需要发生化学变化就表现出来的性质

    4个月前   
    120    0

    初三总复习数学测试

    共40题 ( 1题3分 共120分 按顺序填答案) 第一套 1.一种零件的直径尺寸在图纸上是(单位:mm),它表示这种零件的标准尺寸是20mm,则加工要求尺寸最大不超过(...

    7个月前   
    176    0

    总复习动员讲话稿

    总复习动员讲话稿  各位老师、同学们:   一个学期即将过去,新的一年悄然来临,期末考试即将开始。根据市教育局和我校期末工作安排,下周星期一至星期四是期末考试时间, 初一的语、数、英,初二的语...

    5年前   
    82    0

    信息技术助力初三英语专项复习课程的应用实践

    本文从传统初三英语专项复习的现状出发,指出传统课堂中存在的不足,分析了信息技术与初三英语专项课程整合的意义,它是课改的大势所趋,是提高教学效率,培养学生学习兴趣,实现个性化学习的有效手段。通过对...

    2年前   
    939    0

    少先队总辅导员职责

    少先队总辅导员职责  1 、及时传达贯彻上级团委、少工委的决议和指示,认真落实上级布置的任务,并经常向上级请示和汇报工作。   2 、根据学校各个时期的工作重点,针对少年儿童的特点,从本校的实...

    7年前   
    147    0

    《浅析网络课程辅导》论文

    宁德职业中专学校《浅析网络课程辅导》论文 摘要:本论文阐述了计算机辅助教育的概念、内容和发展情况以及现代远程教学模式与环境。简要分析了实现远程课程辅导的关键技术,对在中学实现网上课程辅导的过...

    10年前   
    13508    0

    初中地理新课程辅导讲座

    初中地理新课程辅导讲座   新地理课程标准在地理教学理念、地理教学内容、地理教学方式方法、地理教学评价等各方面都提出了新的要求。这种改变不仅给地理教师提供了发展的机遇,同时也带来了严峻的挑...

    3年前   
    1714    0

    期末总复习方法技能提升卷2

    期末总复习方法技能提升卷

    5个月前   
    159    0

    四六级常考语法总复习

    常见句型:1. It is true/ obvious/clear/ possible/ certain that…真题解析:①It is simply not true that econom...

    5天前   
    34    0

    初中物理总复习全部知识点总结

    初中物理总复习全部知识点总结

    2年前   
    665    0

    期末总复习方法技能提升卷1

    期末总复习方法技能提升卷1计算的挑战一、我会填。(每题2分,共12分)1.因为3.2×1.5=4.8,所以32×0.15=(  ),48÷3.2=(  )。2.(  )×2.5=12,(  )...

    6个月前   
    187    0

    文档贡献者

    文***享

    贡献于2021-02-23

    下载需要 2 香币 [香币充值 ]
    亲,您也可以通过 分享原创文档 来获得香币奖励!
    下载文档

    该用户的其他文档