版权归原作者所有,如有侵权,请联系我们

[科普中国]-后组式标引

科学百科
原创
科学百科为用户提供权威科普内容,打造知识科普阵地
收藏

后组式索引也称概念组配索引,其基本出发点是认为各种完整的、复杂的概念,都可以分解成更为一般的单元性概念。反之,各种完整的、复杂的概念都可以通过一般的单元性概念的组合或组配来构成。后组式索引就是基于这种思想建立起来的。后组式索引在文献标引时,是把文献的主题分析成一些独立的概念单元,把这篇文献号分别标在这些概念单元之下,而在检索时,通过把有关的概念单元进行逻辑乘,逻辑或,逻辑非等方式来构成自己的检索提问1。

那么,什么是逻辑乘、逻辑或、逻辑非?及其它们怎样被用来与各种概念单元有机联系在一起来构成检索提问的呢?下面用文氏图说明之:

图①阴影部分表示A且B("∧"是逻辑乘符号),意思是既属于集合A也属于集合B(A和B是两个不同的集合)。

图②阴影部分表示A或B(“∨”是逻辑加符号),意思是或者属于集合A或者属于集合B。

图③阴影部分表示A且非(B“-”是逻辑非符号),意思是属于集合A但不属于集合B。

图④的阴影部分表示不是既属于A一也属于B的,是同图①完全相反的。

①一④式为逻辑表达式,当然还可以举出很多。如果将集合A与集合B分别赋予不同的内容,则上面的文氏图分别代表着不同的含义。下面说明后组式索引的标引与检索。

假定有下列几篇文献其主题及其文献代号为:

计算机在图书馆中的应用 ①

计算机在文献检索中的应用 ②

利用图书馆进行文献检索的教育 ③

试论文献检索教育的必要性 ④

关于文献检索教育的必要性 ⑤

关于文献检索教材的编制 ⑥

我们可以将上述六篇文献分析出“计算机”,“图书馆”,“应用”,“文献检索“,“教育,“必要胜,“师资,“培养,“教材,“编制”十个概念单元,然后为每一个单元词作一卡片,以该词作标识,在其下记下相应的文献号。

检索时,根据检索提问,可以选取有关的概念单元卡片进行组配。所谓组配,就是寻找出构成检索提问的各有关概念单元,根据检索提问的不同,分别找出相应的文献号码。若是逻辑乘的关系,则在有关的概念单元之下找出相同的文献号码,即为命中文献。

例如,我们要查找“计算机在图书馆中的应用”这篇文献,就可以将“计算机”、“图书馆”和“应用”三张卡片中的文献号相比较,可以发现在这三张卡片中相同的文献号只有①,故①号文献即为命中文献。若是逻辑或的关系,则处于“或”关系之下的相应的概念单元卡上的文献号码皆为命中文献。若是逻辑非的关系,则是将被否定概念单元卡上的文献号排除在外。

如要查找不是在图书馆中的计算机应用方面的文献,只有②号文献符合检索命题,②号文献即为所求。后组式索引可以灵活地提高检索提间的专指度。如要查找一篇有关文献检索师资的培养问题方面的文献,则只有⑤号文献符合命题。另外还可以任意扩大提间的泛指度。如要查找有关文献检索方面的文献,则②③④⑥⑥五篇文献皆为命中文献。显然,后组式索引对于手工操作是十分不便的,如一个概念单元之下标有儿百篇文献,对一个有若干个概念单元组合而成的复杂提问,那么手工操作是非常麻烦的事情,而且速度慢,效果差。

然而,后组式索引为计算机检索作了有益的探讨,为实现自动化检索提供了可能,计算机的高速准确的逻辑匹配功能,使后组式索引得到了进一步的利用。后组式索引系统在计算机中的存贮可以建立三个文档,一个是索引文档,一个是倒排文档,一个是文献记录线性文档。存贮结构如图。在索引文档中,每个词附有两个数据项目,第一个表示属于该词之下的文献存贮的起始地址,第二个表示被标定在该词之下的文献数目。倒排文档为索引文档中出现的每个词存贮该词的全部文献号码,即标定在该词之下的全部文献号码表。文献记录线性文档是一种按文献号组织的文档,这个文档为数据库中的每一篇文献存贮各种查找数据,如文献篇名、出处,作者或者文献的文摘等。下面举一实例说明后组式索引的联机检索过程,见图。

假设我们要查找有关计算机在文献检索方面的应用的文献,检索人员就可以通过终端分别将概念单元“计算机”、“文献检索”、“应用”分别输入给计算机检索系统。当检索人员输入提问①“计算机”时,系统很快响应,通知检索者有17篇满足提问的文献。当检索人员输入提问②“文献检索”时,系统马上通知有20篇满足提问的文献。当检索人员输入提问③“应用”时,系统马上给出数字15,表示有15篇文献满足提问。当检索人员需要更专指的提问输入①和③时,系统马上给出数字2,表示有两篇是关于计算机应用的文献。假设检索人员还需要更专指的检索提间,输入①和②和③,(即需要查找计算机在文献检索中的应用)时,系统马上通知只有一篇满足提问。当检索人员需要了解他查找的文献的有关信息的时候,即可给计算机下达输出命令,此时,系统则马上在文献记录线性文档中查找出有关的记录并输出。限于篇幅,在此只能对后组式索引的原理及其存贮与检索作一简单地介绍。随着计算机技术的不断发展,后组式索引将会得到广泛的应用。