信息分类的基本方法
出处:按学科分类—工业技术 企业管理出版社《工程师手册》第229页(2264字)
为了解决有序化以及简化问题的处理,信息分类应能较好的反映出系统内不同构成部分和层次关系。按此,目前信息分类的方法主要有:线分类法面分类法以及线、面混合分类法。
1.线分类法
线分类法是将初始的分类对象按选定的属性作为划分基础,逐次地分成若干层次类目并排列成一个有层次、逐次展开的信息分类方法,因而它又称层级分类法,其结构如图10.2.2-1所示。这种结构的特征码有很多分枝,成树枝状,有的称它为树式结构。
图10.2.2-1 线分类法结构
这种分类方法的体系主要是由同位类与上下位类组成。由一个类目直接区分来的各类目,彼此称为同位类。上、下位类是相对结构中类目所在的层次而言。同位类目之间为并列关系,下位类从属于上位类即上下位类之间为从属关系。
例如,国家标准GB2260-86《中华人民共和国行政区划代码》便采用了线分类法三个层次,并用6位十进制表示。第一、二位代码表示省、自治区或直辖市;第三、四位代码表示地区(市、州、盟);第五、六位代码表示县(市、旗、镇、区)。不同的代码序列即可编码定位出具体的行政区。为说明问题,特摘录部分的划分如下表。河北省相对于石家庄市、唐山市……为上位类类目;石家庄市、唐山市……相对于河北省为下位类目。石家庄市、唐山市……彼此是同位类目。
河北省行政区的划分与代码示例
线分类法的结构特点一般是由分类层级和分类容量来表示。分类层级(第一层、第二层……第n层)反映了信息分类的深度,而其深度的确定与要求包括的分类对象属性有关,同管理系统的具体任务有关。分类容量反映分类体系可以包含的信息量,并与分类的深度和每一层级分类对象的数目有关。由于不同信息量的复杂程度各异,因而在设置分类深度和每个层级的类目数量时,有的信息可安排在两个层级内,而有的则要求四、五个层级。之外,在同一层级中,从上一层级划分出来的下位类,类目数也不尽相同。因此在采用线分类法时,分类深度的选择和各个层级的类目数,将根据体系内大多数分类对象的情况确定,并应遵循如下基本规则:
(1)由某一上位类划分出下位类类目的总范围应与其上位类类目范围相等。
(2)当某一个上位类类目划分成若干个下位类类目时,应选择同一个划分基准。
(3)同位类类目之间不应交叉,不应重复,并只对应于上位类。
(4)分类要依次进行,不应有空层和加层。
线分类法的主要优点是层次性好,能较好地反映类目之间的逻辑关系,便于人工或计算机处理分类信息。其主要缺点是结构弹性差,分类层次较多时,则代码位数校长,影响处理速度。因而,按照线分类法建立分类目录时,一般须预先安排足够的后备容量。
2.面分类法
面分类法是把给定的分类对象,按选定的若干属性或特征,分成彼此之间互不依赖,互不相干的若干面,每个面又可分成许多彼此独立的若干类目的信息分类方法。其结构如图10.2.2-2所示。这种结构形式如同链条,又称它为链式结构。使用时,可根据需要将这些面中的类目组合在一起,形成一个复合类目。
图10.2.2-2 面分类法结构
面分类法的结构特点是由面及面内的具体类目来表示。因而,面分类法的信息容量是和面的数量以及每个面内的具体类目有关。而面的排列顺序则与信息管理的需要以及待解决的课题有关。因而,采用面分类法时,必须符合其结构特点的两条规则:
(1)一个面的标志概念,在不同的面里不应该互相交叉,更不能含糊和重复,以保证标志概念的唯一性和独立性。
(2)建立分类体系时,一个特定的面应该占有严格的固定位置。
面分类法的主要优点是分类结构弹性大,一个面的类目的改变,不会影响其他面,便于扩充、修改,此外,面分类法的适用性比较强,可实现按任意面的信息进行检索,这对计算机处理信息有良好的适应性。其主要缺点是冗余信息多,影响存贮效益。
3.线、面混合分类法
线、面混合分类法是把线分类和面分类组合一块使用的信息分类方法,是为尽量利用线分类法和面分类法的优点。例如,成组技术中的零件分类系统采用的就是混合分类法。
根据信息的特点和实际需要,可以线分类为主,后面是面分类的结构形式,或面分类为主,中间有部分线分类的结构形式。目前,大多数分类系统采用的是混合式结构。