信息编码的方法
出处:按学科分类—工业技术 企业管理出版社《工程师手册》第230页(1986字)
目前国际上通用的信息编码方法有两类:登记体系编码法与分类体系编码法。
1.登记体系编码法
登记体系编码法是每出现一个具体对象就赋予它一个代码的编码方法。通常采用顺序编码和系列顺序编码两种。
(1)顺序编码法
顺序编码法就是按类目在分类体系中先后出现顺序,依次赋予顺序代码的编码方法。例如,扳手001,锤002,锯003……。为了满足信息处理的要求,多采用等长码(如用001-199,而不是1~199)。
顺序编码法的代码长度与编码对象数目的关系为:
式中:Q——编码对象的个数;
A——组成代码字符的个数;
L——代码的位数即代码长度。
由式知,这种编码法每增加一位代码、编码的容量只增加A倍,因此编码的冗余度不大。
顺序编码法的主要优点是可以保证最低限度的代码长度,便于修改,对编码对象的顺序无任何特殊规定和要求。但代码只能提供有关编码对象位置的配置顺序,以作为编码对象的标识,而不包含任何有关编码对象的属性或特征,以及有关分类关系的信息。还不便于记忆。
顺序编码方法简单,一般用于容量不大的编码对象集合体。通常非系统化的编码对象采用这种方法。
(2)系列顺序编码法
系列顺序编码法是把整个编码对象集合体,按一定的属性或特征划分为系列,而集合体的每一系列一般按顺序登记获得代码的编码方法。它与顺序编码法不同之处在于除用于标识外,还能表征编码对象的一定属性或特征。
系列顺序编码法的主要缺点是当预留空码过多时,不便于机器处理。因此,系列顺序编码法不适用于复杂的编码对象,一般只适用于分类深度不大的编码集合体,并在每个系列中,通常要留有后备号。
2.分类体系编码法
分类体系编码法是按规定的类组层次和相似性给定代码,目的是得到足够的有序化信息的编码方法。按其结构有:层次编码法、平行编码法和混合编码法。
(1)层次编码法
层次编码法是根据分类对象的从属关系而按层级赋予对象相应代码的编码方法。按这种方法的代码自左至右表示的层级由高到低,每个层级的代码可采用顺序码或系列顺序码。常用于线分类体系。
层次编码法的主要优点是简单、逻辑性强、隶属关系分明,便于计算机处理。其主要缺点是当层次较多时,弹性较差。为延长其使用寿命,往往要用延长代码长度的办法,预先留出相当数量的备用号,从而出现代码的冗余。所以,这种编码方法只适用于编码对象变化不大的情况。
(2)平行编码法
平行编码法是每一个分类面确定一个数量的码位,并且分类特征的含义与前一位代码组合的具体含义无关的编码方法。这种编码方法多用于面分类体系。
平行编码法的主要优点是有较好的弹性,可以比较简单地增加分类的数目,必要时还可更换个别的面。可用全部代码,也可用部分代码,还便于计算机处理。其主要缺点是代码过长,冗余度大。
(3)混合编码法
混合编码法是将层次编码法和平行编码法结合到一块使用的编码方法。实践中编码方法和分类方法一样,一般都不单独使用。往往有这样的情况,当把分类对象的各种属性或特征分列出来后,其某些属性或特征采用层次编码法,其余的属性或特征则用平行编码法。这样取两种方法的优点,效果往往更为理想。因为按常规的层次编码法编制的统一代码,往往难于满足各系统内部的需要。其主要原因在于这种编码方法对物品的分类完全进行限制,因此,往往使得某些系统的局部效益得不到保障。混合编码法为解决这一问题提供了一种有效的办法。