信息分类是将具备某种共同属性或特征的事物或概念集合在一起,把不包含这种共同属性或特征的信息区别开来的过程。信息分类是IT公司对各机构实施较大规模信息化建设过程中的基础要素,通过信息有效分类及统一规则的编码赋码,可以按逻辑关系或层级次序对各种看似杂乱无章的信息和数据进行排列组合,使其在分类体系上具备规则。
在传统的信息分类方法中,最通用的是线分类法、面分类法和混合分类法。线分类法将选定的对象属性作为划分基础来进行层级类目划分,如行政区划代码;面分类法将对象本身固有的若干属性或特征划分成一组独立的类目,每组类目构成一个面,按一定顺序将相互之间没有隶属关系的面平行排列形成分类,如职务名称代码;混合分类法将线分类和面分类组合使用,以其中一种分类法为主,另一种作补充对信息进行分类,混合分类在处理企业信息化建设中的复杂分类时较常使用。
随着企业信息化建设的发展和深入,基础的信息分类方法已无法满足复杂信息类型的分类和描述需求。随之出现了与面向对象程序设计思想类似的分类体系,其中典型的代表是来自德国的eCl@ss分类系统。
eCl@ss是对产品和服务进行分类与描述的国际标准,由德国eCl@ss协会发起,由各大跨国信息技术公司和各个行业的领导企业特别是制造型企业共同参与并研究制定的分类系统。与传统的信息分类编码区别最大的是,eCl@ss不仅涵盖25个不同行业,四个层级,超过75000项类目和主题词的分类体系,还包含用于对产品和服务进行描述的属性集合以及各属性的值域范围。
eCl@ss分类体系的制定和维护都是一个相对庞大的系统工程,目前在协会的推动下,由不同行业的专家进行维护,并不断推进各类目及属性的更新和完善。在企业电子商务应用中,eCl@ss分类为企业采购带来巨大的经济优势,买方可以借助分类及属性方便的获取供应产品元数据,以扩大供应商范围并减少交易费用,通过增强产品及零部件的可比性来提升市场透明度。由于买卖双方使用相同的数据结构进行信息交换,对于供应商同样可以起到减少交易费用,拓宽供应范围的作用。
eCl@ss分类体系的方法依据ISO标准13584的第42部分:结构化零件族方法学来构建。eCl@ss分类体系中包含类表、关键词表、类和属性的关联映射表、属性表、值域表、属性和值域的关联映射表。其基本思想是通过关联映射文件,在不断扩充的类目、属性和值域之间建立联系。eCl@ss的上下级类目具备属性的继承关系,即子类目顺承父类目对应的各项属性,并在此基础上关联自身特有的描述属性,并向其下一级子类顺承。
由于不同行业的产品或服务共享一些通用的基本属性,eCl@ss还设置了标准属性集与基本属性集。标准属性集是为描述某类产品专门制定的,而基本属性集一般都是由下面五个属性组成的:EAN代码、制造商名称、产品编号、产品名称以及产品类型描述。其中EAN代码是国际物品编码协会统一制定的商品条码,是由国家代码、厂商代码及检查码等项组成的数字码,通常以一维或二维条码的形式印制在商品的外包装上。
在贸易全球化的趋势下,信息技术和通讯科技的发展将各类企业更紧密的联系在一起。随着企业间数据交换的需求不断增加,对产品和服务进行分类与描述的统一标准将越来越重要。致力于成为世界上最重要分类标准的eCl@ss,为电子商务过程中各个参与方提供了数据交换的基础,通过统一的规范帮助企业节约时间和沟通成本。
目前,源于德国的eCl@ss体系,已拥有德国铁路、巴斯夫化工、戴姆勒-克莱斯勒、宝马、保时捷、大众、奥迪等一大批企业用户。eCl@ss分类及属性描述也被翻译成英语、法语、西班牙语和中文,正在从拥有广泛工业基础支撑的欧洲逐步延伸至美国和亚洲,并努力成为被全世界理解和使用的信息分类及描述国际化标准。
本文曾发表于《程序员》杂志-2012年03期“程序天下事”栏目。