物品身份及其编码的本质
2022-09-01张成海
张成海/文
究竟什么决定了一类/一件物品是这类/这件物品? 物品本身的身份是由什么决定的?是物品的名称,物品的编码,还是物品的属性?
一、物品与事物的概念
“物”的本义是指万物,宇宙中的所有物件;“品”的本义是众多的,表示某一类东西的总称,比如物品、食品、药品、商品等。因此,物品是物的扩展衍生概念,泛指各种物、东西、物件、物资、物料、器材等等。
事物是一个可感知的客观存在的范畴,指客观存在于自然界的一切事情(现象)和物体。事和物本来是两个词,事通常指人的所作所为,物通常指自然界存在的各种物体。事与物的区别是相对的。在许多情况下,自然界的一切现象都可称为事。由于这些事都依赖于一定的物而存在,因一定的物而得以表现,正所谓物或有状况可辨,事或有形迹可睹,故此二者又往往联系在一起成为被感知对象,便合称为事物。
事物其内涵范畴的外延极广。首先,它是一个概括了一切自然现象和社会现象的范畴,如描述自然现象的天事、物事,描述社会现象的人事,都是事物。其次,它是就物体及其运动变化、过程而言的范畴。事本指人或物的行为。光有人,或者光有物体,而没有行为动作,不成为事;行为动作如果没有发生、发展、结果,也不成为一件完整的事。物也如此,物指个别的具体物质,是有生有灭,有彼此联系的东西。任何物都有开始,正所谓物之始;也一定有结果,正所谓物之终,这就是物的始终关系,而始终关系之间物本身及施加在物本身上的各种行为动作,便是事。可见,事物不仅包括物品这一主体,而且包括物质的运动及其过程,还包括它存在的基本形式——时间空间。事物包括人、机构、物品、时间、关系等等。由于应用场景和看问题的角度不同,我们又把事物称为实体、对象等。事物是一个比物品更广、包含意义更多的概念。所以只要我们弄清了事物身份的本质,也就等同回答了物品身份的本质问题。
二、事物身份问题的提出
古罗马时期的哲学家普鲁塔克提出过一个“特修斯之船”的思想实验。特修斯是古希腊传说中的英雄,他为了解救雅典百姓,曾带领希腊年轻人乘船到克里特岛历险和征服,为民除害后乘船安然返回雅典,成为了雅典国王。后来,为了纪念特修斯,雅典人把他们的用船留了下来。但随着时间的推移,这艘船的木头一块块腐朽,人们就会用新的木头更换旧木头,直到把船的每一块木头都更换完毕。于是普鲁塔克提出问题:现在的这艘船还是原来的船吗?这是一个有关事物身份确定的问题。与此相类似的问题还有多个相似的例子,比如一个单位创始人离开了这个单位,全部换上新人时,这个单位还是原来的单位吗?一个人从小到大,构成身体的细胞更换了很多遍,这个人还是自己吗?这些类似问题都是要弄清楚事物身份的本质是什么,或者说什么是事物存在的根据。
白马非马的辩论出自于我国战国时期名家代表人物公孙龙所著的《公孙龙子》。“白马非马”的讨论发生在赵国境内马匹传染病流行时期。当时各国为了防止马瘟的流行纷纷禁止其他国家的马匹入境,公孙龙乘坐白马要在函谷关入秦国。关吏说人可入关,但马必须留下不能入关,公孙龙却说白马非马为何不能入关。关吏说白马是马,公孙龙反驳说,若白马是马的话,那我公孙龙就是龙了,这怎么可能呢?官吏虽然有点吃惊但依规定不论白马还是黑马依然不让进关。公孙龙接着说,“白马”这个概念,分开来就是“白”和“马”或“马”和“白”,这是两个不同的概念。如果你去马市上买马,马贩子给你牵来黄马和黑马都可以,但你要买白马而马贩子给你牵来黄马和黑马肯定不是你要买的东西。如果白马是马,那么黄马黑马也是白马,这显然不对,说得关吏有点蒙圈,于是就让公孙龙和马过关了。多数人认为公孙龙在诡辩,也确实存在诡辩因素,但白马真的是马吗? 通过这个例子,我们可看出这直接关系到事物的概念和分类识别问题,其本质就是共相与殊相,一般与个别的关系。要回答他上述两个问题,我们得从事物的分类与身份识别开始。
三、事物身份的确定
事物在英文中的词是things,跟中文的万事万物大致同义。要理清什么是事物,我们需回到人类对事物的最初探讨和分析上。伟大的古希腊哲学家柏拉图认为,存在着两个世界,一个是崇高的“理型”世界,另一个则是纯粹的“事物”世界,后者只不过是对前者的模仿。柏拉图认为前者更真实,是事物的本质。
柏拉图之所以提出“理型”概念,则是为了试图解决早期希腊哲学家所面临的运动与变化的难题。赫拉克利特认为万物皆“流”,永恒不变是一种错觉,而巴门尼德认为万物皆“静”,运动和变化则是一种错觉;柏拉图则试图在同时承认两者观点的前提下提出自己见解,他认为巴门尼德的世界是由永恒不变的“理型”组成的不可改变的可见领域,而这些理型本身在可见的世界中表现不佳。事实上是把“变化的事物”说成是对不变事物的拙劣模仿。这显然是典型的客观唯心主义。
亚里士多德则反驳了这一观点,他认为世界只有一个,我们正处于世界的中央。如果理型是事物的本质,那么它是如何脱离具体事物而存在呢?如果它们是事物存在的原因,又为什么以及以什么方式存在于另一个世界?亚里士多德提出了自己的解释方案。在亚里士多德的范畴篇中,描述事物分为十大范畴:他们是实体(substance)、分量、性质、关系、场所、时间、位置/姿态、状态、动作和被动。所谓实体就是“是什么”,其余九个范畴则是“什么大小,什么性质,什么关系,在哪里,在何时,处于什么状态,有什么,在做什么,以及如何受影响。如果按这样的模式去分析事物,我们就能够更加全面地认识和理解事物。实体是载体或基质,其它的九大范畴则是作为属性(Accident)来述说实体的。按照亚里士多德的观点,对事物的描述一般是通过实体及属性实现的,而属性是可以变化的。实体就是既保持自身基质的同一,又能在自身的运动变化中容纳相反的属性,在数目上是单一的。同时,它还认为个体事物(如单件产品,一个人等)是第一实体,其所属的种与属(例如一类产品)则是第二实体。现在实体及属性一般不再常用,而用事物(Things)和属性(Attribute)来替代它们。
在亚里士多德的物理学中,解释了事物的运动与变化的原因,他提出了事物的形式与质料,并强调这两种现实特征只能在思想中加以区分,而不能在现实中加以区分。形式不是独立的实体,它嵌入在特定的事物中,存在于世界中,否则就会造成思想中的混乱。一个特定的识别目标,要被认为是一种事物必须同时具有形式和质料。它认为一个事物的运动就是实体在不变载体的基础上从一个状态向另一个状态的变化。所谓不变的载体,就是质料,指在运动和变化中持续存在的那个东西,形式指只在完成状态中存在的东西。所以,事物是形式和质料结合而成,质料是事物组成的材料,形式可理解为一件事物的个别特征。在亚里士多德的形而上学中,他又对实体的本质(或原因,根据)作出规定。
究竟质料是真正的实体,还是形式是真正的实体?他先假定质料是实体的本质,发现没有形式的质料(纯质料)没有个体性,它不是“这一个”,这样实体便成了没有任何形式的纯质料的载体,没有任何规定性,不符合实体的标准。然后他又假定形式是实体的本质,发现没有了质料的形式满足不了“在变化中持续存在”这一标准。这样,亚里士多德面临着艰难的选择,要么主张质料是实体,要么主张形式是实体,或质料与形式的混合为实体。最后他选择了形式作为实体,他认为形式是普遍的“共相”,许多具体的事物的“殊相”可以有一种形式。
他认为一个事物的形式构成它是“什么”。也就是,当说某物是什么(比如它是一棵树,或是一本书)时,你就是在命名它的形式。因此,形式是一个事物的本质或本性,它与事物的功能有关。每一种实体都包含一种本质,本质与它的形式大致等同。事实上,哲学家的工作之一就是根据事物的本质属性和非本质属性(偶然属性),发现和分类不同的实体。作为人,必须是理性的,理性是人的本质属性。但是,虽然每个人要么有头发,要么秃头,但有头发和秃头都不是人的本质。它既不是充分条件,也不是必要条件,是偶然属性。
现代哲学家们对实体这一概念进行了讨论或质疑。亚里士多德认为,事物由多种实体组成,他通过将质料和形式重新解释为潜能与现实来解释事物的运动与变化的问题。实体是指“是什么”,我们要指称“实体”,必须用到实体的名称,如“人”“书本”“一个人”“一本书”等。笛卡尔认为我们无法从观察中得到实体的理念,因为感知只产生属性。洛克认为,如果我们审视关于实体的想法,就会发现:除了为一系列的属性提供一个假想的支持之外,我们没有其他观念。尽管亚里士多德有关事物本质的思想受到过很多质疑,但至今这一思想仍然影响着包括物品身份确定在内的各个方面。所以我们认为实体本身是人们为了表现属性而构建的。我们用语言来阅读这个世界,用名称来指称我们所构建的实体。
按照辩证唯物主义思想理论所阐述,事物是一种客观存在。我们通过命名,用事物的名称来指称事物,名称本身则是人们构建的一个有意义的,指向实体的概念。当我们说到某一名称时,就在回答“是什么”的问题。如果我们已经对这一名称所指事物有所认识,必然会联想到它的本质属性;如果我们对这一名称所指事物一无所知,我们也不会知道它的本质属性。在实践中一般会把形式当成具有同一性的东西,或者说可以确定其身份的东西,而事物的形式是由它的本质属性决定的,所以对事物的描述则用一系列的属性来实现,可以说事物是一组属性组合决定的,而名称只不过是用来承载属性的。
我们知道,事物处在不断的变化之中,作为实体即“是什么”必须具有同一性,没有这一个“变中之不变”,我们就无法认识事物。事物作为唯一的存在,在任何方面都可以发生变化,但它本身必须在整个过程中保持自身的同一,如果它不保持自身的同一,那么是谁在发生变化呢?因此,不断变化的主体必须具有持久可识别的身份,否则我们就无法谈论该事物。例如,每个人都有自己的姓名和身份证(第一实体),尽管人不断成长变化,但仍会终身保持其法律身份的同一性,否则他就无法对其行为承担责任。又如,再制造过程中被返修的产品,常常也是用原来的产品编码作为身份标识,否则就会出现管理混乱。特修斯之船不论换了多少块木板,组成船的质料虽然不是原来的质料,但船的形式没有变,所以依然是特修斯之船。
现在再来谈谈白马非马问题,多数人认为公孙龙在诡辩。按照亚里士多德的观点:本质属性相同的事物就是同一事物。关键看我们如何定义马的本质属性,如果白色不是马的本质属性,那么白马非马是错误的,但如果白色当作马的本质属性,白马非马就是正确的,事实上,人们不会把颜色当成本质属性,认为白马是马(的一种),所以把白马非马当成是谬论。按照辩证唯物主义的观点,白马是个别,马是一般,白马非马的说法割裂了个别与一般,个性与共性之间的关系。
四、编码的起源和发展
当人类用声音、图式和符号为事物命名和信息交流时,事实上就开始了对事物进行编码和解码,此时声音、图式或符号便与万事万物关联起来,本来无意义的声音和符号便产生了意义。人们用“狗”代表一种动物,用“猫”代表另一种动物,这种表示一开始都是随意的,完全是主观的,并无客观可讲。因此,从广义上来说,声音(口头语言)和文字(书写语言)都是编码,就连手语也是一种编码,结绳表示的图式也是编码,只是当时“编码”这个词尚未出现。人类一开始通过口头语言来表达意义、进行交流,当我们要表示的事物或意义不断增多,口头语言无法表达实现时,便出现了符号和文字(书写语言)。当书写文字越来越多,人们表示的意义越来越复杂时,则会出现同形异义字。人们用有限文字和符号无法精准表示“万事万物”时,便产生了唯一编码的需求。信息论的诞生和计算机的出现,催生并促进现代信息编码技术的发展。现在人们所指的编码是以人或机器能够理解的方式出现的。不论应用什么样的编码系统,在机器系统中最终都转换为二进制的“0”和“1”,由“0”和“1”构成的编码是隐匿在计算机软硬件背后的语言。
“编码”这个词源于秘密通讯,既可以作动词也可以作名词。作动词时,一般与英文词“Encode”相当,作名词时,又与“代码”同用,与英文词“Code”相对应。代码(Code)这个词在日常用语中有非常广泛的含义,常被用来描述任何秘密通讯的方法。秘密通讯大致有三种方法:隐匿法、移位法和替代法。对隐匿法和移位法在这里不作详述。在替代法中又分为两种方法:一种是密码法(Cipher),另一种是代码法(Code)。密码法是指字母层面的替代法,就是每一个字母都以另一个不同的字母、数字或符号来替换,也称为单套字母或符号替代法。代码法指的是单词或词组方面的替代法,让整个单词改由另一个单词或符号替代(替代后的结果称为代码),即使用码字或码词(Codeword)进行加密。密码加密(Encipher)是指用密码法改写信息;代码加密(Encode)则是用代码法改写信息。同理,解译密码(Decipher)是还原以密码法加密的信息,解译代码(Decode)则是还原以代码法加密的信息。代码加密(Encode)又称为“编码”。
但现今“编码”一词的内涵并不仅限于代码加密,而是指一般的信息处理中的信息编码和对事物进行身份标识的物品编码。信息编码包括符号字符编码和机器识别编码。符号字符编码包括为了用计算机对字符、信息、图标信息处理而进行的编码(ASCII码、扩展ASCII码、Unicode码、UTF-8码、GB2312 汉字码、GB18030 码等),以及在通信中对信息进行处理的信源编码(如香农编码、费诺编码、霍夫曼编码等)和信道编码(如线性分组码、卷积码、级联码、Turbo 码和LDPC 码等)。机器识别编码是指为了实现机器识别按照特定的规则而对编码进行的特定转换(一维条码、二维码、RFID 等)。物品编码是指为了方便对各种事物的信息处理而赋予事物的编码。也就是说,信息编码是对信息的编码,物品编码是对物进行的编码。
五、物品编码与物品身份标识
本文第一部分谈到,人们研究认识事物最后形成的是关于该事物的一系列属性组合,人们需要用名称来指称这一事物,而名称需要人们在文字中选择有限长度的组合。人们面对文字有限和长度有限,常常会出现事物太多名称不够用的问题,再加上给事物命名时,又希望能通过名称对事物有所理解,重名问题不可避免。为了解决这一问题,人们开始用编码来唯一指称事物。由于编码的容量大,足够标识世间的事物,又可以方便地用电脑处理,物品的编码便成为物品管理的必备手段。物品编码充当了事物的实体(本体),已成为万事万物的身份标识和物品数字化的基石,它不仅解决了物品是什么的问题,也解决了物品是谁的问题。
物品编码通过一组符号(字母、数字等)与物品本身建立联系(关联),从而使物品拥有唯一标识。编码域是指编码对象的集合以及它的应用域。任何一种编码都与它的应用域关系密切。物品编码与它的编码域(应用范围)有着十分密切的关系,在一个编码域中的编码在其他编码域中一般没有任何意义。所以,按编码域出现了各种各样的编码方案,比如全球统一编码,全国统一编码,系统内部用的编码。
描述物品本身的编码一般称为标识编码,是物品的唯一身份ID 代码。常见的物品标识编码有:零售商品编码、物流单元编码(SSCC)、储运包装箱编码、车辆识别代号(VIN)、车牌号、动物编码等等。物品标识编码的核心功能是唯一标识一类,一簇或一个物品。
表示单个物品所属的种与属的编码则称为分类编码,具体来说,就是根据物品的各种特征属性,将具有相同属性的物品归为一类。物品分类代码就是物品分类的代码化表现方式。常见的分类编码有:产品总分类(CPC)、商品名称及编码协调制度(HS)、联合国标准产品与服务分类代码(UNSPSC)等。物品分类编码的核心功能是唯一表示一个物品所属的逻辑归类。
用于描述单个物品具体属性的编码则称之为属性编码,是对物品属性及属性状态的唯一的、通用的代码化表示。从应用角度看,物品属性编码包括:物品固有属性编码、物品贸易属性编码、物品流通属性编码。物品属性编码的核心作用是描述一类一簇或一个物品。
物品标识编码,物品分类编码和物品属性编码,这三种编码可共同构成对一个具体物品的多层次、全方位描述。下面我们以啤酒为例,通过物品分类、标识及属性编码来对啤酒进行全方位的标识和描述。物品编码体系中啤酒分类、标识及属性编码的示例,如图1所示(见下页)。
图1 啤酒全方位标识和描述
我们可以看到,啤酒作为一个物品的基准名称属于“含酒精饮料(50202200)”这个小类,烈性酒、起泡葡萄酒等基准名称也属于这个分类,也就是一个分类下可以有多个基准名称。其中,每一个基准名称所对应的物品集合都具有相同的属性,如这里的基准名称均具有“含酒精”这一共同属性(共相)。在全球产品分类GPC(版本23)中,就有果酒、啤酒、起泡葡萄酒、烈性酒等一共23个基准名称。
啤酒(10000159)的属性有种类、产地、添加剂、酒精度、颜色、生产日期等,并配备了相应的属性编码。
商品项目编码就是最常见的商品零售单元编码,对应的这就是商品的标识编码。
商品的条码+商品批次编码,对应的就是同一批的具有相同质量的产品。
商品条码+商品序列号,对应的就是商品单品。
六、结语
在讨论物品编码以后,我们采用对话形式来回答本文开头问题:究竟是什么决定了一类/一件物品是这类/这件物品,而不是其它物品。物品本身的身份是由什么决定的?是物品的名称,物品的编码,还是物品的属性?
对话物品
问物品
你是什么?
不就是我的名字吗?
不是,它只是一种假想的标记,人们用它来称呼你。
是我的编码吗?
也不是,它只是你的唯一身份标识,别人方便通过它来寻找你。
你只不过是一组流变的属性组合,名称和编码仅仅跟它们建立了联系。
你的外貌,你的品德,你走过的路,做过的事,会悄悄地成为你的属性,你是通过它们呈现,它们才是真正的你。