论城市治理的“数据本体”及界面文化建设
2020-10-19□倪钢
□倪 钢
一、“数据本体”及其方法论意义
(一)“数据本体”问题的提出
城市管理从行政模式转向治理模式,其转变过程反映了城市问题和管理策略的复杂变化。简言之,这一转变与一系列的“化”分不开。例如,城市管理过程中的信息化、数据化、智能化、集成化、网络化、民主化等,这些“化”的过程即是城市治理的技术性内容。城市治理面对各种类型的数据,这些数据的认知理解及分析处理面对诸多困境及难题。从认识论角度看,数据可分为客观的数据、主观的数据、隐性数据、显性数据等;从研究的角度看数据可分为定量数据、定性数据、微数据、一般数据、大数据等;从模型建构角度看,数据可简单分为记录性数据、描述性数据、属性数据、关系数据、模拟数据、逻辑结构数据等,但是,这些划分不具有绝对性,数据类型的划分必然涉及“数据本体”问题。对于城市治理而言,城市治理过程的数据信息处理,数据的本论论及结构性的认知解释成为一种理论前提。城市治理的实践表明,城市数据的可视化既是研究者的工作内容,也是城市管理者的工作任务。对于普通民众而言,城市数据的观察和体验成为学习、工作及生活的组成部分。当下学术领域,学者们广泛探究面向智慧城市建设的大数据、物联网及云计算等问题,数据的客观化和主观化过程成为智慧城市及数字城市建设研究的重要课题[1]。
基于自然界、人类社会和思维的数据世界是数据本体论探索的前提条件和基础,因此,自然、社会及思维本体的研究也成为“数据本体”的前提和基础。数据本体论探究需要考虑三个前提条件:一是数据世界成为科学研究和实践探索的重要对象;二是数据分析及大数据研究范式成为跨学科的理论工具;三是人类思维及研究范式也开始数据化。实际上,“大数据分析”不只是严格的模型逻辑的展开过程,也是人类的理性能力发挥及方法选择的过程。
从技术层面看,智慧城市建设的过程就是数据化、信息化、知识化、理论化、智慧化的过程。数据成为人类实践操控的对象,数据、信息、知识与人类的认识互动,数据成为智能的因素。大数据分析专家舍恩伯格等人提出“大数据时代”概念,事实上,这个概念已经无法概括新时代飞速发展的技术性内容。大数据、人工智能、量子计算机、量子纠缠、3D打印等等,这些与数据相关的科技因素共同成为新时代的表征。总之,“数据本体”成为理论与实践探索研究的重大课题。
(二)“数据本体”概念解释
数据本体论既是跨学科问题,也是信息哲学、科学哲学等学术领域的基本问题。哲学的本体概念大致有以下几种解释。第一,世界的终极存在;第二,世界的本源或起源;第三,事物的本质结构;第四,某种对象的基本实在物;第五,某种研究的基本模型;第六,某种理论的最基本的抽象概念;等等。在某种场合,哲学的本体概念解释也适用于数据本体概念,但是,并不存在哲学本体概念和数据本体概念的完全同一的机制或条件。一般地说,信息科学或计算科学领域的本体论不同于哲学本体论。Neches等在人工智能研究过程中定义了数据本体概念。他们认为本体是“给出构成相关领域词汇的基本术语和关系,以及利用这些术语和关系构成的、规定这些词汇外延的规则的定义”,这种定义模式也成为本体代数学的重要内容[2]。
计算机科学及人工智能等研究领域的数据本体概念普遍存在。西方学者Hearst、Buitelaar、Amsler、Fisher、Stephens等从人工语言、语言学分析与标注、矢量聚类方法、词汇关联度等视角考察了数据本体论的定义和概念性问题。基于网络及语义Web 的产品信息建模的观点,学者们建立了对象封装、中间件、产品信息模型、层次化结构等方面的本体理论,实现了产品信息语义一致性,增强了模型可操作性。
科学语境的本体论认为本体构素包含概念、本质、属性、案例或说明等要素,本体论也必然涉及“过程”“关系”“功能”及“意义”等本体性因素。事实上,数据科学或信息科学领域的本体论也包含了过程性、功能性、关系性及意义性的内容。简言之,科学语境的“本体”涉及三种情况。一是自然物体或物质实体成为本体;二是研究的概念模型、理论框架成为本体;三是研究逻辑体系或主客体关系成为本体。
(三)“数据本体”研究的意义
目前,人们对于“大数据”及“数据分析”等概念并无统一性的理解,在信息科技及计算机技术相关的研究领域,“数据本体”被赋予不同的意义,但一些研究成果混淆了一般性数据分析过程和大数据分析过程,究其原因,主要是没有了清晰界定数据本体概念。同时,一些研究成果运用了大数据分析的模型,但是,缺少前提和假定条件的解释和说明,究其原因,也是没有明确数据本体的对象性能指和所指。“数据本体”成为大数据分析过程的制约因素。
实际上,“数据本体”在数据分析处理过程中的意义。首先,它具有梳理和澄清意义。在数据本体探究的过程中,研究者可以在概念方面和实践领域澄清不同领域使用的数据或数据本体概念的内涵和外延。其次,它有助于概念限定和精确解释。数据本体论探究可以帮助研究者确立清晰的问题意识,使用严格的概念术语,规范研究过程及表达内容。再次,它为具体的数据分析过程提供逻辑和理论依据,它也为不同类型的数据分析的相关研究界定边界。最后,它为一切形式的数据分析提供方法论。实际上,“数据本体”的定义和解释过程通常是和研究设计及逻辑框架结合在一起的,明确的“数据本体”概念界定和解释表征着研究过程的合理性和科学性。
在管理实践过程中,“数据本体”的方法论功能十分明显。例如,商业领域的大数据分析模型被拓展到教育、医疗及公共管理的领域,产生经济和社会效益。在政府信息化、交通智能化、城市管理数字化的过程中,“数据本体”概念应用于城市管理过程和公共文化的技术服务过程,基于信息技术的公共文化呈现“界面化”样态,“界面文化”也创造了新的文化本体[3]。
“数据本体”问题探究有助于分析和解决某些具体的理论及现实问题。例如,在城市治理领域,“数据本体”概念及意义的深度探究不仅提供了数据分析的理论原则和依据,也拓展了研究语境和理论空间。数据及其应用主体之间、计算处理过程、分析过程、人机关系等方面的协同管理问题研究,揭示某种大数据分析模型的方法论意义[4]。
二、“数据本体”的建构论解析
(一)“数据本体”自然生成论与建构论
“数据本体”概念的生成和社会应用过程揭示了自然、社会及思维领域的各种矛盾展开过程。一方面,数据世界本身蕴涵着极其复杂多样的数据现象和数据过程,这些现象和过程导致客观化的自在的数据本体;另一方面,自在的数据本体与主体相结合,基于主体的意向性和创造性,自在本体转化为目的性本体。简言之,“数据本体”既是自然创造出来的,也是基于人类理性建构出来的。面向城市治理过程的数据本体论研究表明,城市治理过程涉及的“数据本体”主要是建构论语境下的本体。因此本文着重讨论这种基于人类理性的建构论的数据本体。
(二)“数据本体”建构论的哲学认识论分析
基于哲学认识论的观点,“数据本体”相关的实践过程与客观世界的自然过程是统一的。一方面,自然过程及其规律是制约“数据本体”的根本法则;另一方面,人类理性发挥及创造精神决定着“数据本体”运用的可能性。科学研究和学习过程越来越复杂,人脑和外部世界的联系更加精致和深入。图1反映了人类学习过程和科学研究的一种过程性描述,这种描述也说明了人类面向未来的科学研究和学习目标。例如,大数据的描述、解释、分析和应用成为科学探究的核心任务之一。大数据理论观点和技术应用的过程并不能取代非数据思维和传统意义上的学习研究过程。自然、人类社会、实践和工程技术过程一起完成社会性智慧活动。
图1 从数据到理论设计——数据本体建构过程
(三)“数据本体”建构论的实证性分析
大数据理论及分析技术的发展过程充分显示了“分析模型建构”与“数据分析”之间的紧密关系。大数据分析过程揭示了主观世界和客观世界的对立统一过程。数据分析过程的“数据本体”建构方法成为十分专业的问题。例如,斯坦福大学的学者们提出的“领域本体构建七步法”列出了本体建构过程的思考方向和进路。斯坦福大学这个本体建构模型揭示了数据分析领域的本体论与概念之间的密切关系,同时,也揭示了本体世界与现实世界之间的联系。具体而言,“领域本体构建七步法”包括“确定本体的专业领域”“考虑已有本体的重用”“列出本体中重要术语”“定义类及类等级体系”“描述定义概念的属性”“定义属性的取值范围”“依据概念来创建实例”等七步。其中,“专业领域”“重要术语”“概念属性”“取值范围”“建构案例”等核心概述,一方面展示了“七步法”建构本体的基本过程,另一方面说明本体建构过程与人类理性的密切关联。
人工智能领域的大量案例说明了本体建构的具体过程。人工智能技术的核心是计算方法和逻辑结构设计,领域本体建构是人工智能科技的基础性工作。基于数据本体论的观点,人工智能的硬件和软件融合成为创新功能的智能体系。例如,在围棋体育比赛的发展过程中,出现人类无法战胜的人工智能机。人工智能Alpha go、星阵等人工智能平台工具在若干次博弈实验过程中,全面碾压人类棋手,震惊世界。人工智能机与人类的围棋博弈结果体现一种对立统一过程。一方面,人类创造了人工智能机,人工智能机也不过是人类的工具;另一方面,人工智能机的某些功能超过了人类本身的计算和思考能力,人工智能机可能成为人类无法战胜的对象。围棋人工智能机也促进人类反思人类本身的理性能力,促进了人类智慧的提升。
从本体建构的角度看,人工智能技术提出了探究人类理性能力的哲学问题,这类问题的探究不仅可以促进哲学研究的深化,也可以促进计算科学的拓展和深化。人类在各领域的科学技术活动中,由于大量复杂和巨量数量计算的需要,促进超大超强计算机的制造和使用。超级计算机在速度、容量、价格、耗能、占用物理空间等方面不断变化,伴随这种变化过程,数据和信息量爆炸式增长,并进一步引发大数据时代的技术创新和社会变革[5]。
数据处理技术进步改变了人类创造和应用知识的历史,知识的创造和应用的历史也不断改变人类的数据本体意识。例如,在数据本体的量化计算方面,信息量的基本单位是比特(bit),比特表示二进制的0 或1 状态,即消除不确定性的一种最简单的信息状态,因此,所有信息的极简本体即是比特。根据计算机科学相关设计及技术处理方法,基本逻辑设计,数据的体量级别大致排列为:Bit、Byte、KB、MB、GB)、TB、PB、EB、ZB、YB、BB、NB、DB、CB、XB等。2016年有人预测说2020年人类的数据量是ZB 级别,事实上2020 年全人类的数据量可能已经远远超过了YB 级别(如图2 所示)。中国历史上的《永乐大典》《四库全书》等著作的制作过程几乎耗尽当时国家的学术精英们的智力和精力,最后提供的成品不过是几部或几万册,几亿字的《四库全书》的数据量在当下看来,只能算普通的数据量,远远没有达到大数据的尺度。人类对于“数据本体”的建构及相关数据处理过程导致“数据爆炸”或“数据突变”,并且导致人类生产和生活方式的变革创新。数据本体的量化分析也改变了人类的知识观和历史观。
图2 新千年以来数据渐变到突变 数据单位:ZB
三、基于“数据本体”建构论的城市界面文化建设
(一)城市界面及数据界面
城市界面可以理解为融合自然、社会、人类思维等内容的可视化的载体和平台。综前所述,包括城市治理过程在内的人类社会以自然方式或人类建构的方式生成各类“数据本体”,无穷无尽的数据本体构成人类社会及每一个城市的数据体系,这个体系又借助于各类载体和媒介体现为复杂多样的数据界面。城市界面是人类实践与认识过程的中介,是社会生活的实体化及虚拟化的场所,是实在与虚在交互的时空节点,是以城市社区及各种物质设施为依托的时空领域,是基于技术创造过程的文化生成、创造、传播的容器和媒介,是基于IT和数据网络的可认识理解的世界的表面或边界。城市数据界面即是包括或蕴涵城市数据及相关符号或信息的城市界面(如表1所示)。城市数据界面蕴涵丰富的自然信息及人类语言信息,语言界面及网络符号的本体论也引起各界学者的重视。例如,语言学家克里斯特(Crystal)详细讨论了基于网络技术的界面语言及网络符号的本体论问题,此类研究为城市数据界面本体研究提供了语言哲学方面的依据[6]。再如,美国学者伯格曼(A.Borgmann)比较详细地研究新千年以来信息本体及其本质的演变过程,虽然国外学者的理论基础也存在各种问题,但是其研究的方法和手段也可以为城市界面文化的分析提供某些借鉴[7]。
表1 城市数据界面定义类型及解释
(二)城市治理过程涉及的“数据本体”
如前所述,面向城市治理的数据本体论研究为具体的城市治理提供方法论依据。从技术角度看,知识和数据本体经历了以下几个历史阶段:一是生物本能阶段。人和动物感知能力、原始的心理世界、原始符号世界的生成和演进。二是语言文字阶段。人类语言和文字符号的生成和演进。三是信息文化传播阶段。印刷术、传播术及教育技术的形成和演进,通信和媒体技术的生成和演进。四是数字化阶段。计算机和数字技术的生成演进。五是大数据和人工智能阶段。现代通信、网络、大数据分析及人工智能技术的生成和演进。在知识和技术的历史进化过程中,与不同阶段相对应出现了不同的信息本体或数据本体类型(如表2所示)。城市治理过程涉及的大量“数据本体”也可以在类型分析的基础上获得进一步的解释和说明。
表2 数据本体类型及其特征描述
(三)基于“数据本体”建构论的城市界面文化建设
基于“数据本体”建构论观点,可以进一步讨论城市界面文化建设的目标、任务和原则。城市数据界面研究的任务和目标是多方面的,一般而言,城市数据界面研究涉及复杂多样的问题。例如,城市数据界面建设的意义、目标、任务、计划、项目、过程、工作、操作、管理、技术、人员、评价、功能、社会性、人文、审美等方面的问题。城市数据界面建设包含复杂多样的具体内容,需要原则性指引。
首先,基于“数据本体”的理论,深度考察治理理念。这主要是要体现城市数据理念及其落实方法,从不同理论和现实的要求以及建设过程中涉及的科学技术和社会性问题,确立一些理念,并使这些理念成为原则,体现某些“化”的原则,如:生态化、社会化、现代化、审美化、艺术化、功能化、个性化、区域化、民族化、大众化、国家化、意识形态化、时代化、创新化、操作化、感性化、介质化、传媒化,等等。遵循自然法则和生态性原则。在数据体系建设、展示和传播过程中体现生态意识和绿色理念,运用科学技术的知识和方法推动公众对城市数据界面的认知理解。尊重数据界面建设的客观规律,体现不同类型数据界面建设的特殊性。数据界面建设的安全性、整洁性和技艺性是普遍性的特点,在各类数据界面的建设中都应该有所体现。不同类型的数据界面建设也要体现不同的特点和原则。社会活动性交互界面着重体现舒适、安全、互动和人本设计;实践活动或组织管理界面着重体现目标引导、个性彰显、社会服务、价值实现,获得感表达、文化体现,品牌传播、产品服务展示、共同体验、公平分享和技术创新。
其次,突显城市界面的区域性内容。这主要是突显城市的区域性特点,包括城市环境及其文化传统等内容。城市数据界面建设要体现艺术规律和美学规律。客观化的数据界面和主观的数据界面建设都需要艺术规律和美学规律的指导。界面设计要有一些特别性的指导原则,例如,“无”原则。即无冗余边界、无缝隙、无死角、无漏洞、无空白,等等。城市数据界面的设计和展示要突出城市的整体性、统一性和协调性,努力实现自然界面、社会界面、实践活动界面的整合统一。
再次,以数据理性为引导,规范城市界面文化。如:规范数据界面的广告行为,对公共领域的数据界面进行符合社会主义核心价值观的意识形态引领。
最后,建构传播正能量意识形态的数据界面体系。这主要要求以社会主义核心价值观为引导,消除数据界面的不良信息,严格控制数据信息界面的不良行为,禁止阴暗、消极和危险性数据信息的展示和传播。
运用“数据本体”思维方法促进城市界面文化建设。建立数据理性和数据思维,完善数据文化建设的理念引导,强化“数据意识”或“数据思维”等理念。在具体行动方面,增强城市公民的数据技能相关的教育和培训。面向“计算”的城市界面文化建设是一种具体而实用的建设路径,例如,计算意识、计算理论、计算科学、计算方法、计算模型、计算分析等知识和技能培训学习,这类培训学习是城市界面文化建设不可或缺的活动过程。