APP下载

基于人工神经网络的长三角城市创新能力评价

2024-02-17

中阿科技论坛(中英文) 2024年2期
关键词:权值神经元指标体系

冯 赟

(同济大学经济与管理学院,上海 201804)

党的二十大报告指出,高质量发展是全面建设社会主义现代化国家的首要任务。区域创新在高质量发展中扮演着关键角色。随着各地区域创新步伐的加快,知识、技术、人才等创新要素的集聚,推动了区域创新型科技园区和高新技术产业的发展,为构建现代产业体系提供了重要支撑。区域创新发展增强了国内大循环的内生动力和可靠性,成为推动高质量发展的“倍增器”[1]。

城市创新能力在区域创新能力中具有重要作用。城市具备资源集中和主体多元的优势,使其创新能力具有独特性。尽管存在关于城市创新是侧重于文化等软创新还是技术等硬创新的争议,但普遍认为城市是创新的重要单元,城市创新能力是国家创新能力的重要组成部分[2]。

城市创新能力的评价方法主要包括综合指数法、灰色聚类法、因子分析法和熵权TOPSIS法,其能够针对不同评价目标、主体和标准来确定评价指标权重,并对数据进行处理和计算,最终得出评价结果。然而,这些评价方法在处理非线性问题时可能不够准确和灵活,并在处理大量数据时还可能存在计算量大、效率低的问题,且需要事先确定指标权重和参数。

因此,本文提出了基于人工神经网络的评价方法。这种方法模仿人脑神经元工作机制,能处理复杂的非线性关系,适应数据变化,并能够通过自适应学习来优化网络结构和参数。对于城市创新能力的研究,涉及到由多个子系统的多个指标项组成的复杂系统。因此,将人工神经网络应用到城市创新能力的研究中具有得天独厚的优势。

1 指标体系构建

1.1 构建城市创新能力评价指标体系应遵循的原则

(1)体现内涵,突出目标:城市创新能力反映了科技、经济、社会等领域的创新活动能力和效果,而评价指标体系需要以统计核算体系为基础,再加上综合性指标体现城市创新能力的新概念和内容[3-4]。

(2)全面但不涵盖所有可能性:指标体系应反映科技、经济、社会发展的各个方面,但并非涵盖所有可能的指标。无法量化或数据不易获得的指标可暂不列入。

(3)继承性和创新性相结合:指标体系既不能简单地复制现有的城市创新能力统计指标体系,也不能完全脱离该体系。应在充分利用现有统计体系的基础上有进行发展和创新,以反映城市创新能力的实际情况。

(4)普遍性和特殊性的统一:由于各城市的特殊性,建立通用指标体系困难。由于评价者的知识水平、背景、认识问题的角度、价值观念和对目标的理解存在差异,因此会构建出不同的城市创新能力指标体系。

(5)科学性与现实性的统一:评价指标设计需考虑研究任务与客观现象特性,实现科学性原则,即要求主观要求与客观实际相统一,使评价指标成为反映客观现象的有效工具。为了确保评价指标的科学性和客观性,应遵循“实事求是”的原则,使其定量描述以定性认识为前提。在具体的设计过程中,应注重指标的规范化、标准化和科学化,避免解释的重复和遗漏,确保评价指标的准确性和完整性。

(6)实用性与可操作性:城市创新能力评价指标体系需考虑实用性和可操作性,以便决策者使用。一个实用的指标体系应具备以下特点:易于理解、易于接受、数据易于收集和量化,同时具有评价性和比较性。在反映基本内涵的前提下,选取的指标应尽可能少、避免重复、含义明确,具有现实统计基础,便于使用。

1.2 建立城市创新能力评价指标体系

本文以长三角地区城市为样本,查阅2012—2021年《中国统计年鉴》《中国城市统计年鉴》与国家知识产权局专利数据库,获取27个城市10年的面板数据,共计270个观测样本。遵循重要性、必要性、科学性等原则,在对《中国区域科技创新评价报告》等相关文献以及相关政策进行分析的基础上,构建了城市创新能力评价指标体系。指标体系内容如表1所示。

表1 城市创新能力评价指标体系内容

表2 指标数值优劣程度与所处区间的关系

创新环境是城市创新能力的基础,其涉及到城市的教育、医疗、社会等方面的条件,影响着城市的创新氛围和创新文化。创新资源是城市创新能力的保障,其涉及到城市的科技、资金、人才等方面的投入,影响着城市的创新能力和创新效率。创新产出是城市创新能力的表现,其涉及到城市的专利、产业、经济等方面的成果,影响着城市的创新水平和创新竞争力。

2 基于人工神经网络的评价方法

2.1 RBF神经网络结构和原理

RBF神经元模型如图1所示。图1中,‖dist‖为欧氏距离,用函数式可以表示为:

图1 RBF神经元模型

式(1)中,w为权值矩阵,x为输入向量,权值矩阵元素w1,i的第一个下标参数表示的是权值连接后一层接收目标神经元的编号,第二个下标参数表示权值连接前一层输出源神经元的编号。例如,w1,2表示该元素是从前一层第二个神经元到后一层第一个输入神经元的连接权值。

另外,净运算值n为RBF神经元的中间运算结果,可由式(2)表示为:

RBF神经元模型的输出y为:

式(3)中,,rbf(x)为径向基函数,常见的形式有:

多项式高斯径向基函数或广义径向基函数:

RBF神经网络由输入层、单层隐含层、输出层三层组成,其结构如图2所示。

图2 RBF神经网络的结构原理图

图2中,n1为RBF神经网络隐含层的中间运算结果,可由式(7)表示为:

式(7)中,,diag(x)表示取矩阵向量主对角线上的元素组成的列向量,b1代表第1层神经元的偏置值信息,ones(N,1)指一个N行1列的全1矩阵。RBF神经网络隐含层的输出y1为:

n2为RBF输出层的中间运算结果,可由式(9)表示为:

RBF神经网络的输出y2为:

RBF神经网络中,隐含层节点利用径向基函数对输入信号进行局部响应。当输入信号接近函数中心时,隐含层节点会产生较大的输出,显示出其局部逼近能力。因此,RBF神经网络也被称为局部感知场网络。RBF神经网络的核心是利用径向基函数作为隐含层单元的基,将低维输入数据映射到高维空间,实现低维空间线性不可分问题在高维空间的线性可分。

假设RBF神经网络的输入向量x为R维,输出向量y2为S2维,输入和输出样本的数量为N。该网络的隐含层传递函数由径向基函数构成,通常选用式(4)所示的高斯函数。输入层节点将输入信号传递给隐含层,实现了x →y1(x)的非线性映射,即:

输出层的传递函数采用线性函数,实现了从隐含层到输出层的信号传递的线性映射,即:

2.2 RBF神经网络算法

假设RBF神经网络有N个训练样本,则系统对N个训练样本的总误差函数为:

式(13)中,N为输入输出样本数,S2为RBF神经网络输出节点数,表示在样本p作用下的第个神经元的期望输出,表示在样本p作用下的第k个神经元的实际输出[5]。

RBF神经网络的学习过程分为两个阶段:无监督学习和有监督学习。在无监督学习阶段,主要目标是根据所有输入样本确定隐含层节点的径向基函数的中心向量和标准化常数。这个阶段通过使用均值聚类算法对所有样本输入进行聚类,训练样本集的输入向量被划分为若干个族群,并在每个族群内部找出一个径向基函数的中心向量。选择这个中心向量的依据是它能使该族群内各样本向量与该族群中心的距离最小化。具体步骤如下:

1)初始化各隐含层节点的中心向量,并设定停止计算的误差阈值。

2)计算输入样本与各中心向量的欧氏距离,并找出欧式距离最小的节点:

式(14)中,p为样本序号,r为中心向量ci(p-1)‖与输入样本‖x(p)距离最近的隐含层节点序号。

3)调整RBF神经网络隐含层径向基函数的中心向量:

式(15)中,η(p)是学习速率,,0 <η(p)<1。η(p)=,int (x) 表示对x进行取证运算。式(15)表明经过S1个样本之后,学习速率逐渐减小至零。

4)评估聚类质量。当满足式(16)时,聚类结束,否则转到第2)步。

在隐含层的参数确定后,利用最小二乘法的原则来计算隐含层到输出层的连接权值。当确定后,开始训练隐含层到输出层之间的连接权值。由于输出层的传递函数是线性函数,求解连接权值的问题就转化为线性优化问题。因此,与线性网络相类似,RBF神经网络隐含层到输出层连接权值ωki(k=1,2,…,S2;i=1,2,…,S1)的学习算法为:

由于向量y1中仅有少数元素为1,其余均为0,因此在进行一次数据训练时,仅有少量的连接权值需要调整。这一特点使得RBF神经网络能够快速地学习。此外,当输入向量x远离ci时,会变得非常小,近似为0。实际上仅当)大于某一阈值(例如0.05)时,才会对相应的权值wk i进行修改。经过这样的处理,RBF神经网络同样具备局部逼近网络学习收敛快的优点。

RBF神经网络学习算法的关键在于确定隐含层节点中心参数。常用方法包括直接选取或聚类方法,以下是几种常见的学习算法。

(1)直接计算法:隐含层节点中心在输入样本中随机选取并固定。隐含层输出确定后,求解隐含层到输出层的连接权值,相当于求解线性方程组。

(2)自组织学习选取法:通过自组织学习确定隐含层节点中心,再通过有监督学习确定隐含层到输出层的连接权值。此法采用均值聚类法选择RBF神经网络的中心,属于无监督学习方法。通过学习使隐含层节点中心位于输入空间重要区域。

(3)正交最小二乘法法:其源于线性回归模型。RBF神经网络输出为隐含层神经元的响应参数和隐含层到输出层连接权值的线性组合。所有隐含层神经元的回归因子构成回归向量,因此,RBF神经网络的学习过程主要是回归向量的正交化过程。

在许多实际问题中,需要通过学习获得RBF神经网络隐含层节点中心,以更好地反应训练集数据所包含的信息。

3 模型建立与求解

本文涉及神经网络训练集由仿真模拟得出。在模拟前,需对各项指标数据进行模糊化处理。数据年份为2012—2021年,涵盖27个城市,每个指标有270条数据。计算各指标数据的最小/最大值、第60/70/80/90个百分位数;并将指标数据分为5个区间,用1~5表示指标数值的优劣程度,即数字越大、指标数值越优。对于每一指标的每一区间,随机生成2 000条训练集数据,总共10 000条,将使用这些数据作为训练集。采用MATLAB进行编程,对训练集进行模拟,搭建并训练RBF神经网络。

选择高斯径向基函数作为单一RBF神经网络隐含层神经元的激励函数,并利用newrb函数进行学习。其调用格式为net=newrb (X,T,GOAL,SPREAD,MN,DF)。其中,X为输入数据,T为期望输出数据,GOAL为训练目标,设为0.01;SPREAD为函数宽度,设为2 000;MN为隐含层神经元的最大个数,设为5 000;DF为两次显示之间所增加的神经元数目,设为1。

生成训练集时,各条数据中不同指标的值均随机处于同一优劣程度的区间范围内,如所有指标数值均为“4(良)”。如果一条数据的所有指标数值都处于同一优劣程度区间,那么该数据的综合优劣程度即为各指标数值的优劣程度。

测试集则采用1.2节指标体系所对应的270个样本。使用训练完成的神经网络模型对测试集进行评估,得到对应的评估结果,如表3所示。

表3 长三角各城市创新水平得分

由表3得到以下几点结论。

(1)长三角地区的城市创新能力总体上呈现上升趋势,但各城市之间的差异较大,存在明显的空间分异。从评价结果来看,上海市、杭州市、苏州市、南京市等城市的创新能力较高,属于创新型城市;而安庆市、泰州市、盐城市、扬州市等城市的创新能力较低,属于创新能力待提升的城市。这些差异主要受到城市的经济发展水平、科技投入水平、人才资源水平、政策支持水平等因素的影响。

(2)长三角地区的城市创新能力与城市的规模、地理位置、行政级别等因素有一定的相关性。一般来说,城市规模越大、创新能力越强,这是因为大城市具有更多的人口、资本、信息、技术等创新要素,也具有更强的创新需求和创新动力。城市的地理位置也会影响城市的创新能力,沿海或沿江的城市通常具有更好的交通、通讯、贸易等条件,有利于创新资源的流动和交流。城市的行政级别也会影响城市的创新能力,省会城市或直辖市通常享有更多的政策优惠和财政支持,有利于创新环境的优化和创新活动的开展。

4 结论

本研究文基于人工神经网络,构建城市创新能力评价模型,以长三角地区的27个城市为例,评价2012—2021年城市创新能力。通过模拟训练集和测试集数据,得到准确、合理的评价结果,反映长三角城市创新能力差异和变化。本研究结果可为政府和企业创新决策提供依据,帮助其制定创新战略、优化创新资源配置、改善创新环境、提高创新效率和效果,推动城市经济可持续发展,增强城市竞争力。

猜你喜欢

权值神经元指标体系
一种融合时间权值和用户行为序列的电影推荐模型
《从光子到神经元》书评
CONTENTS
跃动的神经元——波兰Brain Embassy联合办公
层次分析法在生态系统健康评价指标体系中的应用
供给侧改革指标体系初探
基于权值动量的RBM加速学习算法研究
基于二次型单神经元PID的MPPT控制
毫米波导引头预定回路改进单神经元控制
测土配方施肥指标体系建立中‘3414