从改善计算机系统内部性能谈算法相关发明专利申请的审查
2016-02-27邹斌
邹 斌
从改善计算机系统内部性能谈算法相关发明专利申请的审查
邹 斌★
本文结合典型案例,对涉及机器学习的算法相关发明专利申请是否必然属于改进计算机系统内部性能的技术方案,如何判断一项解决方案能否使计算机系统的内部性能得到改进,在创造性评判过程中如何考量算法特征在整个方案中的作用等问题略抒己见。
机器学习 改进内部性能 计算机程序 算法
一、引 言
《专利审查指南》(2010版)规定:如果涉及计算机程序的发明专利申请的解决方案执行计算机程序的目的是为了改善计算机系统内部性能,通过计算机执行一种系统内部性能改进程序,按照自然规律完成对该计算机系统各组成部分实施的一系列设置或调整,从而获得符合自然规律的计算机系统内部性能改进效果,则这种解决方案亦属专利保护的客体。据此,对于结合计算机技术的算法相关发明专利申请,如果其解决方案能够使计算机系统的内部性能得以改进,则这种解决方案属于专利保护的客体。
在涉及计算机技术的算法中,有关机器学习的算法具有典型性。机器学习是专用于研究计算机怎样模拟或实现人类的学习行为,重新组织已有的知识结构使之不断改善自身性能。那么,如何判断一项解决方案能否使计算机系统的内部性能得到改进?涉及机器学习的算法相关发明专利申请是否必然属于改进计算机系统内部性能的方案?在创造性评判过程中又如何考量算法特征在整个方案中的作用?笔者拟结合一些实际案例略抒己见。
二、机器学习的相关概念
机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习的理论基础包括心理学、生物学和神经生理学以及数学、自动化和计算机科学。机器学习是人工智能的核心,其应用遍及人工智能的各个领域。例如,专家系统、认知模拟、规划和问题求解、数据挖掘、网络信息服务、图像识别、故障诊断、自然语言理解、机器人和博弈等。
更为重要的是,机器学习涉及多种算法,例如回归、贝叶斯、人工神经网络、聚类、关联学习算法等。在教导计算机进行学习的过程中,其通过优化各种学习算法来提升计算机的学习能力。当计算机具备一定的学习能力后,即可用来解决诸如故障诊断、疾病诊断、图像识别、博弈等领域的具体问题了。
三、浅析涉及机器学习的算法相关发明专利申请的审查
(一)案情介绍
1.背景技术
在现有技术中,诸如线性回归/判别、SVM/SVR以及RVM的算法被称为用于执行回归或判别的学习算法。SVM代表“支持向量机”、SVR代表“支持向量回归”,以及RVM代表“相关向量机”。现有技术的方法使用诸如线性回归、非线性回归、SVM的学习算法、自动生成用于从内容数据检测特征量的特征量检测算法。
现有学习算法接收特征量向量x={x1,…,xm},并通过机器学习生成估计函数f(x)=∑wmφm(x)+w0,其中,用于输出标量的基函数φm(x)(m=1到M)被线性地组合。具体地,当给定特征量向量xj(j=1到N)和目的变量tj时,获得估计函数f(x),其用于从特征量向量x估计目的变量t的估计值y。
在线形回归/判别的情况下,使用模型φm(x)=xm。因此,如果在所给定的特征量向量xj和目的变量tj之间存在非线性,则难以基于该模型通过估计函数f准确地拟合一组特征量向量xj和目的变量tj。即,降低了估计函数f的估计准确性。另一方面,在SVM/SVR或RVM的情况下,使用具有φm(x)作为非线性核函数的模型。因此,即使在所给定的特征量向量xj和目的变量tj之间存在非线性时,也可以基于该模型通过估计函数f准确地拟合该组特征量向量xj和目的变量tj。由此获得能够从特征量向量x准确地估计估计值y的估计函数f。
然而,计算通过SVM/SVR或RVM获得的估计函数f(x)所需的计算量大于计算通过线性回归/判别获得的估计函数f(x)所需的计算量。另一方面,如果在特征量向量xj和目的变量tj之间存在非线性,则通过线性回归/判别获得的估计函数f的估计准确性小于通过SVM/SVR或RVM获得的估计函数f的估计准确性。由此,期望提供一种可以生成在保持估计准确性的同时进一步降低计算量的估计函数的信息处理方法和信息处理设备。
2.实施方式
图1描述了能够实现该学习算法的信息处理设备100的功能配置。如图1所示,信息处理设备100主要由数据输入单元101、基函数生成单元102、存储单元103、基函数计算单元104、估计函数生成单元105以及函数输出单元106构成。估计函数生成单元105包括机器学习单元1051和基函数评估单元1052。这些单元分别用于实现实审学习算法的各个步骤。
图1
3.权利要求
1.一种信息处理设备,包括:
输入单元,用于输入特征量向量和与所述特征量向量相对应的目的变量;
基函数生成单元,用于生成通过对所述特征量向量进行映射来输出标量的基函数;
标量计算单元,用于使用由基函数生成单元生成的基函数来对所述特征量向量进行映射,并计算与特征量向量相对应的标量;
基函数评估单元,用于使用由输入单元输入的目的变量连同由所述标量计算单元算出的标量以及与所述标量相对应的特征量向量,评估用来计算所述标量的基函数对于估计所述目的变量是否有用;
估计函数生成单元,用于使用由所述基函数评估单元评估为有用的基函数、基于由所述标量计算单元算出的标量和与所述标量相对应的目的变量,通过机器学习来生成用于从所述标量估计所述目的变量的估计函数;以及
输出单元,用于输出由所述估计函数生成单元生成的估计函数。
……
6.一种信息处理方法,包括:
输入特征量向量和与所述特征量向量相对应的目的变量;
生成用于通过对所述特征量向量进行映射来输出标量的基函数;
使用所述基函数对所述特征量向量进行映射,并计算与所述特征量向量相对应的标量;
使用所述目的变量连同所述标量以及与所述标量相对应的特征量向量,评估用来计算所述标量的基函数对于估计所述目的变量是否有用;
使用被评估为有用的基函数、基于所述标量和与所述标量相对应的目的变量,通过机器学习来生成用于从所述标量估计所述目的变量的估计函数;以及
输出所述估计函数。
(二)案例分析
1.关于是否属于保护客体的判断
该案“背景技术”部分提到的“线性回归/判别、SVM/SVR以及RVM算法”均为机器学习的常用学习算法。同时,“背景技术”部分还记载了“通过SVM/SVR或RVM获得估计函数的计算量大于通过线性回归/判别获得估计函数的计算量;如果特征量向量和目的变量间存在非线性,则通过线性回归/判别获得估计函数的准确性小于通过SVM/SVR或RVM获得估计函数的准确性”。由此,该案属于涉及机器学习的算法相关发明专利申请,其所要解决的问题是“提供一种估计函数生成方法,在保持估计准确性的同时降低计算量”。从其发明目的可以看出,该解决方案是对机器学习涉及的学习算法进行的优化和改进。那么,“背景技术”部分提及的“提高准确性、降低计算量”之类的改进目标,能否作为改进计算机系统内部性能的直接判断依据?
就该案权利要求1和6请求保护的方案而言,其解决方案可概括为:输入目的变量,生成基函数,使用基函数进行映射并生成标量,使用目的变量、标量、特征向量来评估基函数是否有用,使用有用的基函数来生成评估函数,输出评估函数。虽然在权利要求1和6记载的方案中包含有“通过机器学习来生成用于从所述标量估计所述目的变量的估计函数”这样的特征,并且由上述权利要求记载的方案可知,该方案由通用计算机设备来实施,但是,方案中提及的“机器学习”仅仅是其中某函数的实现手段。此外,上述解决方案在计算机上运行各计算步骤的目的仅在于获得估计函数,在利用计算机实现各计算步骤的过程中,方案中的算法特征与计算机系统内各组成部分之间不存在任何技术上的关联,在计算机上运行该函数生成算法不会使计算机系统内各组成部分在设置或调整方面有何技术上的改进。在上述解决方案中,计算机在方案中仅充当估计函数生成算法的执行载体,该解决方案所要实现的“提高准确性、降低计算量”的效果,是通过改进估计函数生成算法直接获得的,而并非直接作用于计算机系统的内部结构,通过对计算机系统各组成部分的一系列设置或调整,来实现计算机运算性能的改进。换言之,执行各类简单或复杂数学算法是通用计算机的固有性能,该申请的解决方案并非旨在使原本不能运行数学算法的计算机具备新的处理能力,而是仅仅利用计算机固有的数据运算能力来执行估计函数的改进算法。由此,权利要求1和6记载的解决方案仅涉及对估计函数生成算法的优化和改进,与计算机内部结构并无特定关联,这种运算效率的改进类似于数学简化方法带来的改进,与使用何种设备无关。因此,该案请求保护的解决方案不属于改善计算机内部性能的技术方案。
综上所述,当从能否改善计算机系统内部性能的角度来判断算法相关发明专利申请是否属于保护客体时,关键在于判断方案中的算法特征与计算机内部结构的设置或调整等方面是否有技术上的关联,只有在这种特定技术关联上作出的改进,才被认为是给计算机系统内部性能带来的改进。如果一项解决方案仅涉及对数学算法进行优化,改进的是数学算法本身,与计算机内部结构并无特定关联而仅将通用计算机作为算法的执行工具,那么该解决方案不属于对计算机内部性能的改进方案。
但是,一般来说,如果权利要求记载的方案中包含技术特征并且该技术特征能够在方案中存在上述客观作用,则包含该技术特征的方案因该客观作用的存在,会使方案整体上解决该客观作用所带来的技术问题并获得该客观作用所产生的技术效果。据此,上述权利要求1和6记载的方案中至少包含了可用于执行估计函数生成算法的通用计算机设备,其客观上使方案在整体上解决了利用计算机自动化执行数学运算的技术问题,并可以相应地获得该自动化运算所带来的提高运算速度和精度的技术效果,因而,通常情况下不会将其排除在专利保护的客体之外。但是,能够完成数学运算的通用计算机在现有技术中已普遍存在,对于这种仅将计算机系统作为算法执行载体的解决方案,其与现有技术的区别仅在于算法特征部分,而对算法特征的调整和改变不会给方案的创造性带来技术上的贡献。
2.在创造性评判中对算法特征的考量
虽然权利要求1和6记载的解决方案涉及能够实现该估计函数生成算法的信息处理设备,但是本领域普通技术人员知晓这种能够完成数学运算的信息处理设备在现有技术中已经被公开,即我们熟知的通用计算机。通过简单检索即可确定,该权利要求记载的方案与现有技术的区别仅在于所述估计函数生成算法的各个步骤,即输入目的变量,生成基函数,使用基函数进行映射并生成标量,使用目的变量、标量、特征向量来评估基函数是否有用,使用有用的基函数来生成评估函数,输出评估函数。上述估计函数生成算法本质上只是一种运算规则,并未涉及任何具体技术领域,其在整个方案中所起的作用也只是按照方案当前记载的步骤生成特定的函数,并非要解决技术问题,该申请所体现出的智慧贡献也仅反映在函数的构造算法上。换句话说,所述算法特征与计算机各单元之间的配合关系和现有技术中通用计算机各装置与一般计算机程序之间的配合关系并无本质上的差别,对计算机内部性能也没有产生可以运行所述计算机程序之外的新的影响,亦即在该方案中通用计算机只是作为执行所述算法或计算机程序的承载工具存在,二者之间并不存在其他的技术上的关联。因此,对于上述信息处理设备(或通用计算机)而言,运行此估计函数生成算法与执行其他一般的计算机程序或进行一般的数学运算并不会使此通用计算机有任何不同。
权利要求1和6所请求保护的解决方案实质上只是一种运行了特定算法的通用计算机和用通用计算机运行的特定算法,其只是对数学算法本身作出了改进,由于对数学运算方法本身的改进仅仅是人们对算法规则的调整与改变,其在权利要求的技术解决方案中解决的仍然是数学运算上的问题,而没有解决任何技术问题,因此,对权利要求的解决方案没有作出技术性贡献。从整体上看,该案权利要求1和6请求保护的解决方案不具备创造性。
四、浅析对改善计算机系统内部性能的理解
对于在通用计算机上运行数学算法的相关发明专利申请而言,在判断其解决方案能否改进计算机系统的内部性能时,重点在于判断方案中的算法特征与计算机系统的内部结构之间是否存在特定的技术关联,在这种特定技术关联上作出的改进才被认为是对计算机系统内部性能带来的改进。在判断能否使计算机系统内部性能得以改进的过程中,要清楚辨别计算机系统在解决方案中的实际作用。如果计算机系统仅作为算法执行的载体,那么不能认为该解决方案能够使计算机内部性能得以改善。
体现计算机系统内部性能的主要指标可包括:运算速度、字长(计算机在同一时间内处理的二进制位数)、内存容量(主存)、外存容量(硬盘)、外部设备的配置及扩展能力、软件配置等。当一项涉及算法的解决方案,其算法特征与计算机系统的内部结构有某种特定的技术关联,基于这种特定的关联,通过对算法进行优化,使计算机系统的上述性能指标得到改进和提升,那么该解决方案构成技术方案,属于专利保护的客体。
我们来看如下权利要求记载的方案:
一种提高非易失性闪存芯片使用寿命的方法,其特征在于,包括如下步骤:
将非易失性闪存芯片中的数据块B1ock划分到动态存储区与静态存储区,并在设定的条件下,动态存储区与静态存储区区域转换,从而达到读写次数的均衡;
由一个参数Ei来确定每个数据块B1ock是为动态存储区或为静态存储区,Ei=αXi/(∑Xi/n),其中,B1ocki为第i(i为正整数)个数据块B1ock,Xi为B1ocki的擦除次数,n为数据块B1ock的总数,α为可设置的参数;
根据需求设定一个临界值,当Ei大于这个临界值时,则B1ocki为动态存储区,当Ei小于这个临界值时,则B1ocki为静态存储区。
上述示例的权利要求中记载了计算公式以及公式涉及的每个参数,但是,我们不能因为方案中存在这些计算规则就断言其不属于保护客体。对于上述解决方案而言,其设定计算公式及相关参数的目的是为了让计算机运行该算法时可以自动调整非易失性闪存芯片中的动态存储区与静态存储区,以便使读写次数均衡,从而延长芯片的使用寿命。显然,该解决方案执行上述算法的目的是为了提升计算机系统内部的读写性能。此外,虽然闪存芯片的结构并未发生改变,但是方案中记载的用于确定数据块是动态存储区还是静态存储区的算法与闪存芯片的读写部件和擦除操作在技术上存在关联。同时,计算公式中的各个参数具有实际的物理含义而并非简单的数值运算,具体而言,Ei是用来确定数据块是动态存储区还是静态存储区的参数,Xi为Blocki的擦除次数,n为数据块Block的总数,α为可设置参数。当通过计算机系统运行该算法时,存储芯片会按照该算法来对数据块的擦除操作进行控制,对动态存储区和静态存储区的划分进行合理调整,从而获得读写次数达到均衡的改进效果。综上所述,该解决方案属于能够使计算机系统内部性能得以改进的技术方案,属于专利保护的客体。
五、小 结
对于在通用计算机上运行算法的相关发明专利申请,特别是涉及机器学习的算法相关发明专利申请,在判断其解决方案能否使计算机系统的内部性能得到改进时,审查的重点在于判断方案中的算法特征与计算机系统内部结构之间是否存在特定的技术关联,只有在这种特定技术关联上作出的改进,才被认为是给计算机系统内部性能带来的改进。
对于通过优化算法来改善计算机系统内部性能的技术方案,在撰写专利申请文件时,应当在权利要求中体现算法与计算机技术参数、结构部件、内部资源等的具体结合,体现该算法在整个方案中发挥的技术作用。例如,如果发明请求保护一种涉及提高硬盘访问速度的方法和设备,其解决方案为通过改进硬盘数据的读取和写入算法来提高数据访问速度,那么在撰写权利要求时,不但要在权利要求中记载算法的具体实现步骤,还要记载与硬盘数据读写相关的技术内容,更要写明该算法与计算机硬盘读写部件或读写操作在技术上的配合、影响或作用,以体现出计算机系统因读写算法优化而使其访问速度更快的内部性能改进效果。
《专利审查指南》(2010版)中规定:权利要求中记载了技术特征,就不属于智力活动的规则和方法。有时为了回避客体问题,申请人会在权利要求中特别记载用于执行算法的某些硬件,例如,计算机、输入/输出设备等。但是,如果这些算法的执行工具是现有技术中已知设备,并且这种设备仅作为运行算法的载体被加以利用,那么如此撰写的解决方案其本质仍然是对算法规则的调整与改进,这样的权利要求所请求保护的方案会因不具备创造性而无法获得专利权。
综上,本文结合审查实践中遇到的典型案例,浅析了对于与计算机技术相结合的算法相关发明专利申请的客体判断原则,为准确判断能否给计算机系统内部性能带来改进提供了角度和思路,对算法相关发明专利申请的撰写提出了建议,以期从审查的视角,为算法相关发明专利申请的代理实务提供一点帮助。
国家知识产权局专利局电学发明审查部。