论算法的法律保护模式
2019-10-08孙建丽
孙建丽
(对外经济贸易大学 法学院,北京 100029)
人工智能技术快速发展的同时,算法亦被广泛运用于电子商务等各大领域。然而,当前算法技术的发展速度已经超越了法制革新的步伐,以致现有立法对算法的保护性规制无法与之匹配。虽然算法在实务中被竞相运用,但从发生学角度而言,其在我国仍属新生事物。该研究由于受高度专业性和技术性限制,目前国内法学领域罕有学者对算法的保护模式展开相应探究。另外,算法自身演进的阶段性,尤其是高阶算法的难以预测性和不可控性,使得对算法的探讨变得更加困难。在算法技术应用愈发普及的当下,应该采用何种法律模式对算法施以保护,是值得关注的重点问题。
在国内算法法律保护模式理论研究尚属空白且远未形成体系化的当前,确有必要以他国为鉴。然而,截至目前,即使算法技术和立法理念均较先进的美国对该问题亦无定论。事实上,美国国内现有两种观点,一种主张采用专利模式给予算法保护,另一种主张采用商业秘密模式给予算法保护。究竟何种法律保护模式在理论上更具优势,还有待进一步分析。虽然目前我国算法技术在国际上尚处跟跑阶段,但仍需立法对算法的法律保护模式及时作出明确规定。通过对美国算法保护模式的利弊归结,我国可在借鉴的基础上,根据国内算法发展的特点和现状进行一定程度的创新,进而建构出符合国情发展的分阶算法保护模式。
一、算法的专利保护模式分析
究竟该对算法采用何种法律保护模式?人工智能技术遥遥领先的美国曾一度对算法的保护模式展开过积极探讨。在Mayo v.Prometheus案发生之前,美国法院曾认为算法虽然隶属抽象观点范畴,但依然应当采用专利模式给予其保护。然而,在该案发生之后,美国法院便转变了观点,认为医疗算法并非美国《专利法》第101条之下可被授予专利权的适格客体,而是一种告知医生该采取何种行动的自然法则,因而采用专利模式对算法施以保护是无效的(1)参见美国法院2012年Mayo v.Prometheus,132S.Ct.at 1298(citing 35 U.S.C.§101(2012)一案判决书。。随后,2014年发生的Alice Corp.v.CLS Bank International案再次强化了美国最高法院的此种观点,认为算法只是一种仅能在计算机中运行的一种抽象发明,因而不可采用专利模式对其施以保护(2)参见美国法院2014年Alice Corp.Pty.v.CLS Bank Int'l,134 S.Ct.2347,2358(2014)一案判决书。。
事实上,究竟能否采用专利模式对算法施以保护,知识产权法学者对此亦有探讨。世界知识产权组织(简称WIPO)总干事Francis Gurry博士认为可采用专利模式对算法施以保护,但需要解决专利申请时长和算法新颖性之间的矛盾问题,对此吴汉东教授也表示认同[1]。然而,即便解决了专利申请时长与算法新颖性之间的矛盾问题,算法究竟能否在我国采用专利模式施以保护,依旧取决于算法是否满足当前我国《专利法》对专利的法定要求。
第一,算法是否符合专利之“可实施性”要求。专利“可实施性”要求通常表现为,该技术领域中其他技能人员无须另行实验即可根据专利说明书将该专利付诸实现。由此,算法若要通过专利模式施以保护,必须具备专利的可实施属性。这就意味着发明人必须在专利说明书中披露算法的具体操作规程。根据当前算法发展阶段性特征可知(详见表1[2]),“白箱”算法和“灰箱”算法属于低阶算法,由于基本遵循计算机指令,发明人可通过披露原有计算机指令的形式展现这两种算法的具体操作规程,业内其他技能人员亦可根据发明人的具体披露通过输入原有计算机指令的形式直接将这两种算法付诸实现。然而,正如表1所示,“黑箱”算法、“感知”算法、“奇异”算法系机器自主学习的结果,已经超越了人们当前的认知和控制范围,发明人很难再就这三种高阶算法的具体操作规程进行清晰描述和披露,业内其他技能人员也难以通过输入原有计算机指令的方式再将这三种高阶算法一一付诸实现。
表1算法分类表
然而,我们能否采用类似我国《专利法》有关保藏新生物材料样品的方法将高阶算法一一付诸实现呢?即将这三种高阶算法赖以运行的数据集和引发这三类非透明学习算法生成的机器学习规则存储到公用数据库中,当数据集和机器学习规则并行存储完毕后,再由业内其他技能人员付诸实现?笔者认为,即便业内人员能够通过此种方法复现高阶算法的结果,高阶算法在满足专利“可实施性”要求上仍然面临着诸多挑战。因为采用公用数据库存储方式将会泄露发明人的专有数据集和学习算法的原有数学模型,进而引发大规模隐私侵权现象和商业秘密泄露风险[3],如此将会导致算法引发的未知风险多于算法所要解决的问题,客观上缺乏实施合理性。另外,当算法和具体领域如医疗结合形成高阶算法时,发明人通常很难对此种复合算法的特征作出精准归纳与概括,并就归纳与概括的正当性说明理由。如果此种情形下进行公共存储,于高阶算法的可实施性并未有真正助益。更进一步而言,在发明人无法就算法操作规程进行精确归纳与概括的情况下,倘若他人能够以该算法为基础进行新的发明,那么初始发明人的权利请求范围将会受到一定程度的限制,专利制度对初始发明人的激励作用也将会受到削弱。由此,通过公共存储方式复现高阶算法几乎不具备可能性和可行性。
通过分析可知,算法是否符合专利“可实施性”法定要求,不能一概而论。当算法处在“白箱”和“灰箱”阶段时,发明人能够描述、披露算法的具体操作规程,业内其他技能人员也能够根据发明人的描述和披露将其付诸实施。即低阶算法基本上符合专利“可实施性”要求;然而,当算法处在“黑箱”“可感知”和“智能化”阶段时,发明人在披露机器学习算法的具体操作规程上确实存有客观障碍,其将因无法解释和控制高阶算法的自动生成路径,而使得高阶算法很难符合专利“可实施性”的法定要求。
第二,算法是否符合专利申请说明书之“书面说明”要求。根据我国《专利法》第26条和《专利法实施细则》第18条至第24条规定,专利申请说明书应当对发明内容及其主要技术特征做出清楚、完整的说明。之所以对专利做出此种独立要求,是为了防止授予发明人过早、过宽的专利权,以及限制发明范围(3)参见美国法院2010年Ariad Pharm.,Inc.v.Eli Lilly & Co.,598 F.3d 1351,(Fed.Cir.2010)一案判决书。。也就是说,发明人在提出专利申请时必须实际拥有该发明,并通过对发明内容及其主要特征的清晰描述确证自己的权利范围。然而,当前算法能否满足此种法定要求还有待商榷。诚如表1算法分类表所示,“白箱”算法和“灰箱”算法基本上是对计算机原有指令的充分遵循,发明人完全可对这两种算法运行的技术方案和具体实施方式做出清晰书面说明,从根本上能够符合我国《专利法》和《专利法实施细则》的上述规定。
然而,当算法通过深度学习能够自动生成新的设计路径,进入“黑箱”、“可感知”和“智能化”阶段时,已经完全脱离人类控制而变得不可预测和难以解释,导致发明人很难从整体上反映出这三种高阶算法的主要技术内容,亦难以记载构成这三种算法的必要技术特征。正如图1所示,发明人已经不可能再继续对高阶算法权衡决策要素的过程进行有效干预,更难以对学习算法的内容生成路径和主要技术特征进行明确描述和记载。进一步而言,即便发明人能够通过语言描述高阶算法的主要内容和技术特征,业内其他技术人员也未必能够复现出同样的算法结果,因为算法是否遵循同一生成路径目前尚不清楚。
通过分析可知,发明人可以对“白箱”算法和“灰箱”算法的主要内容和技术特征做出清晰、完整说明,但无法对高阶算法主要内容和技术特征做出明确描述。事实上,发明人对高阶算法不是无法做出清晰描述的问题,而是对高阶算法生成路径存在认知盲区问题。由此,高阶算法至少目前还无法满足我国《专利法》和《专利实施细则》对发明专利所规定的“清楚、完整”的书面说明要求。
图1 算法决策流程图
第三,算法是否符合专利之“合法性”要求。根据我国《专利法》第五条规定,对违反法律、社会公德或者妨害公共利益的发明创造,不授予专利权,即如果算法不具备合法性,便不能通过专利模式施以保护。事实上,判断算法合法与否不仅涉及计算机编程技术操作规范问题,还涉及编程伦理与价值判断问题,而后者本身固有的开放性、模糊性,间接地增加了算法合法、合理与否的判定难度。判断算法是否合法、合理不是简单回答“是”与“非”的问题,而是一项需要结合时间、地点、损害结果等诸多要素进行综合判断的问题。例如,算法可根据用户浏览信息的偏好不断地向其推送系列类似题材的视频,这种做法短期内看似满足了用户的个性化消费需求,但长此以往却将用户带入了“井蛙困境”。短期内注意力有限的情况下,用户仅能被锁定在由自动化算法推送的某类固定信息中,当用户对此类固定信息形成稳定的阅读习惯后,便再难以关注其他领域的信息或即时热点,久而久之,造成用户思维固化、盲目自信,认知结构单一,甚至模糊或淡化对现实社会的真实感知[4],间接地剥夺了用户对其他信息的“知情权”。这种情况下,短视频推介算法的短期合理性和长期道德悖反性的两相结合,促使算法合法与否的判定难度升级,至于是否授予此种算法专利权,也将专利审查委员会推至两难境地。
除却算法短期合理性和长期道德悖反性难题外,算法合法与否的判定难度还在于对污染数据的甄别和对替代变量的审查。大数据的海量性和替代变量的任意性均对算法合法与否的识别造成了一定障碍,二者的混合存在使得算法侵权变得更加隐蔽,违法识别耗时更长,严重迟滞了算法合法与否的正常判定进度。设若甄别污染数据和审核替代变量所用时间超过算法取得专利的时长,已取得的算法专利还将面临被撤销的风险。因此,算法合法与否问题未确定之前,不宜直接通过专利模式对算法施以保护。
综上分析,“白箱”算法和“灰箱”算法简单透明,易于预测、解释、分析和甄别,客观上能够满足专利法对专利的法定要求,立法宜采用专利模式对其施以保护。然而,“黑箱”算法、“感知”算法和“奇异”算法操作规程过于精密、复杂,决策过程不再受人类控制,也无法为人类所清晰认知,虽然可能具有专利的某些特性,但直接通过专利模式对这三类高阶算法施以保护,将会对我国现行《专利法》及其实施细则的框架造成强烈冲击。另外,虽然人工智能技术的飞速发展能够促使算法在短时间内快速迭代,但我国当前专利制度的诸多规定并不利于通过专利模式对高阶算法施以保护。
二、算法的商业秘密保护模式分析
尽管各国学者对商业秘密内涵界定不尽一致,但通过商业秘密保护技术信息已成为国际共识。对技术信息采取保密措施使得创新者对技术信息享有独占权获取竞争优势的同时,也将包括竞争者在内的其他各方排除在该项技术信息的知悉范围之外。事实上,除专利制度外,商业秘密是保护技术创新的又一重要私法制度[5]。在美国司法实践中,技术信息的所有人通常以商业秘密为由拒绝披露算法决策过程,如销售COMPAS智能风险评估系统的Northpointe公司为实现营利目的,以商业秘密为由拒绝披露自动化算法对服刑期间表现良好、符合假释条件的Rodríguez作出“高风险”评估的决策过程[6]。
实际上,美国法院在司法实务中已经通过判决认可了算法的商业秘密保护模式。如在Viacom v.You Tube案中,法院并未强制被告向原告提供控制You Tube.com搜索功能和谷歌Google.com网络搜索工具的计算机源代码。法院认为,该计算机源代码凝集了数千人多年的劳动成果,这种商业秘密中蕴含着巨大的商业价值,若允许他人访问,该计算机源代码的基本设计原理将被他人轻易知悉,如此将会给Google造成巨大的竞争损失,因为不像Google那样,他人无需投入巨额研究资金即可获得比较竞争优势[7]。正如Viacom v.You Tube一案所示,尽管审查计算机源代码是解决You Tube搜索算法是否存有提升排名等不当行为的唯一解决方案,但是法院仍以保护商业秘密为由拒绝了原告强制披露被告计算机源代码的请求。
然而,算法究竟能否在我国通过商业秘密模式施以保护呢?实质上,算法是以大数据为基础解决某一问题的策略机制。这种策略机制中包含着大数据和算法实施思想两大要素。首先,作为基础要素,大数据承载着用户个人的隐私信息和消费痕迹,用户个人数据表面上看似并不涉及商业秘密,但经过海量获取和分析后,便呈现出一定的规律性。使用者可根据大数据所呈现出的规律作出决策,从而降低管理和其他开支成本,获取高额商业利润。现实中,几乎每个使用者都会独立保有自己的数据库,彼此之间非但互不共享,各使用者之间反而还会采取各种反爬措施防止他人爬取自有网站数据。零星散乱的数据并不具有商业秘密属性,也不具有商业价值,但当这些数据经过使用者加工后便成为一种营利资本和商业财富,由此具备商业秘密属性。
其次,作为核心要素,算法实施的思想是算法建模的关键,没有这项核心要素,算法建模工作就无法有序展开。因为算法建模阶段必须将一定的思想目标作为指引,并将其贯穿建模始终。否则,算法设计者无法通过有限步骤将该思想目标付诸实施。司法实务中,纯粹的思想目标不一定是商业秘密,但是算法建模等具体操作细节、方式等仍有可能符合商业秘密之秘密性、新颖性特征,进而具备商业秘密属性。由此,通过分析可知,当算法的两大构成要素均具备商业秘密属性时,算法就有可能通过商业秘密模式获得法律保护。
人工智能时代,通过商业秘密形式保护算法专有权不仅有利于防止他人故意侵权,还有利于杜绝其他竞争者的搭便车行为。然而,通过商业秘密形式保护算法专有权亦存有弊端,即不利于对算法所造成的实际损害进行法律归责[8]、无法保障公众对信息的准确获取权、抑制社会累进创新。正如本文表1所示,高阶算法已经摆脱了人类的有效控制,人们很难再对算法决策过程和决策结果进行相应预测和解释,设若通过商业秘密形式对算法施以保护,那么由算法造成的“信息茧房”风险、隐私泄露风险、歧视风险等将难以受到法律规制。因为当事人可直接以“商业秘密”为由拒绝他人对算法的任何审核行为,以此对算法风险导致的群体性侵权形成强力抗辩,进而逃避相应侵权责任的承担,最终致使我国《侵权法》损害赔偿条款设置目的落空。据此,在有关算法风险规制的系列配套措施尚未出台之前,通过商业秘密模式对算法施以保护实为变相鼓励当事人利用高风险算法故意实施侵权行为。
事实上,通过商业秘密模式对算法施以保护还将进一步削弱公众对相关信息的获取权。自被广泛运用于社会各领域以来,算法这只“看不见的手”便一直统治着社会各领域[9]。通过采取精密、复杂的技术手段,算法可以决定公众获取信息的范围及其阅览量的具体排名甚或网络用户的具体访问权限等,此种现象在商事领域尤为突出,其不仅垄断了公众个人的信息视域,还冲击了公平有序的市场经济竞争秩序。通常情况下,商事算法通过无关参数的设置,在没有任何正当依据的前提下,可以任意提升某一商品信息排名,从而间接干扰甚或阻碍消费者获取其他同类产品信息,严重削弱了消费者正常获取其他产品信息的权利。设若未来立法通过商业秘密模式对算法施以保护,那么对于蕴含不良因素或违法目的的算法展开的审核与调查工作将永远不能形成令人信服的结论,造成算法不受法律监管的假象,制约算法技术发展的同时,也使得公众难以获取多元化的信息。
另外,通过商业秘密模式对算法施以保护固然利于保护使用者的合法权益,但这也意味着社会累进创新在某种程度上将会受到抑制。社会累进创新必然要建立在已有算法技术的基础上,而算法的商业秘密属性决定了后续累进创新几乎不可能实现。因为累进创新者很难获得甚或不可能获得已被采取保密措施的有关算法技术的任何有用信息。设若算法技术一直具有保密性,社会累进创新的步伐就很难向前推进。尤其是当作为个人的第三人欲以该已有算法为目标,对其实施技术验证时,已有算法技术信息细节获取难度还将进一步升级,最终导致第三人对算法的检验工作无疾而终,徒增资源浪费[10]。进一步而言,一旦创新的源泉不能充分涌流,生产力的革新和社会的全面进步就会缺乏动力,长远来看并不利于技术的快速迭代,更不利于创新型社会的构建。
人工智能时代的到来以及科技的进步,极大地提升了人们对无形财产的保护意识,以至于越来越多的企业倾向将算法视为自己的商业秘密,以在激烈的竞争中保有更多优势。然而,通过商业秘密模式对算法施以规制可能会对企业形成过度保护,以致纵容怀有不良动机的使用者利用算法侵害社会公众和其他竞争者的合法权益。因此,即使未来立法通过商业秘密模式对算法施以保护,也要对企业所负的促进社会累进创新责任进行相应规定,只是在算法技术并非十分成熟的当前,通过商业秘密模式对算法施以保护并不是最佳选择。
三、本文对算法保护模式的定位
算法是通过计算机系列清晰指令解决问题的一种策略机制,是对人类解决问题思路的代码转化。若要从法律上对算法保护模式作出清晰界定,还需明确算法与计算机程序之间的联系和区别。算法是解决问题的具体思路,是对特定问题求解步骤的描述,其必须在有限步骤内执行终止,并通过输出项在规定时限内反映出对输入数据的处理结果。程序则是算法的代码实现,是对源代码编译后得到的可执行文件,也就是说计算机程序本质即是算法,而算法则不一定是计算机程序。正因如此,我国《计算机软件保护条例》第2条和第7条规定,对计算机软件的保护目前不能扩及软件开发所用的思想、原理和算法。即按照当前法律规定,算法不是计算机软件作品,因而不具备著作权属性。然而,已如上文所示,通过专利模式和商业秘密模式对算法施以保护均存有弊端,采用知识产权制度对算法施以保护似乎成了不解之谜。
究竟该通过何种模式对算法进行妥当保护呢?笔者认为,算法本身即为解决问题的一种策略,为尊重算法的客观属性,在目前算法尚未发展至高级智能阶段的情况下,我国法律暂先宜通过专利模式对“白箱”算法和“灰箱”施以保护,因为这两种算法凝结了大量的人类智力劳动,在不产生消极影响的情况下,符合专利新颖性、创新性和实用性的特征。当前对这两种算法授予专利权,一方面可明确算法设计者或使用者的权利范围,激发算法设计者、使用者的创新积极性,另一方面有利于对算法总体有序运行进行有效监管。至于“黑箱”算法、“感知”算法和“奇异”算法,因其难以预测性、不可控性和不可解释性,宜采用纯粹或混合型非专属性激励机制对设计者或发明人施以奖励,而不再特意界定其法律保护模式。
非专属性激励机制下,政府可将津贴、奖金和税收优惠政策作为对创新者的激励,即设计者、发明人以获得政府津贴、奖金和减免税收优惠为对价,不再对使用者使用本人发明的行为施以限制。这种机制下,设计者和发明人一经完成政府提出的特定课题,即可将发明专利让渡给国家,国家随后根据该项发明所创造的社会价值,或政府就此发明而节约的财政开支对设计者、发明人施以奖励。创新领域实践表明,这种激励方式可迅速将发明人的最新发明成果顺利推向社会,及时促进全民创新。事实上,除采用该种纯粹的非专属性激励机制外,专属性和非专属性创新混合激励机制亦能实现激励高阶算法研发者的效果。
专属性和非专属性创新混合激励机制下,政府、高校和企业需要协同合作形成完整的创新合作体系。其中,政府专门负责为高校创新提供研发资金支持。高校获取研发资金后,研发出创新成果时,其既可以自行申请专利保护,也可将创新成果转让给企业。当高校将创新成果转让给企业后,企业在量产前再次进行深入研究的,可享受政府给予的税收优惠。这种混合创新激励机制在我国又被称为“产学研”一体化机制,是科研、教育、生产在功能与资源优势上的协同与集成化,也是技术创新上、中、下游的对接与耦合。这种机制下,明确的分工有利于政府、高校和企业密切配合,实现共研、共产、共享之目标。
不过,随着科技的飞速发展,这种机制因成果转化周期长,已经不能完全适应企业即时创新的需求。正因如此,部分企业已经开启了自研自产模式。笔者认为,为顺应技术更新周期短的时代特点,有必要对混合激励机制进行适当调整,即当企业通过完全自研自产对高阶算法的更新迭代作出突出贡献时,政府可通过登记备案方式给予企业一定税收优惠,以激发企业创新积极性。这就要求政府在未来必须扮演好服务者的角色,及时对行政辖区内算法创新能力强、创新贡献大的企业施以非专属性物质激励。
综上分析,笔者认为,考虑到高阶算法的非透明属性和我国算法技术发展的现状,当前无论采用税收、奖金等纯粹非专属性激励机制,还是混合激励机制,均可使得“黑箱”算法、“感知”算法、“奇异”算法的设计者或发明人获得相应的物质激励,间接实现与其获得专利权等专属性权利相当的激励效果。与此同时,还可免去设计者或发明人因申请专利而遭遇的高阶算法不可描述、不能解释的困难,进而保障我国《专利法》现有框架不受强烈冲击。另一方面,混合激励机制下,由国家对这三种高阶算法享有所有权,商业秘密将不再是社会累进创新的阻碍,全社会创新的活力必将会得到深度激发和充分释放,创新型国家建设的步伐亦将会进一步加快。
由此,根据算法演进的阶段性特征和专利申请的实际情况,我国未来立法时宜根据算法类别进行不同规范,即通过专利模式对“白箱”算法和“灰箱”算法施以保护,对设计者、发明人施以专属性权利激励;对“黑箱”算法、“感知”算法和“奇异”算法不再界定其法律保护模式,直接归由国家所有,但国家需要根据高阶算法创造的社会价值或就此节约的财政开支,对相关人员和企业施以非专属性物质激励。
在当前建设人工智能强国,推进实施创新驱动发展战略的新形势下,为促进我国人工智能技术快速发展,亟需从法律制度方面对算法的法律保护模式展开全方位探讨。但鉴于当前我国算法保护模式理论研究的匮缺,有必要结合美国算法司法实务经验,通过专利模式对“白箱”算法、“灰箱”算法施以保护。考虑到“黑箱”算法、“感知”算法以及“奇异”算法的难以控制性和不可预测性,未来立法可不再对其法律保护模式进行有意规定,而直接采用非专属性激励机制对研发者、发明人施以激励。只有结合我国算法技术发展现状,我们才能积极探索出适合我国算法技术发展特征的法律保护模式。