电子数据诉前保全与区块链技术非全贴合性的伪应用样态
2021-12-27高志明乔栗方
高志明,乔栗方
(燕山大学,河北 秦皇岛 066004)
引言
2018年,杭州互联网法院由共道网络科技有限公司研发的区块链取证平台初试运行;2019年,广州互联网法院由华为提供技术支持的“网通法链”智慧信用系统运行;同年,北京互联网法院首个运用“天平链”证据的判决也对外公开。为规范互联网法院电子数据认证规则,2018年9月实施生效的《最高人民法院关于互联网法院审理案件若干问题的规定》第11条规定:“当事人提交的电子数据,通过电子签名、可信时间戳、哈希值校验、区块链等证据收集、固定和防篡改的技术手段或者通过电子取证存证平台认证,能够证明其真实性的,互联网法院应当确认”。收集取证作为证据流程的初始环节,至结案存证环节形成了证据体系的闭环路,其中取证存证环节的技术工具革新都应置于环路中做系统量定,不能因存在工具理性便进行技术嫁接而导致一种割裂性评价。为实现电子数据诉前保全标准的统一,最高人民法院开始搭建人民法院司法区块链统一平台,将区块链技术优势引入证据保全环节,在路径上可以为推进网络空间治理中的司法审判能力电子化赋能,但也面临着导致诉前保全与证据体系全闭路环节脱节、多流程的形式性贴合衔接及“技术-应用”过分梳离等待决问题,徒具技术客观中立性的外观,最终使法院取证保全联盟链映现出区块链技术的“伪应用”样态。
一、法院传统电子数据诉前保全运行环节所遇技术壁垒
2012年修订的《民事诉讼法》确定了电子数据作为独立的法定证据种类。电子数据是证据的概称大类,具有私蔽性、跨时空性、取证技术操作要求高、真实性认证难等特点。最高人民法院于2019年修订的《关于民事诉讼证据的若干规定》对电子数据真实性判断因素及证据原件理论进行了专条规范。
从待证功能的角度,电子数据类证据可以分为源根数据证据、电文沟通证据、附属信息证据与系统环境证据。电子数据质证不仅要反身自证来源信息真实,确保留存的数据内容本体未删改,还要附加环境“元数据”(Data that describes other data)——即电子数据生成时的实施人、实施过程、实施结果等数据。源根数据主要指计算机符文、信号码元、计算机语言指令、运行脚本、源代码等;电文沟通证据主要用于证明法律关系及权利义务具体交流传递内容;附属信息证据主要用于证明数据电文证据的客观真实可靠;系统环境“元数据”则主要用于在庭审时或鉴定时显示数据电文的取证存证环境,同时,系统环境证据的合法性是待采数据电文证据合法性的基础(1)参见王笑强:“民事纠纷中电子数据保全的司法实践探讨”,中国电子银行网https://www.cebnet.com.cn/20190529/102576487.html,最后访问日期:2019年12月7日。。
从存储载体和外在形式的角度,当前我国民事诉讼中常见的电子证据类型主要包括微博客、电子邮箱信件、手机应用APP信息、手机等移动终端通话及信息、网站应用及后台信息、备忘录表格数据文件、可归入电子数据的视听资料、云平台存储、电子签约、后台交易数据信息等产生或存储于电子介质中的电子数据,复杂迭代的智能技术使电子数据呈现出繁杂多样的具化形态。这些不同于传统书证物证的属性形态对电子证据的保全操作规制提出了数据运维时代的专业技术引致需求。
传统的电子数据诉前保全技术对第三方保全或公证依赖较重,在解决证据客观真实性、防篡改性、保全成本、及时性、存储安全性等方面存在诸多缺陷,在认证环节存在证据可采性的通过性梗阻,使当事人不得不进行多方鉴证。
法院依当事人诉前申请采取传统电子数据保全技术,主要针对差异化的证据类型通权达变,可以粗略分为以下几类:第一类是对封闭类信息存储的实物保全,可以查封电子数据依附的物理介质载体如U盘、笔记本电脑、机组服务器等;第二类是对手机等移动或固定终端中的录音录像等信息以及多数常见网络虚拟空间信息进行保全,主要是通过拷贝复制记录源文件,刻录在光盘磁盘或封存在法院不联网存储计算机终端中,进行电子文档存储管理,且录像记录取证过程;第三类是对终端可显示但无法复制界面的情况,借助公证机关电子信息抓取存储功能保全,此方式的高使用率源于认证中对非经公证电子数据的低采信率间接反催生或由法院直接告知当事人在诉前寻求公证保全;第四类是对软件网站功能需求及实际结果等需要比对的数据,使用测试软件或手动运行测试,并同步生成操作日志;第五类是对聊天交流软件、邮件、交易平台等信息发散互通、信息中转存储平台中的交流信息,要求服务商提供记录档案信息后留存,其主要繁难之处在于交流信息另一方网络身份与现实身份的合一认定、保全信息范围的不确定性及对个人隐私信息权利的侵犯等问题。
法院对于当事人依赖第三方取证平台提交的证据在认定证据能力和证明力两种能力层级上会采取审慎的态度,经公证的电子数据如果当事人、公证事项的利害关系人认为公证书有错误,还可以向出具该公证书的公证机构提出复查排除高成本获取的公证电子数据。对于部分地区法院来说,法院依申请采取电子数据诉前保全所需配备的高科技设备和专业人员等硬件软件不足,关涉电子数据化专业知识储备短缺的现状也无法支持法官得心应手地采取纷杂多元的保全措施。因此,实践中不乏将电子数据“格式转化”的应对策略,如将网站侵犯著作权作品打印转换为书证、将截屏截图过程刻盘变异为视听资料等,以虚置电子数据并规避电子数据诉前保全中难以突破的技术壁垒。
在证据诉前保全取证初期,申请人一方作为信息提供渠道可能使法院在证据获取上具有模糊性,电子数据内容信息经篡改后莫辨楮叶,取证人员的操作失误可能导致数据丢失毁损,获取部分电子数据甚至需要进行密码破译,如果电子数据事前有病毒植入,更会增加法院的取证难度。保全过程中往往需要专家或技术人员参与保全流程环节,签名认证并书写电子保护。传统的电子数据保全与存储在流程上通常是分离的,对存储环境也有条件束缚,高磁磁场吸附、潮湿高温腐蚀、存储介质挤压、电路电板毁损遗失、存储空间拥堵数据溢出、网络黑客攻击等都会造成电子数据不可逆的灭失。进行至质证环节,法院依一方当事人申请保全的证据仍属于一方当事人提交的证据,在出示证据环节,对抗方当事人对于操作或证据失真问题提出质疑,会继发需要申请鉴定或专家辅助人出庭进行解释说明,程序上出现倒流。
上述电子数据诉前保全中触碰的技术壁垒,司法机关希冀可以通过区块链技术精准抓取和留存加密等功能予以冲破,令诉前保全电子数据的客观性、真实性、次序性、关联性、完整性和有效性得以优化升级,并压缩因实地取证、存证、质证到认证各个不同阶段环节产生的时空和人力成本。
二、后比特币时期区块链对传统电子数据诉前保全的技术重塑
早在2008年,中本聪就在关于比特币的论文中提出,区块链(blockchain)作为一种P2P式电子货币交易系统的底层技术,可以有效避免金融危机产生的两类重要根源:金融中介信用风险和政府货币发行中心化监管(2)See Satoshi Nakamoto,Bitcoin:A Peer-to-Peer Electronic Cash System,https://bitcoin.org/bitcoin.pdf,最后访问时间:2019年11月22日。,其就深度信用需求和交易中介欠缺或失范的应用环境具备高度自适应力。区块链在比特币系统应用场景中搭建的是公链治理结构,经历比特币1.0及2.0时代后,目前3.0时代区块链技术成为一种集分布式数据存储、点对点传输、共识机制、时间戳、非对称加解密算法和数字签名等功能于一体的计算机新型应用模式,被称为人类信用进化史上继血亲信用、贵金属信用、央行纸币信用之后的第四个里程碑(3)参见汪自洁,陈华冠,崔丘:“司法区块链时代已经到来”,http://www.sohu.com/a/270692214_100117963,最后访问时间:2020年12月10日。。
截止至2021年7月2日11:50,走在区块链技术保全前端的杭州互联网法院区块数量已达150537946块,每256个交易数形成一个完整区块,其司法取证区块链是治理链型中的联盟链。杭州互联网法院将常见的民事纠纷划定为三种:版权链、合同链和金融链,不属于《最高人民法院关于互联网法院审理案件若干问题的规定》中法定互联网法院审理一审案件类型(4)参见《最高人民法院关于互联网法院审理案件若干问题的规定》第2条。的真子集。版权链中当事人可选择的法企合作服务平台有“华泰一媒”和“新华智云”,合同链可选为“e签宝”和“法大大”,金融链执行点击命令后则直接进入“中钞络谱”合作界面。
在杭州互联网法院审理的杭州华某传媒诉深圳道某公司网络文章著作权侵权一案中,区块链存证是借助经行政备案且司法认可的第三方平台浙江数秦科技有限公司开发的“保全网”。原告使用谷歌公司前端协议控制浏览器“puppeteer”程序对侵权网页URL(Uniform Resource Locator)及取证过程通过BaaS(Blockchain as a Service)服务平台的应用层API(Application Programming Interface,应用程序接口)接入录制,并同步产生操作日志及调用时间戳,最终通过数据打包算法运算,形成目前通用的SHA256算法下的哈希函数值(HASH)符码(5)参见袁勇,王飞跃:“区块链技术发展现状与展望”,载《自动化学报》2016年第4期,第485页。。即将原始截屏视频数据经复杂的哈希运算编码为特定长度的由数字、字母等组成类似于数字身份指纹的字符串后,上传到数据存证层(Factom Data Layer)进行数据存储。该数据层使用了阿里云ECS虚拟云机,数据块的元数据内容加密签名后存储到分布式数据库中,存证文件至少存储在三个不同的阿里云虚拟机节点上。通过“保全网”内带开源文件传输程序工具“curl”获得侵权网页的源代码,认定侵权网址所有权人,然后将技术功能进行司法鉴定后存证完整电子数据信息。存证采用随机256bit的密钥进行AES(Advanced Encryption Standard,高级加密标准)加密,每个块的加密密钥都需要对前数据块进行运算,用户私钥可以解密存储的完整文件。缘于我国区块链自身底层技术缺乏自主创新等原因,部分数据最终再次进行签名后锚定至区块链或以太坊数据存真层公链中,公链中参与者仍使用阿里云虚拟机作为节点。至于选择区块链还是进化版以太坊作为存真公链,比较而言以太坊的性能较比特币在智能合约方面有灵活脚本优势、可编程性更高的优势,是一个开源的有智能合约功能的公共区块链平台,可适用于多场景的优势鲜明。
“保全网”通过借助阿里云金融的虚拟云技术在一定程度达到了分布式数据存储上的“去中心化”安全效应,生成DSL(Distributed Shared Ledger,分布式共享总账),同时,阿里云的成熟技术可以达致每5台阿里云服务器每秒约20000笔存证的高速性能目标。云机算法生成哈希函数对任意长度的数据m,可以产生定长的哈希结果h=H(m),从而成为经过共识批处理验证确认的一系列有序交易日志序列“链”;一段时间内生成的数据信息打包构成块,每一个新块头都与上一个区块衔接在一起,每下一个区块都会包含上一个区块的索引数据,组成块的交易形成有顺序的建模联系在一起的区块链。该区块链本质是分布式复合账本,将链上数据到底放在哪一个块就是分布式共识要解决的问题。保全成功后,原告在应用界面继续操作申请与该网站合作的司法鉴定或公证,鉴定或公证机构比对查询后符合结果一致原理(6)其过程与图1 比特币交易流程环节及技术原理中第九个步骤中比特币所有参与节点可通过公钥验证交易的原理是相同的。,则出具鉴定意见或公证结果,达成共识后放入“区块”,生成在线及线下证书,完成取证保全环节。法院在认证时,使用在线接口测试工具(如atool等)对在保全网上形成的著作权侵权网站录取文件进行哈希值计算。如果与FACTOM区块链存放哈希值满足同一性要求,则该电子数据的保全内容未经过篡改,具有可追溯性,此处是利用了区块中哈希树(Merkle Tree)的数据验校原理。
整个用户与保全网之间的证据留存操作功能是一种可预先编码自动执行的智能合约形式。1994年提出的智能合约(smart contract)是一种旨在以信息化方式传播、验证或执行合同的计算机协议。智能合约允许在没有第三方的情况下进行可信交易,这些交易可追踪且不可逆转,可视为一类自动智能执行的格式契约空间规则。智能合约中执行的状态信息相当于当前整个系统的快照,足以提供快速访问存储数据的能力。“区块链可借助智能合约的可编程性封装布式节点的复杂行为;智能合约可借助区块链的去中心化基础架构,在去信任、可执行环境中有效实现”(7)参见欧阳丽炜,王帅,袁勇,倪晓春,王飞跃:“智能合约:架构及进展”,载《自动化学报》2019年第3期,第446页。,因此区块链是可以与智能合约结合工作形成高智能架构的。
区块链是由区块有序的链接形成的链式数据结构,其中区块是一段时间内系统中全部信息交流数据的集合。法院区块链搭建后,每个区块带有时间戳作为独特的标记,以确保数据的纵向可追溯性(8)参见徐蕾:“基于区块链的云取证系统研究与实现”,西南科技大学工程硕士论文,2017年,第21页。。区块链的关键技术可以对传统电子数据诉前保全制度功能进行技术重塑。区块链的关键技术之一是非对称密码学。密码学最显著的成果是数字签名,使普通签章数字化。数字签名可以永久地与被签署信息结合,无法自信息上擦去移除。数字签名大致包含两个算法:一个是签署,使用私钥处理信息或信息的哈希值而产生签章(9)其操作与图1 比特币交易流程环节及技术原理中第七个步骤中A进行交易时使用私钥签名原理相同。;另一个是验证(10)其操作与图1 比特币交易流程环节及技术原理中第八、九个步骤中使用公钥验证原理相同。,使用公钥验证签章的真实性(11)参见陈晓峰,王育民:“公钥密码体制研究与进展”,载《通信学报》2004年第25期,第109-118页。。杭州互联网法院审理的网络文章著作权侵权一案中的哈希值是使用私钥签名后经算法处理的信息数据,而法院、公证机关、鉴定机关等节点可以使用公钥进行数据追溯与区块查看验证,其中法院掌握开放原始哈希数值对应电子数据原始样本的授权权限。区块链的关键技术之二是分布式对等网络系统。在杭州法院互联网法院网络文章著作权侵权一案取证保全中,表层上没有核心服务器,所有节点地位平等参与数据的记录并留下写入时间戳,系统中的数据信息有多个备份,即使部分节点信息遭受破坏攻击或未授权的篡改,其他节点数据仍可完整保存且节点仍然能够及时对外广播信息,实现同步并发信息处理操作。上述两项关键技术及整体技术架构可以重塑传统电子数据保全模型,涵盖绝大多数电子数据类型,并使传统电子数据保全中存在消极按证据类型应对的逐项壁垒问题得以初步有效解除。但是区块链这项自由度高的技术在纳入民事诉讼的正当程序中,难免造成程序设计的繁琐臃肿。
三、法院电子数据诉前保全与底层区块链技术的点状框贴而非全贴合性
屏幕分辨率显示领域中存在两种贴合技术,即全贴合和框贴技术。全贴合技术原理追求保护玻璃显示层、触控层和液晶层某一层或几层的更高融合度,实现更好的透光率和厚度减重;框贴是显示屏使用胶质将触摸屏与显示面板的四边固定,显示面板与触摸屏之间存在空间空隙,应用于智能手机时屏幕厚且有缝隙存在,屏幕反光比较明显,显示效果较差。区块链技术应用类似于以LCD(Liquid Crystal Display,液晶层)(12)液晶显示屏使用极化材料中的液体水晶溶液,在电流通液体时会使水晶重新排列完成成像目标。作为底板,在拓展至不同功能的应用情景空间显示时会着以他色。初代应用比特币交易中,区块链技术被覆盖了相应“虚拟货币”流转的色彩。而在司法区块链法院电子数据保全中是以应用层新色覆盖了多少区块链技术底色?其类似显示层、触控层的功能建构场景与类似液晶层的区块链底层技术的贴合性又如何呢?
(一)区块链先天不足之系统安全性稳定性技术漏洞
作为一种人为虚拟构建的编码程序,区块链企图建立编码信任而排除人为影响,其自身附带有技术漏洞。区块链的不可篡改特性基于密码学的散列算法,附加多方节点共同维护与记账,具有很高的安全性。但是整个区块链公链型和联盟链网络在隐私和安全方面仍然存在薄弱环节,其不可篡改并不是牢不可破的。区块链为吸附更多节点提供挖矿算力,采用发币、贡献积分、荣誉度、手续费等奖励方式,在证据存储保全中激励层无需设置奖励便会有法企合作的节点加入,其中大比例云机节点在区块生成贡献中成为无效耗能节点。
目前以第三方机构(公司)发起的区块链证据诉前取证存储的网络各不相同。有的公司依托国外的公有链底层技术平台,甚至存在潜在跨境司法主权风险;电子数据二进制编码可精准复制,但编程的不稳定性也使系统内序面临打散风险。2016年以太坊黑客攻击事件中,网络黑客在智能合约层进行重入攻击(Re-entrancy)(13)重入攻击发生在单线程计算环境中,当执行堆栈跳转或调用子例程时,再返回到原始执行之前。,造成区块链交易确认环节硬分叉,从中盗取价值约6000万元的以太币,并使整个区块链被迫延用硬分叉的恶意节点,随后产生不可逆的区块叠加。因此,区块链安全防火墙坚固性存在隐忧,一旦出现底端区块链虚拟云机被超导量子计算机级别算力黑客入侵并攻陷DOS(Disk Operating System磁盘操作系统),将使修改系统中电子数据证据成为可能;即使不存在外部攻击,法院区块链平台中,底层虚拟机平台常归属于某一合作企业,其算力完全可高至全系统算力的51%以上,使底层虚拟机修改数据也存在可能性。区块链技术本身在算法安全、协议安全、实现安全、使用安全和系统安全方面存在的隐患在贴合电子数据保全功能上也伴生延续(14)参见斯雪明,徐蜜雪,苑超:“区块链安全研究综述”,载《密码学报》2018年第5期,第459页。。
(二)区块链技术的去中心化与电子数据诉前保全弱去中心化
区块链在比特币记账中去中心化的实现,是参与方由多样甚至互不相识的实体组成,并且在不同的记账周期内,可以由不同的参与方主导发起记账,而其他方进行共同验证。所有参与人允许访问比特币区块链系统记录的公开账本,可验证区块链记录信息的有效性,参与者也有能力访问链上信息内容和账本历史消息。
杭州互联网法院电子数据保全区块链系统流程则为:当事人用户注册→实名认证→信息修改与保存→选择电子数据种类→是否签字加密→上传系统生成同步时间戳→接收节点自动向外播报保全消息(广播)→云机进行哈希计算形成共识加入区块链存储→当事人用户可随时查看证据列表进度并下载保全证据→同一证据材料追加或申请其他节点进行公证鉴定等→申请出证。杭州互联网法院常务副院长王江桥表示,杭州互联网司法区块链可以通过时间、地点、人物、事前、事中、事后等六个维度解决数据“生成”的认证问题,真正实现电子数据的全流程记录,全链路可信。该区块链由三层结构组成:一是区块链程序,用户可以直接通过程序,将操作行为全流程记录于区块链;二是区块链的全链路能力层,主要是提供实名认证、电子签名、时间戳、数据存证及区块链全流程的可信服务;三是司法联盟层,使用区块链技术使公证处、CA(Certification Authority认证中心)/RA(Registration Authority 注册审批机构)机构、司法鉴定中心以及法院形成连接在一起的联盟链,每个单位成为链上节点(15)参见李宁:“杭州互联网法院司法区块链上线”,载中国法院网,https://www.chinacourt.org/article/detail/2018/10/id/3522776.shtml,最后访问时间:2019年11月1日。。
杭州互联网法院自建的区块链系统是一条基于法院司法信任的联盟链,而非公链,保留了中心化色彩。参与节点数量上不如政务类或金融类区块链中节点数多,主要包括法院、司法鉴定机构、公证机关、律所、授时中心等20余处参与节点,由蚂蚁金服提供底层区块链技术平台作支撑,开放性上空间有限,信息动态流转需求也不似比特币交易大规模的流转量。未经法院节点授权,其他节点访问权受限只可视块上哈希值,无法查看及操作哈希值对应的原始电子数据资料,可以实现初级程度的隐私保护和防篡改。目前最高法统一区块链平台仍然是以联盟链为设计蓝本的,在联盟链中法院仍然是潜在的中心,并非严格意义上所有节点尤其是申请保全人共同参与区块链系统的数据验证、存储和维护,证据保全链上其他节点操作要法院节点授权才可参与区块链上操作,且底层平台云机的所有权同属,分布式记账和共识达成都是同一中心内完成再向外广播。这样的系统建构虽然可以借助如零知识证明、门限加密等保证原始数据隐私,但几乎使区块链技术去中心化的初始设计演变成为了“弱中心化”,也没有比特币系统一般利用数字信任降低交易中信任成本的功能。
(三)区块链技术无法对上链前多变的电子数据鉴真
实践中电子数据多变性导致系统不同时点上链直接影响案件事实判断,而当事人双方不同时间不同节点提交相同的证据,也就是考虑到数据的多维度特征时,系统是否可自动排重避免哈希碰撞也是区块链技术贴合法院电子数据诉前保全必然面对的疏离点问题。从整体正义观出发,举证时限制度与证明责任分配制度的理想运行状态必须有理想的、坚实的证据收集制度作为支撑(16)参见宋朝武,纪格非,韩波:《民事证据规则研究》,北京:首都经济贸易大学出版社,2010年第1版,第149页。。
以需要电子数据的网络著作权侵权为例,传统平台点状取证无法解决的证据随时间动态线性变化难题,在区块链平台仍然无法解决。如果A凭借网络影响力宣扬B平台及C侵犯自己著作权,但并未采取诉讼程序;B申请确认不存在侵权,B可以选取多数时点或时段作为事实主张的电子数据。无论B此项主张属于对特定诉讼标的陈述的事实,还是作为主张责任陈述的与客观证明责任不一致的陈述,最终A可能无链上证据证实存在侵权事实而承担客观证明责任的不利后果。反驳观点或许以技术中立为基点,但技术设计之初是内化设计者的主观目的与评价的,无法完全将上述不平衡都归责于当事人。电子数据区块链保全目标就是要减少人为干预造成的过程和结果偏差,在这一点上,司法机关希冀区块链技术实现的技术突破会落空。各时点存取的电子数据虽然可以证明当时的客观事实,但时点选取造成的整体合成事实偏差无法通过区块链系统避免。也有反驳观点认为可以每几秒抓取一次数据,但这样附带的是存储量骤升,哈希值数据多,还要面对数据还原的问题。
关于数据真实性问题,区块链可以保障区块链上的数据不可篡改,但无法保障原始上链前物理世界数据的真实性及与输入上链数据与案件的关联性。例如将扫描合同上传至区块链,技术本身无法判断合同是否在初始扫描时间点就已经存在虚假。所以,链前信任是在区块链取证后法院认证环节需要关注的焦点,区块链证据取证保全是无法达致“证据自证”目标定向的。
此外,相同电子数据如不排重,那么相同哈希值是否会形成新的区块,与之前区块中哈希值相同,甚至因算法共识认同一致性导致系统哈希碰撞分叉,也是技术待决问题。底层平台或重要节点发生诸如机器宕机或网络异常等情形时,产生异常的分布式系统,算法就需要解决如何敏捷且精准地在集群内部对某个数据的值达成一致。如果算法无法达成该效果,则区块链可能迅速由错误分叉继续叠加。因此,区块链技术在法院电子数据诉前保全应用中完全做了减损,解决的可能并不是当初存在的难题。
(四)电子数据存证中半分布式存储功能的应用样态
电子数据在区块链技术应用前,主要依靠公证确保其真实性和完整性。构建法院电子数据保全区块链系统层级功能,可以有效应对上述难题。但在贴合性分析中,需要考虑区块链取证系统内部的性能因素,包括:区块链容量、可扩展更新性、响应速度、吞吐量、并发数及资源CPU占用率、系统运行稳定性、数据实时存储、易操作性、数据安全性、兼容性、维护成本等。同时,电子证据保全区块链层构完成后,需要面对其与整个法院电子诉讼系统的整体对接,解决线上电子数据全生命周期的全流程顺畅系统执行。
在分布式存储中算法存储效率问题上,比特币是采用存储交易表格的形式,挖矿电脑即使将全部区块下载占用的存储也是可能承受的范围。但在一个完全去中心化的区块链系统中,每个节点如果想验证历史上某一笔交易自始至终是否正确,则必须下载完整的区块链数据。随着时间的推移,区块链的数据量呈线性指数递增。比特币为了保持系统区块的稳定性和出块速度,挖矿共识的时间一般为10分钟,且为了保持比特币总值稳定以一个确定的但不断衰减的机制进行奖励减半,以至“减半年”比特币出块速度甚至长达40分钟左右。每一区块大小为1MB,每年的区块增长速度为24*60/10*365=51.3GB,10年后,大概需要5T空间。EOS(Enterprise Operation System,商用分布式应用区块链操作系统)理论上可以达到百万TPS(Transactions Per Second,每秒传输处理个数),按照一个交易数据100字节计算,1天的区块数据量为1000000*100*60*60*24 = 7.8TB;一年的区块数据量为7.8*365 = 2868TB;计算至2023年,大约需要14340TB的存储空间。而法院区块链电子数据中内存耗大的图片及视频格式所需要的存储空间远超比特币的交易表格空间占有量。杭州互联网法院运行的区块链技术,拥有20000Qps存证性能高性能共识方法,相较于比特币只有8Qps性能,其流量速率飞速提升,但出块速度与系统稳定矛盾协调与区块链中两者的平衡设定并不一致。
四、区块链技术在法院电子数据保全功能层构呈现伪应用样态
区块链技术在某些功能点上能够与构架电子数据诉前保全系统贴合,但其本身技术逻辑的优缺点及与电子数据诉前保全取证功能调试间也会与平台功能初衷存在诸多背离,最终呈现出电子数据诉前保全取证功能系统并没有在真正意义上应用区块链的实质技术特性的伪应用样态。
(一)“取证”偷换“保全”概念引发理论重塑
杭州互联网法院保全系统中,第三方商业平台证据区块链的操作虽然能够最大限度存取电子数据,但难以称为以法院为主体诉讼法学理上的“诉前证据保全”。民事诉讼中的证据诉前保全是指因情况紧急,在证据可能灭失或者以后难以取得的情况下,利害关系人可以在提起诉讼或者申请仲裁前向证据所在地、被申请人住所地或者对案件有管辖权的人民法院申请保全证据。第三方商业平台的区块链技术只是当事人的“取证”行为,难以评价为法院诉讼程序保障中的“保全”。思及如此,在我国建设智慧法院的进程中,最高人民法院搭建独立的职权保全区块链系统,可以一定程度削减第三方区块链电子数据保全平台非中立性、在诉讼中当事人与保全技术提供者身份混同、底层FACTOM技术源自境外技术服务平台、需与法院互联网系统对接和收费差异大等弊端。即便司法区块链统一保全的实践先行,证据保全理论上的程序包括裁判和实施两个部分,前者属于严格的司法行为(17)参见张卫平:《民事证据法》,北京:法律出版社,2017年第1版,第174页。,需要对强制性或实质性保全进行必要性审查,区块链技术取证目前已经完全不需要法院进行必要性审查,而由当事人启动后智能合约直接生成。由此一来,证据理论系统闭环路中诉前保全的申请、管辖、审查、担保、保全错误救济等一系列关联理论规定都被空置,法院电子数据诉前保全成为了独立的短链小环节,甚至成为与其他环节脱离的“断链”。
(二)司法公信取证概念图式嫁接价值无涉技术的排异性
民事诉讼的程序操作是基于司法公信,而区块链制度是去信任化的。区块链的去信任化最初是面对社会金融中介和货币国家管控的失信状况而设计的。区块链1.0时期可实现的最大价值是改变金融市场信用保障(18)See Riley T.Svikhart.Blockchain’s Big Hurdle.70 Stanford Law Review Online,2017,pp.101-111.,与金融领域多离散关联方的应用场景贴合度极高。但证据在调取过程中不存在类虚拟货币似的流转。我国目前社会治理中倡导的信用构建是一个复合性的涵涉,既有经济学的角度,也有社会道德关系的范畴,民事诉讼法律关系主体间核心聚合性决定了在电子数据保全中不可能完全去信任。
比特币作为区块链最成熟的应用领域,其基本架构包括数据层、网络层、共识层、激励层、合约层和应用层。目前我国最高人民法院正在着力搭建的区块链统一平台及三家互联网法院已经上线运行的司法区块链继续维系中都刈除或改造了无法贴合的共识层和激励层,直接选择电信科技企业合作,使用虚拟云机或实体大算力电脑终端进行哈希值运算,也就是弃去比特币公链治理中的“挖矿”环节,因此无需对第一个成功挖矿的矿工进行生产比特币的奖励,也无需其他节点达成运算激励共识,最终实现不涉token(币)的应用。因此区块链证据形成的过程对当事人和利害关系人来说都是“黑盒”操作,自身参与不高,且对于区块链电子数据取证的信任仍是传统的对立法或司法的信任,没有达到去信任化的机制初衷。
对司法机构的信任是一种对声誉信任的法律正当化。凯文·韦巴赫(Kevin Werbach)在2018年所著的《区块链和信任的新体系结构》中概述了四种不同的“信任体系结构”:首先是对等信任,基本上与我们的道德和名誉体系相对应;第二个是利维坦信任,它对应于机构信任;第三个是中介信任,信用卡系统就是一个很好的例子;第四个信任体系结构是分布式信任,这是对特定安全系统(区块链)的紧急信任(19)Bruce Schneier.There’s no good reason to trust blockchain technology[J].Available:https://www.wired.com/story/theres-no-good-reason-to-trust-blockchain-technology/.2019.。区块链的作用是将对人和机构的某些信任转变为对价值无涉技术的信任,司法实践的初衷是愿意信任人类法律体系还是某些自己无法专业监控的计算机代码的细节呢?
(三)法院电子数据诉前保全伪用区块链技术层功能样态
法院依托互联网法院改革试点,大力探索“网上纠纷网上审理”的司法新模式,推动实现案件起诉、立案、调解、举证、质证、庭审、宣判、执行等诉讼环节全部在线完成(20)参见最高人民法院:“中国法院互联网司法白皮书”第20页,https://tech.sina.com.cn/i/2019-12-05/doc-iihnzhfz3713411.shtml,最后访问时间:2019年12月6日。,实现全程留痕。法院自有区块链平台保全证据,只是网上全流程司法模式的一个环节。虽然上链电子数据可能实现不需要借助额外公证,但也并非可以直接采信,仍需要进行庭审质证与认证工作,并最后作为案卷留存至法院内部存储系统之中。电子数据保全后,要与其他证据一样按照证据顺序和举证规则提交。至于保全证据的归档问题,目前法院尚在进一步探索中。
法院电子数据保全系统由表及里的层构中,应用层作为法院、诉讼参与人、公证机关等节点可以直接操作的界面展示,电子数据区块链需要考虑的是应用功能对内入口与对外诉讼程序、保全费用计算预交等技术的对接问题。杭州互联网法院目前开放的三类案件应用层中,当事人端口与案由数量相比仍显不足。按照当前平台案件类型进行功能窗口设定,会导致功能窗口繁多;而如果按照电子数据的主要形式功能等进行设定,则更为简易可选且易于证据后续环节的质证认证。
为产出统一的哈希值结果,合约层与共识层存在共识算法、智能合约函数的选取、防攻击、更新、紧急修补等策略问题。
其中合约层的智能合约使用SCL(Structured Control Language 结构化控制语言)编写,可去除案外第三方干扰,进行不可逆的可信交易,增强网络的去中心化。智能合约是一种合约层核心涵盖电子信息化方式传播、验证、共识、执行的计算机协议(21)See Nick Szabo,Smart Contracts:Building Blocks For Digital Markets,Extropy:The Journal of Trahumanist Thought,1996(16).,可以将传统协议电子化并实现事件触发即执行,从而降低协议协商、签订和履行成本。智能合约的协议响应效率高、部署后运行监督成本低、第三方无涉的特性,使其不仅在合约层有代码程序贴合性,更是线上诉讼中多环节流程必然适用的基础性技术,无论是法院区块链取证平台上的虚拟云机还是其他应用情景同样可以执行预定脚本,所以该项技术也不是区块链所特有的亮点技术。
共识层使达成一致哈希值并运转系统成为可能,区块链中保全的电子数据要产生哈希值并达成分布式存储系统,就面临着共识一致性问题。共识算法涉及分布式系统中发起节点与其他参与节点如何达成一致的运算法抉择。目前,法院证据保全区块链系统的共识算法多为同一合作方提供的多个可信节点间的共识算法,摒弃了比特币中不可信节点间的共识算法。比特币区块链激励层中的互不相识参与者(矿工)必须要加大算力,购买高价矿机解决复杂但是无实用的哈希计算难题,从而将交易转账区块上链加入到区块链上。矿工挖矿获得奖励是比特币系统不断成块的内生动力引擎。矿工之间是公开竞算关系进行交易记账而不依靠类似于银行的中心节点,在比特币技术中各节点挖矿成功的矿工主要依靠共识算法进行判断。几种现有共识算法包括:首个算法POW(proof of work,工作量证明),该算法属于初代算法,速度拖慢并会消耗大量的能源,已逐渐面临淘汰;此外还有POS(proof of stack堆栈证明)、PBFT(practice Byzantine fault tolerance实用型拜占庭容错协议)、高吞吐的dBFT(Delegated Byzantine Fault Tolerant,委托拜占庭协议)和DPOS(delegate proof of stack委托堆栈证明)等算法。而法院区块链电子数据诉前保全的可信节点一致性协议中Multi-Paxos(不存在拜占庭将军问题)和Raft及其相应变种算法具有高容错率、适合集群一致达成的特点而被广泛应用,PBFT(Practical ByzanTIne Fault Tolerance实用拜占庭容错算法)及其变种算法也是与联盟链有天然契合性的共识算法。当前形势下,电子数据保全只作为单独联盟链且无恶意节点或过多故障节点,选取可信节点一致性的算法才与保全应用具有更高贴合性。也就是说,目前法院电子数据诉前保全合约层与应用层的算法和运行相较于比特币系统的应用都更加初级和简略。
最后网络层的系统沟通联结验证机能可以与底层区块链技术形成融合,是区块链技术应用于电子数据保全的基石部位。经过哈希运算一致得出的哈希值(hash values)是最终证据的“身份码”,其类似符码指纹或索引摘要,选择某一固定哈希值运算法则具有等幂性,在初始数据预映射(pre-image)不变的前提下,无论多少次执行运算获取的散列哈希值都是同一的——即根据电子数据生成的哈希值固定,稍有差异或改动的电子数据生成的哈希值就会不同,根据对外公布的哈希值却不能逆向推算出源数据无法进行逆运算。已开发的哈希算法包括:早期的MD4(Message Digest 4)输出为128位符码,MD5(1991年针对MD4安全性的改进版,不具备”强抗碰撞性”)输出仍是128位符码,后期新兴的SHA(Secure Hash Algorithm)函数族,不断更新迭代生出SHA-1(1995年版)输出为长度160位符码、SHA-2(后续SHA-224、SHA-256、SHA-384、SHA-512算法的统称)。当前,SHA-3子算法已经提出,其中输出256位符码的SHA算法颇受业界认可。
哈希算法本身就是密码学中的一种加密形式。电子数据诉前保全区块链能够保障当事人的数据安全,主要是依靠密码学技术,其中牵涉hash算法、非对称加密算法、数字签名、PKI(Public Key Infrastructure,公开密钥基础架构)体系、Merkle树、同态加密等。这些密码技术可以实现电子信息的流程完整性、内容机密性、环节认证性和不可抵赖性。因此,只要有电子加密的需求,该技术作为底层搭建工具便具有贴合性,只是不同应用场景运用形式与选择存在间性差异(22)分别指人工智能AI、区块链Blockchain、云计算Cloud Computing、大数据Big Data。。区块链密码学技术上,当事人掌握的私钥由RA(Registration Authority)进行注册登记,并经系统审核通过,当事人必须牢记自己的私钥。在杭州互联网法院查看取证结果时,当事人输入的查询码为32位字符的存证编码,RA获取当事人的身份信息并确认用户的信息,CA(Certificate Authority)将用户的个人信息跟公开密钥链接。在比特币的非对称加密中,比特币钱包地址中包含一对解密钥匙:公钥与私钥(23)见图1 比特币交易流程环节及技术原理中第二、三、四、五、六个步骤中比特币私钥、公钥和钱包地址的产生。。比特币地址直接通过公钥单向哈希生成,而公钥则是通过私钥使用椭圆曲线算法生成,私钥通过操作系统底层生成256位的随机熵;比特币系统的私钥、公钥和地址生成通过OpenSSL(安全套接字层密码)库实现(24)See gocgocgo,The private key,public key and address of Bitcoin source code interpretation,https://blog.csdn.net/Tostick/article/details/80099395,最后访问时间:2020年10月11日。从杭州互联网法院2018年8月开放区块链取证平台至2021年7月生成的块数看,数量庞大的区块链取证存证系统对应使用的非对称加密形成电子数据对应的唯一哈希值过程,非对称加密的特征没有采用;时间戳的应用也完全不是区块链技术特有的,网络安装时间戳功能便可以对电子数据进行实时签章。 在比特币区块链技术应用中,最终交易信息的哈希值被收录在区块中,同一块中所有的交易生成一棵逐级哈希二叉树,称作Merkle Tree(默克尔树)。默克尔树是一种数据结构,数据存储于树状结构的叶子节点中,分叉节点两两哈希,生成上一层节点;上层节点再进行哈希运算,生成上一层,直至最后生成树根,称作默克尔树根。只有默克尔树根会保留在区块头中,以简约区块头的空间并便于交易多方验证。区块头中总体上包含父区块的哈希值、版本号、时间戳、难度值N、随机数nonces和默克尔树根。杭州互联网法院区块链取证平台每块区块(除原始块)都在包含上一区块的哈希和数据信息的基础上,形成新的块头和区块内容,并全程附有智能链条流程时间戳,以此形成链状区块连接,最终整体区块链技术体系得以建成并不断加入新的证据区块(25)效果与图1 比特币交易流程环节及技术原理中第十六个步骤中比特币区块的最终形成一致。。比特币系统的多节点记账能够记录每一个比特币的贸易流转,而电子数据生成后不会产生任何流转,每一份都是单独存证,所谓的区块链可追溯的特点也完全被摒弃了。
区块链电子数据取证平台整体上底层保留运行的区块链技术与表层取证存证只是框架上某些功能联结点有一定贴合,区块链技术中真正的核心价值功能已经被法院区块链电子数据保全取证平台摒弃,难以实现似比特币系统般的全方位技术贴合,导致司法保全取证平台难以显示分辩出区块链技术的底色,出现了变色。当然,与屏幕显示底色目标不同,法院证据保全区块链需要的是自身本色的显现,然而,其与底层区块链技术一旦跳色过多,也会出现上述功能初衷与技术架构过度脱离的问题。
五、结 语
科学技术对于诉讼程序的塑造比立法和司法的人为塑造速度更快。在高速趋步中,是否司法制度已被另一种纯粹的形式性理性裹挟而丧失自身的实质性理性选择?杭州互联网法院在该领域的大胆探索,已经为法院电子数据保全制度的创新提供了先例。在不断的技术加持下,法院整体智能化的构建,将引发一场技术革命和法律领域的范式转换。但将这种埃米尔·拉斯克所称价值意义无涉的自然科学应用于社会科学中,价值意义评价就成为需要跨越的界限屏障,使区块链技术留置于无涉地带而证据采信问题完全框架于法的空间是过于理想化的状态,技术与程序本身的贴合与背离,是搭建蓝图中整体设计思路必然贯穿的结构性布局问题。司法系统本身是一种社会系统,在这样的系统中民事诉讼是一个次级系统,系统内再分化出保全制度,而电子化时代环境的变化促进系统复杂度提升,再分化出电子数据取证。卢曼的系统理论主张,没有任何一种系统能使用或了解另一系统的符码,因为系统是封闭的,虽然系统闭锁的理论有待商榷,但科学的符码元素,与司法的符码元素跨系统的融合产生的排异性还是十分明显的。当前,法院电子数据区块链系统将一种通过高成本多节点建立信任的技术引入司法信任度极高的环境,同时对区块链核心技术进行大刀阔斧的调整,称其为区块链技术的伪应用并不为过。忽视技术与应用之间的非贴合点,将成为彻底解决技术聚合融通问题的路径上的认知性障碍。