基于区块链的高校文件存储系统的探究
2018-04-12梁志勇
梁志勇
(三亚学院信息与智能工程学院,海南 三亚 572000)
1 引言
Internet无疑是人类历史上最具有影响力的发明之一,特别是现在的“互联网+”时代,数据交互更加便捷,即使在移动行走的状态,人们也可以通过各种便携式终端通信设备随时与他人进行通讯。
HTTP无疑是目前最成功的网络传输协议,虽然历经20多年的发展,但是B/S模式却从来没改变。传统的高校文件存储系统大多基于HTTP协议,过度的中心化使得文件存储系统并不是特别的安全可靠。
IPFS全称Inter Planetary File System,中文名:星际文件系统,是一个旨在创建持久且分布式存储和共享文件的网络传输协议。IPFS是基于区块链技术的去中心化存储网络,是一种内容可寻址的对等超媒体分发协议。在IPFS网络中的节点将构成一个分布式文件系统。故IPFS对改进传统的、高度中心化的高校文件存储系统有着极大的帮助。
2 IPFS的技术背景
2.1 应用广泛的HTTP所存在的问题
(1)HTTP的高度中心化
Web的本意是去中心化,但随着时间的推移,使得它变得更加中心化,成为了一个脆弱、高度集中、无效且过度依赖骨干网的协议。一旦中心服务器遭受攻击,极易造成网络瘫痪。
(2)HTTP的低效化
由于过度的中心化,数据从中央数据中心分发的成本非常高,如果不是出于规模处理数据的需要,这一方法实际上是不划算的。
(3)HTTP过度依赖于Internet主干网
过度的集中化,直接的后果就是数据中心高度依赖Internet骨干网,即使允许冗余,但是一旦骨干网出现故障的时候,很容易出现各种问题。所以Internet骨干网并不健全,很容易被攻击。
2.2 IPFS相比HTTP的优势
(1)访问或下载速度更快
传统的网络下的HTTP协议,在访问量过大的情况下,很容易造成网络拥堵。此外,互联网中存储着太多重复的文件,若可共享,这些大量的重复文件则不需要存储在很多服务器上。IPFS通过内容寻址技术定位公有资源。它将文件通过Hash计算分散存储在不同的计算机上,用户访问一个文件,则按照哈希地址访问即可。另外,基于区块链技术的IPFS有着P2P的对等特性,它将文件碎片化存储在距离用户最近的计算机或服务器集群里,这使得文件加载速度大幅提升。
(2)数据更加安全,满足隐私保护
因为存储的文件都不在中心化的服务器,文件更安全,即使出现服务器崩溃或者光缆被破坏等情况,也不会导致文件的丢失,用户也能便捷地从其他节点中获得所需数据。同时采用了加密算法,使得黑客无从攻击,满足部分内容的隐私要求。
(3)减少数据冗余,节省资源
由于对重复的文件进行了优化处理,大幅度减少了网络中的冗余数据,从而更大程度上节约了网络资源。
3 IPFS
IPFS是点对点的超媒体协议,可以让网络更快、更安全、更开放。同时它还是一个面向全球的、点对点的分布式文件系统,试图将所有具有相同文件系统的计算设备连接在一起。
3.1 IPFS工作原理
(1)每个文件上传至网络都被进行Hash加密处理,同时生成数字指纹。IPFS通过网络删除具有相同Hash值的文件,通过对比Hash值来判断哪些文件是冗余重复的,从根源上尽可能减少重复冗余的文件。
(2)每个网络节点只存储它感兴趣的内容,以及一些索引信息,有助于弄清楚谁在存储什么。
(3)查找文件时,通过文件的Hash值就可以在网络查找到储存文件的节点,找到所需要的文件。
(4)通过IPNS(去中心化命名系统),每个文件都可以被协作命名为易读的名字。使得用户更加便捷地检索到所要查看的文件。
3.2 IPFS的作用
IPFS从根本上改变了用户的搜索方式,通过IPFS,用户能够直接搜索到想要的内容。当向IPFS询问Hash时,IPFS通过使用一个分布式Hash表,可以快速(在一个拥有10,000,000个节点的网络中只需20跳)找到拥有数据的节点进行检索,并使用Hash验证其是否是正确的数据。
3.3 IPFS的应用场景
(1)在/ipfs和/ipns下挂载全球文件系统
(2)挂载的个人同步文件夹,拥有版本功能
(3)文件加密,数据共享系统
(4)可以作为数据库:应用可以直接操作Merkle DAG,拥有IPFS提供的版本化、缓存以及分布式特性
(5)可以做(加密)通讯平台
(6)永久的Web,不存在不能访问的链接
4 基于IPFS的数据存储设计与分析
传统的高校文件存储系统是一个典型的中心化系统,网络则是常见的星型拓扑结构,一旦出现服务器或者网络故障,用户将不能正常访问文件,安全性能较低。同时随着时间的推移,服务器上所存储的文件越来越多,很容易出现冗余重复文件,不仅造成磁盘空间的浪费,同时降低用户检索文件的效率。
首先,将传统的文件存储系统改成IPFS的形式,利用高校的校园网将所加入的网络节点组成一个私有链。得益于IPFS的优点,私有链中的所有节点在校园网内都是对等的网络节点。用户可将文件通过Hash加密后保存于私有链中任何网络节点,并能根据需要取回本地。若本地节点文件丢失,也可以凭借其Hash值从校园网中的对等网络节点里找回。同时分布式的存储模式使得文件下载变得更加高速和稳定。
其次,IPFS的背景技术是区块链技术,使得存储在私有链上的文件很难被篡改。由于仅修改文件的名称不会改变其Hash值,故整个私有链的冗余重复文件将大大减少,能够最大程度上节约磁盘占有空间。同时文件进行了Hash加密,也保证了文件具有较高的安全性。
最后,对比同样是去中心化存储应用的SC(Sia Coin),主要适合于文件的安全保管,而IPFS是一个底层的互联网协议,致力于替代HTTP,实现的是网络间各个节点的文件读取、分享、交换。相比SC,IPFS更加适合打造一个全新的高校文件存储系统。
5 结语
互联网技术已经颠覆了整个世界,而如今区块链即将颠覆互联网。IPFS背后的技术对传统互联网的影响是深远的。虽然目前对于IPFS等区块链存储技术的运用并不是特别广泛,但是对于传统的高校文件存储系统的改进也是一次新的探索。虽然区块链技术的应用不是特别成熟,但是这绝对不是终结,通过区块链技术的进一步发展,一定会有更加优秀的技术改变整个文件存储领域,故该技术对高校文件存储系统的改进具有极大的革新意义。
参考文献:
[1]殷龙,王宏伟.基于IPFS的分布式数据共享系统的研究[J].物联网技术,2016,6(6):60-62.
[2]IPFS官网[E B/OL].https://ipfs.io/
[3]张亚娇,王枞.区块链技术在医疗数据安全存储中的应用[J].中国科技论文在线,2016.
[4]吴振铨,梁宇辉,康嘉文,等.基于联盟区块链的智能电网数据安全存储与共享系统[J].计算机应用,2017,37(10):2742-2747.