智能交通系统隐私保护方案综述
2022-04-29施炎峰王心莹朱相如李琼
施炎峰 王心莹 朱相如 李琼
摘要:随着云计算、物联网的快速发展,智能交通系统(ITS)日益成熟。ITS在大大促进交通便利的同时,也给用户的隐私安全带来了潜在的威胁,导致其敏感数据更容易受到攻击。因此,该文针对智能交通系统,分析当前各种主流ITS隐私保护方案的优缺点,为ITS各种场景选择合适的隐私保护技术提供参考,并提出未来需要进一步研究的问题,以更好地保障智能交通系统中的数据隐私。
关键词:智能交通系统;隐私保护;数据安全
中图分类号:TP311 文献标识码:A
文章编号:1009-3044(2022)04-0041-03
智能交通系统(ITS)作为一种大范围、全方位覆盖的运输和管理系统[1],依托于近年来物联网的迅猛发展,将先进的控制、传感、通讯、信息技术与计算机技术高效结合,综合应用于整个交通管理体系。由于其极大地缓解了交通拥堵,有效减少了交通事故的发生,提高了交通系统的安全性,减少了环境污染,因此成为物联网领域中最具代表性的应用。ITS囊括众多分支系统,主要包括出行者信息系统、交通管理系统、公共运输系统、车辆控制和安全系统、不停车收费系统、应急管理系统,以及商用车辆运营系统等。各系统之间各司其职、相辅相成,有效改善交通状况。
ITS起源于20世纪60年代,其概念在1990年首次被美国智能交通学会提出。我国的ITS则起步于20世纪80年代末的公路收费系统,并且于90年代末成立交通智能运输系统工程研究中心。之后的二十多年至今,得益于物联网、云计算、人工智能等技术的衍生,ITS发展愈加迅猛。
为了更好地实现智能交通系统组件之间的互联,一些无线通信技术,如蓝牙、Wi-Fi、卫星通信系统和毫米波等被广泛应用。这些无线通信技术在带来便利的同时,也引入了威胁系统安全的漏洞。此外,ITS组件较为松散,这也为攻击者提供了机会。智能交通系统主要由车载嵌入式软件控制,攻击者一旦成功侵入系统,就能盗取大量敏感信息,甚至控制车辆,严重威胁用户安全。因此,在ITS迅速发展的同时,如何保障ITS中的隐私信息是智能交通系统能够顺利安全运行的关键问题。
本文针对当前智能交通系统中的个人隐私、车辆隐私和位置隐私等,分析当前智能交通系统中隐私保护技术的优缺点,以指明未来的研究方向。
1 常用隐私保护技术简介
(1)假名化技术
假名化的概念在RDPR、CCPA中被定义为用新的标识符来代替真实身份的一种技术。当攻击者无法获得密钥或假名映射原始标识的表单时,则难以破解真实身份。常用的假名化技术有哈希函数、带密钥加密、带密钥的哈希函数以及令牌化等,相较于直接使用真实身份信息,假名化降低了隐私泄露风险。然而假名化是可以恢复身份信息的,处理过后的信息仍适用于个人信息保护的法律法规。
(2)匿名化技术
匿名化要求去标识化,真实数据在匿名化后无法再连接到特定的个人。因此,匿名化后的数据不再属于个人信息。相较于假名化,匿名化保密性更高,不过数据效用性更低。常见的有k-匿名,l-多样性等。
(3)差分隱私
差分隐私是用来防范差分攻击的。差分隐私算法在查询结果中添加的随机化噪声,使得攻击者无法通过匿名数据集还原数据。该技术具有高度保密性,受到了广泛的关注。
(4)区块链技术
相较于其他技术,区块链技术具有去中心化、公开透明、不可篡改等特性。它起源于化名为“中本聪(Satoshi Nakamoto)”的学者在 2008 年发表的奠基性论文《比特币:一种点对点电子现金系统》,也正是该技术催生出了比特币。现如今的区块链技术正由数字货币领域慢慢向其他领域渗透。
2 智能交通系统隐私保护方案研究现状
(1)假名化实现ITS隐私保护
假名化保证第三方访问者在没有额外信息的条件下无法识别用户身份信息,用于识别身份的额外信息必须与假名化后的个人信息分开存储以保证隐私。这种假名化方案因其效率高,在ITS隐私保护中拥有良好的应用前景,但仍然存在着重构敏感信息攻击、计算量高、存储量大等问题。
当然,最直接的问题还属当前传统基于假名化的系统需要车辆与受信中介一直保持联系。因此,Victor 等人于2016年提出了新的方案[2],使得车辆假名可以实现自动更新。在该方案中,车辆只需与受信中介联系一次,此后不需联系也能更新假名,但是该方案的计算复杂度较高。2020年,Qi等人设计了一种高效率且能够安全撤销用户假名的方案,该方案中还引入了布隆过滤器来缩小证书吊销列表 CRL 的规模以降低管理成本,但是该方案严重依赖于可信任的第三方机构[3]。这两种方案的性质对比如表1所示。
从上表可知,当前的假名化方案仍然无法很好地平衡假名更新效率以及对第三方机构依赖度,因此如何解决该问题是未来亟须解决的问题之一。
(2)匿名化技术实现ITS隐私保护
匿名化技术具有数据可用性和无法重识别两个特点。该技术在保证数据不会被重新还原的情况下,尽可能少地模糊数据,以保证数据能够进行必要的分析。k-匿名化是相对常见的匿名化手段,在智能交通系中匿名化也被认为是重要的隐私保护手段。在保护位置、用户和服务器的隐私中都可以发挥重要作用。
2017年,Sui等人提出重点保护个人位置轨迹隐私的方案,通过评估个人与位置间的相关性,达到了避免过度保护的目的。不过该方案主要针对移动偏好攻击,对其他攻击的抵抗能力有限[4]。为了有效地阻止攻击者通过轨迹推断出用户的敏感数据,Liu等人于2020年提出了一种新的匿名化方案IEVS[5],该方案可以提供较高的隐私级别和数据效用性,不过计算开销较大。两种典型的匿名化方案性质对比如表2所示。
然而,在基于匿名化的隐私保护方案中,中间机构往往掌握了大量的用户敏感信息,如何对第三方机构是实现敏感信息的保密对当前匿名化技术来说仍然是一个开放性问题。
(3)基于区块链的ITS隐私保护
区块链是一种公共的分布式账本。这种技术将一个个数据区块像链条一样连接在一起,这种链状数据结构包含两种哈希指针,使得数据难以修改,并且由于所有数据都是公开透明的,因此也不需要中介。区块链被认为是数字现金系统的重要发明。事实上,区块链的应用可以更为广泛。它的“不可伪造”“全程留痕”“可以追溯”“公开透明”“集体维护”等特征,决定了区块链具有更加广泛的应用前景,特别是可以用来更好地解决智能交通系统中的隐私与安全的问题。
2018年,Hirtan等人使用区块链技术设计了一个汽车导航系统的架构[6],该系统通过受信任的第三方机构来集中管理区块链,降低了开销和计算量,缺点是该方案不具有向后兼容性。2019年,Bao等人提出了基于区块链的假名管理方案[7]。由于现在流行的假名化方案存在一些问题,比如成本会随着假名数量的增加而增加,这大大降低了在经济上的可行性。Bao等人提出的基于区块链方案提供了一种从分布和再利用两个方面有效地实现人口年龄假名的方法,以及一种物理混合区与虚拟混合区相结合的假名变更方案。且通过攻击分析和性能评估证实了该方案的确可以以更低的成本实现更好的匿名性。但是该方案虽然提高了成本效益,但是仍然存在内存需求过大的问题。因此,2020年,Li等人在现有的 ITS 体系结构上引入了一个区块链覆盖层来处理安全和隐私保护,这种机制将区块链技术整合到ITS中,并且同时保证了隐私保护和向后兼容性。在之前基于区块链的ITS隐私保护方案中,区块链节点的高计算量和不高的延展性一直没有被考虑。所以该方案提出的区块链协助智能交通系统(ba-ITS)中,提出了分层区块链,以保证ba-ITS良好的可延展性和降低对区块链节点的要求。同时,该方案还实现了基于以太网的 Ba-ITS原型系统,并在ns3中实现了两个实例服务和仿真,对其进行评价,该方案的安全性和兼容性都相对较好,具体性质对比如表3所示。
随着区块链技术的发展,基于区块链的ITS隐私保护技术已经成为新的热点。但是当前基于区块链的方案效率仍然不能令人完全满意,如何进一步提高效率是未来需要解决的关键问题之一。
(4)基于机器学习的ITS隐私保护
机器学习在许多领域发挥了重要作用。在智能交通系统中,机器学习模型可以充分分析车辆产生的数据,使得交通网络更加安全稳定,弊端是分享与本地模型相关的信息可能导致与车辆用户相关的敏感数据模式的泄露。
2020年,Agrawal等人探讨了协同机器学习在隐私保护方面所特有的一些问题[9]。他们认为群签名方案能够很好地解决该问题,并且在文章中提出群签名方案并评估了该方案解决CML场景中特有隐私问题的可行性。
此外,ITS端到端通讯存在数据冗余和隐私问题。Muhammad Usman等人提出了一个基于多级边缘计算架构和机器学习算法的框架,命名为 SPEED[10]。该框架可以保证LTEDs与LTEDs 间传输时的隐私安全。
(5)基于差分隐私的ITS隐私保护
差分隐私可以实现在保护隐私数据的同时仍然允许在交通分析或道路收费等专用应用程序中合理使用这些隐私数据。
2013年,Kargl等人提出一种集成差分隐私和额外安全机制的框架[11]。他们还研究了如何在应用程序精度要求范围内校准隐私参数,同时考虑最终用户的长期隐私效果。然而,ITS的一些应用程序要求精确的数据,不能够引入噪音,这成为差分隐私在ITS应用中的一大挑战。
(6)ITS中的隐私数据分析技术
在之前提到的匿名化方案中,机构掌握过多的敏感信息。为此,2016年,Zhu等人在同态 Paillier 密码体制的基础上构造了一个改进的多维聚集方案[12],特点是用户隐私无需解密,因此可以保证机构无法掌握用户隐私,不过该方案依赖于数据聚合器的可信度。因此,2017年,Gosman等人提出了一种保护时间序列数据隐私的聚合方案[13],该方案在不可信聚合器存在的情况下依然可以保护隐私,代价是用户无法获得细粒度信息。
(7)其他ITS隱私保护技术
对于当前利用无线接入技术频繁收集数据中易引入针对数据安全和隐私攻击的问题,2018年,Mahmood等人提出了更为安全的收集大数据的基本系统模型[14]。
对于车辆、基础设施之间相互认证的问题,Ometov等人在2019年提出一种对车辆和路边单位间安全通信协议的改进方案 [15],该方案通过车辆和基础设施之间的相互认证来改善定位数据的隐私。
对于感官数据的隐私,2019年,Jolfaei等人提出了一种轻量级排列方案用以保护感官数据的机密性[16]。
3 总结
随着智能交通系统在国内的迅猛发展,隐私保护的问题也亟待解决。本文主要探讨了目前ITS隐私保护的几种方案。基于假名的方案成本较高,基于匿名化的方案和基于机器学习的方案中间机构掌握大量敏感信息,基于区块链的方案计算量大,基于差分隐私的方案无法支持要求高精度数据的应用程序。因此,针对当前各种ITS隐私保护方案仍然存在的问题,在未来的研究中,我们需要针对不同场景和不同技术,设计更为优化的方案,以更好地保护智能交通系统中的隐私信息。
参考文献:
[1] 赵娜,袁家斌,徐晗.智能交通系统综述[J].计算机科学,2014,41(11):7-11,45.
[2] Sucasas V,Mantas G,Saghezchi F B,et al.An autonomous privacy-preserving authentication scheme for intelligent transportation systems[J].Computers & Security,2016,60:193-205.
[3] Qi J Y,Gao T H.A privacy-preserving authentication and pseudonym revocation scheme for VANETs[J].IEEE Access,2020,8:177693-177707.
[4] Sui P P,Li X X,Bai Y.A study of enhancing privacy for intelligent transportation systems:$k$-correlation privacy model against moving preference attacks for location trajectory data[J].IEEE Access,2017,5:24555-24567.
[5] Liu X W,Zhu Y Q.Privacy and utility preserving trajectory data publishing for intelligent transportation systems[J].IEEE Access,2020,8:176454-176466.
[6] Hîrtan L A,Dobre C.Blockchain privacy-preservation in intelligent transportation systems[C]//2018 IEEE International Conference on Computational Science and Engineering.October 29-31,2018,Bucharest,Romania.IEEE,2018:177-184.
[7] Bao S H,Cao Y,Lei A,et al.Pseudonym management through blockchain:cost-efficient privacy preservation on intelligent transportation systems[J].IEEE Access,2019,7:80390-80403.
[8] Li Y H,Ouyang K,Li N X,et al.A blockchain-assisted intelligent transportation system promoting data services with privacy protection[J].Sensors (Basel,Switzerland),2020,20(9):2483.
[9] Agrawal V,Ansari A,D H S.A secure and privacy-preserving collaborative machine learning system for intelligent transportation system[C]//SAE Technical Paper Series.400 Commonwealth Drive,Warrendale,PA,United States:SAE International,2020.
[10] Usman M,Jan M A,Jolfaei A.SPEED:a deep learning assisted privacy-preserved framework for intelligent transportation systems[J].IEEE Transactions on Intelligent Transportation Systems,2021,22(7):4376-4384.
[11] Kargl F,Friedman A,Boreli R.Differential privacy in intelligent transportation systems[C]//WiSec '13:Proceedings of the sixth ACM conference on Security and privacy in wireless and mobile networks.2013:107-112.
[12] Zhu H,He X Y,Liu X M,et al.PTFA:a secure and privacy-preserving traffic flow analysis scheme for intelligent transportation system[J].International Journal of Embedded Systems,2016,8(1):78.
[13] Gosman C,Dobre C,Pop F.Privacy-preserving data aggregation in intelligent transportation systems[C]//2017 IFIP/IEEE Symposium on Integrated Network and Service Management.May 8-12,2017,Lisbon,Portugal.IEEE,2017:1059-1064.
[14] Mahmood A, Zen H, Hilles S. Big Data and privacy issues for connected vehicles in intelligent transportation systems[J]. arXiv preprint arXiv:1806.02944,2018.
[15] Ometov A,Bezzateev S,Davydov V,et al.Positioning information privacy in intelligent transportation systems:an overview and future perspective[J].Sensors (Basel,Switzerland),2019,19(7):1603.
[16] Jolfaei A,Kant K.Privacy and security of connected vehicles in intelligent transportation system[C]//2019 49th Annual IEEE/IFIP International Conference on Dependable Systems and Networks – Supplemental Volume (DSN-S).June 24-27,2019,Portland,OR,USA.IEEE,2019:9-10.
收稿日期:2021-09-28
基金項目:江苏高校哲学社会科学研究项目“基于区块链智能征信系统及其隐私保护机制研究”(No. 2021SJA0448);江苏省自然科学基金资助项目(No. BK20210928);江苏省大学生实践创新训练计划(No. 202111276011Z);南京工程学院高等教育研究立项课题资助(No.2021ZC13);智能交通数据安全与隐私保护技术北京市重点实验室研究课题资助
作者简介:施炎峰(1986—),男,江苏人,讲师,博士,主要从事大数据安全、区块链技术以及隐私保护技术研究;王心莹(2001—),女,江苏人,本科生,网络专业;通信作者:朱相如(2001—),男,江苏人,本科生,软件工程专业;李琼(1988—),女,河南人,实验师,硕士,信号与信息处理专业。