APP下载

网民对无人驾驶态度的调查
——基于微博数据的话题模型与情感分析

2022-01-12穆春宇

关键词:无人驾驶负面无人

徐 琳,穆春宇

(杭州电子科技大学 法学院,浙江 杭州 310018)

随着科技的不断发展,越来越多的新兴技术得到应用。无人驾驶作为汽车未来的一种研究方向,对汽车行业、交通运输业乃至整个社会都有着深远的影响。2015年国务院发布《中国制造2025》,将自动驾驶作为汽车产业未来转型升级的重要方向,制定了明确的技术发展时间线:2025年将实现L4、L5级别的自动驾驶,即无人驾驶。民众对无人驾驶的讨论也不只是停留在科技层面,而是进入了伦理学、法学、社会学等更多更宽广的领域。

无人驾驶技术尚未广泛应用除了受到自身技术的限制、法律法规的亟待完善等因素影响以外,还与公众态度有着密切的关系。国内外研究者调查发现,公众对无人驾驶持有较为积极的态度[1-3],但是对无人驾驶的安全问题普遍表示担忧[1,4,5]。中国民众对无人驾驶的态度比欧美民众的态度更为积极、开放[6]。这些调查为我们了解公众对无人驾驶的态度提供了重要的参考。然而,与无人驾驶有关的交通事故以及与之相关的法律判决对公众的态度会造成何种影响还有待研究。以“Uber无人车致死不负刑责”这一新闻所引起的微博热议为研究对象,通过文本分析微博网民的评论,探究网民对“Uber无人车致死不负刑责”的态度,为进一步了解公众对无人驾驶的态度提供依据。

一、研究方法

话题模型和情感分析是对大量文本进行分析的方法。话题模型(Latent Dirichlet Allocation,LDA)[7]可以通过非监督机器学习,从海量文本中提取有意义的话语框架[8],揭示文本中潜在的主题结构,而情感分析可以反映网民的态度倾向[9]。

为避免博文内容的态度倾向对微博评论产生影响,本次调查选取了中立的、没有表达对“无人车致死不负刑责”一事看法的博文14篇。这14篇博文分别来自自媒体和公共媒体,采用同一篇报道,并附带同一个视频。通过爬虫收集14篇博文下自2019年3月7日至2019年5月8日两个月内共计1 257条相关评论。对文本进行预处理,对数据进行清洗,删除评论中无用的内容,如URL、@昵称、回复等词、“的得地”等无实际意义的词及标点符号、特殊字符等。采用Jieba分词系统对清洗过的数据进行了分词处理。将分词后的数据进行汇总,构建描述文档词频的矩阵,之后使用python的开源包gensim进行LDA模型训练[10]。根据模型拟合结果估计出每个话题对应的核心关键词及其概率,结合原始评论解读话题的含义。采用Python的中文文本分析程序包SnowNLP对文本和每个话题进行情感分析。

二、结果与分析

(一)话题模型

话题个数的确立主要考虑话题的可解读性及话题一致性指标的大小。一致性指标是通过计算一个主题中高分词语之间的语义相似性得到的主题得分[11]。检验设定1-10个话题时一致性指标的大小。综合考虑一致性指标及话题的可解读性,最终采用话题个数为5的模型进行解读。

由于实际的话题模型分析中,模型拟合结果往往包括很多个话题,而每个话题又包含很多的词项分布,这使得解读不同话题的含义成为一件困难的事。可视化技术为此提供了一种辅助的解决手段。使用pyLDAvis模块对模型进行可视化分析,确定了最终的话题模型,每个话题下取最重要的10个关键词,详情见表1。

表1 话题模型结果(最重要的10个关键词)

人机对比:话题1由“开车、违规、比例、人类、交通事故、证明、程序”等关键词构成,对人类驾驶和无人驾驶进行比较,探讨人与机器的区别。例如,一条微博评论写道:“你看了文章吗?人家说了是在路测,既然没有正式应用肯定是存在问题的,况且出现事故是因为老人不遵守交通规则,这并不能证明智能驾驶不如人工驾驶吧。”而相反的观点认为:“事实证明车还是要人来开才放心”。一部分人持有“人都做不到,机器怎么能做到”的观点,这种观点虽然一定程度上表达了对无人驾驶技术的宽容,但从另一方面讲,也是对无人驾驶技术没有信心,认为无人驾驶无法代替人类。一些微博评论探讨了无人驾驶与人类驾驶的事故比例哪种更高,例如,一评论提到“多少人在开车就有多少无人驾驶车辆,才可以按比例对比,如果那样还是这个伤亡比例,那就完全证明无人驾驶安全。”

法律与判责:话题2由“测试、刑事责任、刑责、责任、承担、法律、民事责任”等关键词构成,对无人驾驶车辆在事故中应承担的责任进行探讨。当出现交通伤亡事故,交通事故责任主体应当如何认定,无人驾驶车辆是否能够作为责任主体[12-13],生产无人驾驶车辆的企业是否要承担责任,对此,有微博评论认为汽车生产者无需承担责任,例如有评论写道:“菜刀砍死人菜刀厂也有责任吗?责任是司机和路人的。”也有人认为汽车生产者需要承担一定的责任,如有评论指出:“副驾安全员有责任同时公司未考虑周全风险也有责任不过是责任大小而已。”有人对无人驾驶所带来的法律困境进行思考,例如有微博评论提出“法律修正也要‘与时俱进’。人工智能的飞速发展,给传统刑法理论带来了全新挑战:依刑法理论,交通肇事罪的主体是自然人,罪过形式是过失,但无人车的主体和罪过形式都不符合。如果不成立交通肇事罪,按无罪处理,又不符合国民朴素的正义价值观。若追究无人车设计者的刑事责任,将面临更多理论难题。”该话题的另一个焦点则集中在判责的探讨上,如有评论提到:“就是按照中国法也是无刑责,主观没有故意,只剩下过失,即便按交通肇事罪来审查,交通运输管理法规也没有规定无人驾驶的相关条文,罪行法定,凭什么负刑事责任?”“没有刑事责任,绝对承担民事责任,巨额赔偿肯定是逃不掉的”“人工智能要不要负刑事责任,国内外法律界有很多探讨的。这个明显备用驾驶员责任更大。”

行人违规:话题3由“情况、横穿马路、两个、斑马线、路况、看不到、备用”等关键词构成,对该事故发生时行人的违规情况开展讨论。如有微博评论写道:“第一夜晚横穿马路,第二未走斑马线,就算是正常开车也反应不过来,而且刹车也有刹车距,肯定会出事啊”“看了完整视频,实在不行还有行人出现的快速干道上,且光线严重不足,不是车灯照到了,根本看不到,就算是人为驾驶。那女的也挺作死的”“雷达探测不到吗?逆光清晰吗?有闪光灯吗?说到底,除了车子自动驾驶不靠谱,晚上穿黑色衣服横着穿马路不看车的人也该死,因为司机根本看不到!吓死人了!”该话题下的评论关注“被撞行人的所作所为”,对“行人违规”一事有较多负面的评价。

车辆驾驶:构成话题4的关键词有“刹车、视野、距离、国内、方向、路上、高速、成像”等,从车辆驾驶的角度分析事故发生的原因。如有微博用户写道:“你以为说停止就停止呢。人的反应时间是0.5秒以上,机器只有0.0几秒,但是就算0.0几秒,这个惯性加速度也足够骑车冲几米了。但是反正最灵敏的人,马上踩刹车也要冲至少十几米的。喷之前不考虑物理情况?”“天要下雨娘要嫁人你这说的都是极端问题。刹车也有个安全制动距离”,其他相关的微博也大多关注视野开阔情况、探测距离和刹车安全制动距离、热成像检测等对驾驶安全的影响。和话题3侧重在行人角度相比,话题4的议论主体则变成了“车”和“驾驶”本身。

无人驾驶技术:话题5由“公司、数据、道路、人工智能、国外、检测、识别、万公里”等关键词构成,反映了人们对无人驾驶技术本身和未来发展的关注。如一位微博用户评论道:“100万公里的数据实在太小了,都不足一个小城市一天的数据。”这是从“无人车驾驶数据”的角度去考量。还有的微博用户表示了对无人驾驶技术未来发展的担忧,如:“人工智能汽车在未来一定是个大蛋糕,可是现在应用技术有限”“假如,以后智能汽车发展到L4L5级,安全员发现情况需要人类接管,而人工智能拒绝人类接管,怎么破解?”一些微博用户表达了对无人驾驶的识别和检测功能的不满,如一位微博用户写道:“以这个车速这个视野的话、我估计也反应不过来……感觉像是在县道上开车的感觉……不过专业电动车特斯拉那种各种传感器齐备、应该能检测出来吧、uber这款好像是汽车上改装的?可能传感器不完备吧。”还有一位微博用户写道:“这种突发情况人没看清或许可以理解,自动驾驶居然没有识别出来。”

(二)情感分析

对文本进行情感分析,结果发现,极端的正面评论和负面评论数量都比较多。在微博中除了对评论本身可以进行点赞之外,还可以对评论进行评论。而在观点的争论过程中,容易出现群体态度极化,网络的匿名性加剧了态度极化的趋势[14]。情感值为0.5时,也产生了一个小高峰。结合文本发现,情感值中立的评论大多是对无人车一事进行纯粹观点上的评论,而没带有很多可供判断的情感词。

分别对五个话题下的微博评论进行情感分析,结果发现,在话题1人机对比的探讨中,中性情感值的评论数量最多。无论是正面情感值还是负面情感值的评论数量都较少。话题1对比了人类驾驶与自动驾驶,多为观点性的讨论,并没有明显的情感倾向。话题2到话题5的情感分布总体上呈“L形”分布,在负面情感上均出现较高的峰值。话题2法律与判责在中性情感处也出现了一个小峰值,说明具有中立情感的评论也较多。话题3行人违规相比其他话题,正面情感数量更少,在观点表达上更趋负面。话题4车辆驾驶相比其他话题具有更多正面情感。话题5无人驾驶技术则包含更多的负面情感。

通过比较话题模型的情感分析与总体的情感分析发现,在话题模型中,除了第一个话题,其他的话题都是负面情感的数量较多,正面情感的数量较少,而整体评论的正面情感与负面情感均较多,负面情感在话题分布上较为集中,正面情感的话题分布则较为分散,并未集中在这几个主要话题。这说明在网络中的负面情绪更容易聚集,这种聚集为情绪的进一步发酵提供了空间。

进一步分析点赞数最高的5条微博评论,如表2所示。从表中可以看到,点赞量最高的微博评论内容简短,只有一句“无人驾驶……但有两个副驾[doge]”,共计十个字,并配有一个“狗头”([doge])的表情,却获得了1366个赞。“狗头”表情是微博中最受欢迎的表情之一,具有调侃的意思。这句话把“无人”和“有副驾”(一般无人驾驶上路测试时会配备两名监督员)联系起来,隐含的语境是“不是说好无人的吗?怎么还有人”,配合“狗头”表情,表达了对无人车的调侃。这种调侃通过凸显不合理性,引起其他网民的共鸣[15],表达了对无人驾驶技术未达到预期的不满。通过这种调侃,“民众的心理得以慰藉和平衡,情感得到了释放或满足。”[16]由此可以看到,网络上的言论往往带有情绪化宣泄的特征。

表2 点赞数最高的5条微博

点赞量排名第二的微博评论对违规问题表达了自己的愤怒,“横穿马路”“违规找死”等字眼配合叹号这种标点符号,很强烈的表现了评论者本人的情感。这与话题模型中对行人违规的关注与负面情感居多的结果一致。点赞量排在第三与第四的微博评论在一定程度上表达了对当前无人驾驶功能的不满,虽然点赞数远少于前面两条,但也具有一定代表性。点赞量排名第5的微博评论则对无人驾驶更加的包容。

从情感分析的结果看,网民对“无人驾驶技术”话题的评论表现出更多的负面情感倾向,并对当前的无人驾驶功能表示不满,这说明人们对无人驾驶技术的发展有更高的期待,即人们期待无人驾驶能够实现的功能远高于实际无人驾驶车辆目前能够达到的水平,这可能与无人驾驶的夸大宣传有关。关于自动驾驶的分级被普遍采用的标准是国际汽车工程协会(SAE)提出的五级自动驾驶分级方案。其中L0指的是人工驾驶,L1-L3都是辅助驾驶系统,人类驾驶员需要干预,L4-L5是完全自动驾驶系统,一般无需人类干预。Uber的无人车还处于L3水平,与真正的无人驾驶还有很大的距离。除此之外,公众对无人驾驶技术的高期待也可能与我们一直以来强调高新技术发展的氛围有一定的关系[17]。

三、讨论与结论

采用微博网友的评论作为分析文本,在微博这个公众表达的舆论场,网民的观点容易出现情绪化,并在观点的交锋中走向极化,在极化过程中,负面情绪更具有聚集效应,采用话题模型和情感分析对网络评论进行分析可以为网络舆情的分析和引导提供有力的支持。

通过对“无人车致死不负刑责”这一新闻事件的微博评论进行分析发现,网民主要关注人机对比、法律与判责、行人违规、车辆驾驶、无人驾驶技术五个方面。由于这是一起行人违规被无人驾驶车撞死的事故,网民对行人违规表现出强烈的反感,而对于无人驾驶技术的不成熟感到不满和担忧。无人驾驶未来的发展,不仅要在技术上提高车辆安全性,还要考虑在宣传时不要夸大无人车的功能,以防人们对无人驾驶过度信任引发新的安全问题。

此外,网民对于无人车所带来的法律困境也存在矛盾和负面的情绪。人们一方面期待无人驾驶技术的发展,另一方面也希望健全相关的法律法规。随着无人驾驶的发展,更多无人驾驶车辆的上路,对于无人驾驶的法律责任和相关法规的制订也是刻不容缓。

研究还存在一些不足,一方面分析样本是取自微博网友的评论,而网友的态度能否推至整个公众的态度还需要进一步考察,另一方面忽视了微博这一场域下用户互动关系的存在,如转发、分享、“@”等,在以后的研究里可以结合互动关系,对群体态度的影响因素做更为深入的分析。

猜你喜欢

无人驾驶负面无人
战“疫”需求急呼无人驾驶车冲上前线
白沙门
反击无人机
正面的人和负面的人
11个自由贸易试验区将启用新版负面清单
北京第一条无人驾驶地铁试运行!你敢坐吗?
诗到无人爱处工
无人岛上的试验
无人驾驶飞机