职场辱虐管理如何影响第三方情绪和行为?
——基于文本挖掘以及LDA主题模型的大数据分析
2022-04-13张卫国
曹 晨,张卫国,黄 俊,2
(1.西南大学经济管理学院,重庆400715;2.澳门城市大学商学院,澳门999078)
一、绪 论
2019 年美国Facebook(脸书)的一名华人工程师跳楼自杀,据媒体调查直接原因是不堪承受公司内部办公室政治的“玩弄”,该事件使职场辱虐管理现象被社会各界关注[1]。事实上辱虐管理普遍地存在于职场之中,根据2009年智联招聘的调查,超过半数的职员曾遭受过职场冷暴力。任何事件的影响都不是单一的,职场辱虐管理的后果可能扩散到观察或听闻他人受到辱虐管理的“第三方”,这些“第三方”意识到不公正现象的发生,并且引起他们的知觉或者情感评价[2]。
现有文献较多是对遭受辱虐管理的当事人开展研究。例如:基于自我认知理论,当员工遭受到辱虐,一方面他可能会倾向于认为自身价值较低,从而降低组织自尊感,进而减少建言行为[3],另一方面会倾向于对上司产生报复认知,从而激发员工的偏差行为[4];基于自我决定理论,辱虐管理会影响下属的心理健康[5];基于归因理论,受虐当事人会倾向于将辱虐归因于自身,从而引发组织公民行为[6];基于资源保存理论,遭受辱虐的员工感知到资源的减少,一是很难应付压力[7],二是产生情绪耗竭[8],三是引发工作-家庭冲突[9][10],四是降低工作绩效[11-13];基于社会交换理论,受虐当事人会降低对领导的信任,并会降低和上司的直接互动[14];基于社会学习理论,员工可能会模仿上司的辱虐管理,从而引发团队冲突[3]。
Tepper 提出:辱虐管理的研究若能兼顾“第三方”的视角,这将比仅从实施者、受虐者的视角来诠释更为全面和有力,从而丰富辱虐管理领域的研究[15]。但是,现有文献大多是把职场辱虐管理看作是实施者与受虐者之间人际互动的结果,却忽视了对处于同一生态系统中的“第三方”群体的影响[16-17],尽管少量学者理论探讨了辱虐管理可能导致第三方的愤怒或共情[18],以及偏差行为或工作绩效降低等[19],但是该领域的实证研究还付之阙如。加之,辱虐管理实证研究常用的自我汇报式问卷调查,被调查者可能会因为顾虑辱虐管理或偏差行为涉及职场中的阴暗面而作假,从而影响了数据的真实性[20]。因此,本文将以网络数据(哔哩哔哩视频弹幕网站以及微博上关于职场辱虐管理的第三方评论文本),基于文本挖掘及LDA 主题模型进行大数据分析,以期揭示“第三方”在目睹或耳闻辱虐管理之后会产生什么样的情绪影响与行为反应?是会“拔刀相助”么?还是会“沉默不语”呢?抑或是“疏远排斥”呢?
二、研究设计
(一)数据来源及处理
O'Reilly 和Aquino 提出,将“第三方”定义为观察到、听闻到、了解到辱虐实施者对受虐当事人做出辱虐行为的人,包括公司的同事、公司经理、公司里的下级员工等,这些“第三方”既不是直接受到不公和辱虐的当事人,也不是不公行为和辱虐事件的实施者[21]。首先利用Python 编写爬虫程序,爬取哔哩哔哩网站和微博上关于辱虐管理的评论文本作为“第三方”的评论数据来源,共爬取了34037 条数据。然后对爬取的文本数据进行了如下处理:(1)首先使用pandas 库进行数据的读取,对数据进行去重处理。(2)利用jieba 库对每一条文本数据进行分词、自定义词典和停用词过滤等处理。(3)使用空格将分好词后的词语连接起来,再利用jieba 和WordCloud 库,生成第三方评论文本的词云图。
(二)研究方法
使用python 和R 语言,利用情感词典对第三方的评论文本进行情感分类,并对主要的情感关键词进行聚类可视化;利用Python 和jieba 库提取评论文本的名词、动词和形容词,绘制拥有不同第三方情感人群整体描述的词云图,接着再只提取动词,绘制拥有不同第三方情感人群会采取何种行为的词云图;利用python以及gensim对第三方评论文本进行LDA主题模型分析。
(三)研究框架
首先利用jieba库对评论文本进行分词、自定义词典等处理,利用python和R语言编写程序对评论文本进行情感分类;再对处理好的评论文本,提取名词、动词以及形容词来绘制每一类情感的词云图,从而在整体上描述拥有不同第三方情感人群有哪些特征。然后只提取动词,绘制每一类情感的词云图,从而可以反映出拥有不同第三方情感人群会采取哪些行为和动作。最后,利用python和gensim 库,对全部评论文本作LDA主题模型分析,来研究第三方评论中主要关注的话题。
三、实证分析
(一)情感分类
首先,利用情感词典来对第三方辱虐管理评论进行情感分类,首先构造情感词典,根据已有情感词典及其分类,例如:中文情感词汇本体库,该情感词典是大连理工大学信息检索研究室林鸿飞教授团队整理和标注的一个中文本体情感词典。该情感词典对其中每一个中文词汇,分别从情感的类别、情感的强度、中文词语的词性以及中文词语的极性等不同角度进行了描述。该中文情感词典在国外很有影响力的Ekman 的情感分类体系上进一步地改进,Ekman 把情感分类6 大类,而中文情感词汇本体库,在此基础上把情感划分得更为细致。最终,该中文情感词典把中文词汇情感划分为7 大类别以及21 个小类别。该中文情感词典划分这么详细的目的就是在中文情感分类方面,能够提供一个更多情感分类类别的情感资源库,而不是只能划分为积极、中性和消极三类情感。因为在日常生活中多种情感的情况更为常见,因此该中文情感词典能够更好地处理多情感分类的问题。本文就是基于大连理工大学所开发的中文情感词汇本体库,参考了辱虐管理领域相关文献、问卷以及其他情感词典,最终对中文情感词汇本体库的情感类别重新进行了划分,最终构造了本文的情感词典,共分为共情、幸灾乐祸、害怕(恐惧)、沉默、愤慨、其他等六大类情感。
本文利用Python 和R 语言,首先对评论文本数据进行分词和标注,去掉每条评论样本的标点符号和特殊字符,例如:“@【】#¥$”,然后利用jieba 库对每一条评论进行分词、自定义词典、停用词等处理。然后,对每一条出来的数据,与词库进行对比,包含其中哪类情感词典类别就令该情感数值加1,最后根据每一类情感上的得分高低,对该句评论的情感进行情感类别划分。最后,利用R 语言软件,基于情感词典对评论文本进行情感分类并生成情感分布图,把职场辱虐管理第三方评论文本分为共情、幸灾乐祸、害怕(恐惧)、沉默、愤慨、其他六大类,并对情感关键词进行聚类可视化,如图1 所示。
图1 情感聚类图
根据图1可以看出,通过情感关键词聚类图可发现,在对于第三方人群职场辱虐管理的情感分类中,其中“拒绝”“恶心”“干嘛”“讨厌”等关键词,表现出第三方人群愤慨的情感态度。“恐怖”“鼻子”等关键词表现出了第三方人群害怕的情感态度,这类人群对于职场辱虐现象感觉恐怖,对被指着鼻子辱骂等现象感觉害怕。“呵呵”“哈哈”等关键词,则表现出第三方人群幸灾乐祸的情感态度,表示对受虐当事人的嘲讽和幸灾乐祸。“压榨”“理解”则表现出第三方人群共情的情感态度,能够深刻理解受虐当事人的感受。“无所谓”关键词则表现出第三方人群沉默的情感态度,无所谓的态度反应了第三方对职场辱虐管理的沉默和无动于衷。
(二)词云图分析
本文运用jieba 库,首先,对第三方评论文本进行分词、自定义词典和停用词等处理,根据TF-IDF原理对文本进行关键词提取,然后,再利用Python和jieba、wordcloud库分别对各类情感进行词云分析,利用jieba 库对评论文本进行分词和自定义词典等操作,然后将分好的词语用空格连接起来,最后利用wordcloud库生成词云图。词云图主要是为了突出文本中词频较高的关键词,词频越高的关键词,其字体显示越大,本文首先提取名词、动词和形容词等词性关键词生成词云图,来对每一种第三方情感进行整体上的描述分析;因为动词代表拥有这种情感的第三方的动作和行为,因此本文则只抽取动词生成词云图,来分析拥有不同情感的第三方人群会采取哪些动作和行为,每一幅图中的左图代表提取多种词性的词云图,右图代表只提取动词词性关键词的词云图,如图2 所示(图2 仅展示幸灾乐祸词云图,其余类别情感词云图详见本文增强出版附图)。
从图2中可以看出,幸灾乐祸属于消极情绪,通常表现为在第三方人群感受到职场辱虐情况后,非但不去制止辱虐实施者,反而煽风点火以及在背后进行推动、支持辱虐实施者的行为。通常拥有幸灾乐祸情感的第三方人群,不会直接帮助施虐者实施辱虐行为,而是通过一定的煽动性语言或行为,如:在旁边“大笑”“偷笑”“拍视频”等,这样可能会鼓动施虐者继续实施他们的欺负行为。拥有幸灾乐祸的第三方情感人群在受虐当事人受到辱虐管理时,这种情感的第三方会采取“大笑”或者背后“偷笑”的行为,并对此感到很开心,甚至会落井下石、侮辱受虐当事人。当拥有这类情感的第三方给施虐者传达出的不是痛恨、反感或消极的反馈,而是积极的支持反馈时,这样会强化施虐者的行为,会使得辱虐施虐者更加肆无忌惮,从而在客观上助推了职场辱虐管理行为,可能会导致辱虐行为持续时间更长,辱虐行为的强度增大或辱虐行为的发生次数增多。
图2 第三方幸灾乐祸词云图
类似地,拥有共情情感的第三方人群,在受虐当事人受到辱虐管理时也会感觉到难过和难受。这类第三方人群能感同身受,能很深刻地理解被辱虐者的感受。因此,这类第三方人群会采取诸如“拥抱”“支持”“抱抱”或“加油”的行为,对被施虐者进行保护和支持,并对实施辱虐管理者采取鄙视的态度。面对职场辱虐现象,拥有共情的第三方通常能够顶住负面压力,对受虐当事人给予同情安慰,甚至会干预制止施虐者的辱虐行为,如:从词云图中也可以看出,第三方做出亲社会行为(“拥抱”“保护”)来使受虐当事人获益,以弥补受虐当事人受到的辱虐和伤害;在感情上(“加油”)支持或者倾听受虐当事人的遭遇,或者是给受虐当事人提出建议,鼓励受虐当事人回击辱虐实施者。
愤慨情感是指第三方人群在面对职场辱虐现象时,感到气愤、愤怒,出于对正义的捍卫,拥有愤慨情感的第三方人群可能会挺身而出、拔刀相助,会直接反击、制止辱虐实施者。拥有愤慨情感的第三方人群,在当事人受到辱虐管理时,会感到愤慨,例如:“嫌弃”“恶心”“拒绝”等,此时,拥有这类感情的第三方人群,会采取向公司提出“辞职”或“拒绝加班”,会对辱虐实施者直接进行反抗,面对职场辱虐现象时,拥有这类情感的第三方人群通常可能会挺身而出、打抱不平,直接反击辱虐实施者。
害怕(恐惧)情感是指第三方人群在面对职场辱虐现象时,感到害怕,对职场辱虐现象感到恐惧。拥有害怕(恐惧)情感的第三方人群,在面对职场辱虐现象时,这类人群会感到“害怕”“恐惧”,感到“难受”,甚至“大哭”。有一项研究,通过对1137 名人员的调查分析发现,其中有22%的被调查者在目睹了职场辱虐管理现象后选择辞职,有70%的被调查者在目睹了职场辱虐现象后感到压力、紧张、害怕[22],因此拥有这类情感的第三方人群由于担心未来也会受到同样的辱虐和欺负,在面对辱虐管理时,出于害怕和自我保护,拥有这类情感的人群不敢拔刀相助或挺身而出,对辱虐施虐者不敢进行直接的反击或者鼓励、支持、安慰受虐当事人,由于害怕和恐惧,这类人群可能会选择“辞职”,离开他所认为的是非之地。
沉默情感是指第三方人群在面对职场辱虐现象时,为了保护自己不受到伤害,这类人群不敢发声,最终选择什么都不做,拥有沉默情感的第三方人群在看到职场辱虐的现象时,首先第一反应是拔刀相助、挺身而出反抗辱虐实施者,之所以最终退缩,是由于自我保护动机,因为什么都不做相对于挺身而出,可能是一种更为适合自己的选择。拥有沉默情感的第三方人群,在受虐当事人受到辱虐管理时,这类人群对这些情况通常会选择“无视”的行为。拥有这类情感的第三方人群通常会选择接受现实,适应这样的公司环境,上班采取“摸鱼”“混日子”的态度,这类人群通常不会选择辞职,只会“羡慕”别人。因为害怕自己会成为下一个被辱虐的对象,拥有沉默情感的第三方则会产生无助感,会导致这类人群降低对同事的信任度,降低对企业的忠诚度,同时也会降低对工作的满意度,不满意现在的工作,羡慕别人的工作,最后出现消极、混日子、工作摸鱼、怠工等行为。
从拥有其他情感的第三方人群词云图中可以看出,拥有其他情感的第三方人群,在当事人受到辱虐管理时,拥有这类情感的第三方人群没有清晰的情感态度和行为准则。
(三)LDA主题模型分析
1.主题数选择
本文运用Python 语言、gensim 和pyLDAvis 库进行主题生成以及主题的可视化。主题困惑度和主题一致性得分提供了两种方法来判断给定主题模型的好坏程度,其中主题一致性得分是指模型生成的每个主题所对应的高概率词语在语义上是否一致,主题一致性得分越高,则表示模型效果越好。主题一致性得分能更好地判断模型的好坏[23][24],因此本文利用主题一致性得分来确定主题的数量,如图3所示,如果一致性得分随着主题数目的增加而增加,直到增至某个数值而趋于平稳,那么在平稳前最高的一致性得分所对应的主题数就是最佳的主题个数。
图3 主题一致性得分图
从图3 中可以看到,主题一致性得分在逐渐增大,直到主题数为12 的时候达到最大值,随后随着主题数的增加,主题一致性得分逐渐在波动中趋于稳定。因此根据主题一致性得分,本文最终把文本内容生成为12个主题,如表1所示,然后本文根据各主题的强度绘制了主题强度饼状图4。
图4 主题强度饼图
2.文档-主题分布可视化
通过研究文档-主题分布的情况,能够得出每一条辱虐管理第三方评论文本的主题划分情况,本文从这些文本中随机抽取10 篇文档,绘制出其文档-主题分布图(图5 展示了4 篇文档的文档-主题分布图,其余详见附件增强出版)。
从图5 中可以看出,在随机挑选出来的文档中,每篇文档属于某一个或两个主题的可能性较大。随机抽样结果说明,大多数评论文本都有较为明显的主题划分,代表通过LDA主题模型能够有效地挖掘出每一条辱虐管理第三方评论文本的主题倾向,因此LDA 主题模型能够较好地对第三方评论文本进行主题分析。
图5 文档-主题分布图
3.各主题描述
本文对整个第三方评论文本数据进行LDA主题模型分析,运用Python语言,gensim和pyLDAvis库进行主题生成和主题的可视化,本文根据主题一致性最终把文本内容生成12 个主题,如表1 所示,并根据主题强度作图4。
根据表1 与图4 可以看出,主题1、2、5 为热门主题,其中主题1(友情关爱)强度最高,占比11.7%,表明当遭受职场PUA 时,有没有人鼓励、支持、帮助受虐当事人是最热门的话题;主题2(工作加班)、主题5(收集证据)的主题强度也较高,分别占比11.37%和9.37%。表2 为这三个热门主题的主题-词分布情况,概率值代表该主题词在相应的主题中的重要程度。
表1 LDA主题模型描述表
根据表1 还可以看出,第三方人群对于辱虐管理评论的话题涉及很多方面,其中包括:感谢up 主分享自己被辱虐管理方面的话题,这类第三方人群可能遭遇过类似的经历,因此对于有人讨论类似的话题,深受触动和感动;对于遭受职场PUA,需要了解相关法律内容,拿起法律武器来保护自身合法权益方面的话题;个人感情方面的话题,例如:对于遭受过职场辱虐管理的人员,给予拥抱,希望大家以后不再遭受职场辱虐的祝福方面的话题;对于遭受老板PUA 的遭遇,给予其支持,给其加油、打气等鼓励支持方面的话题;讨论在职场中友情关爱方面的话题;讨论平时工作加班和工资等方面的话题;对遭受职场辱虐管理,必要时可以进行录音,收集足够的证据,请求仲裁保护自己等方面的话题;讨论在学校生活和在公司上班有哪些不同方面的话题;对于职场PUA 恐惧、害怕,导致大哭等方面的话题;讨论面试工作、申请离职等方面的话题;讨论大家对领导老板的吐槽、评价等方面的吃瓜话题。
4.热门主题可视化
以上文分析中主题强度较大的主题1(友情关爱)、主题2(工作加班)、主题5(收集证据)为例,进行主题可视化,运用pyLDAvis 库对LDA 模型生成的12 个主题进行可视化,如图6 所示(图6 仅展示主题1的可视化图,其余热门主题可视化图见附件增强)。图中的12个圆圈代表每一个主题,圆圈里标的数字表示所对应主题的序号,圆圈的大小表示包含该主题文档的数目,圆圈越大表示包含该主题的文档数越多。圆圈之间的远近代表主题之间相关性的大小,两个圆圈离得越近表示两个主题关联性越强。图形右侧的条形图表示该主题的主题词分布中概率大小排在前n名的词语,浅色长条代表这个词语属于相对应主题概率的大小,深色的长条代表这个词语和相对应主题之间的关联度大小。
由图6可以看出来,从主题1(友情关爱)、主题2(工作加班)、主题5(收集证据)三个热门主题的可视化图可以看出,三个主题所对应的关键词与表2主题-词分布中的关键词是一致的,从图中还可以看出,主题1与主题3关联度较强,且包含主题1的文档数较多,主题2与主题5关联度较强。
5.主题-词分布
从表2可以看出,在主题1概率最大的前十个主题词中,“喜欢”“别人”“真的”“朋友”等主题词,反应出在第三方评论中,工作上班中的友情关爱话题是第三方人群最为关注的,表明第三方人群比较关注友情的问题,可能是由于在受到职场辱虐管理时,希望有个朋友关心和支持自己,这样会使自己变得勇敢坚强一些。在主题2概率最大的前十个主题词中,“工作”“加班”“难”“工资”“实习”等主题词,表达了在第三方评论中较为关注工作加班的话题,一方面说明工作加班是大家普遍的经历,另一方面也说明工作难是大家共同的感受。在主题5概率最大的前十个主题词中,“录音”“仲裁”“专业”等主题词,表达了第三方评论中较为关注的收集证据话题,表明第三方人群看到当事人受到辱虐管理时,给其出谋划策,希望受虐当事人可以利用法律手段来保护自己,比如通过录音来搜集证据,进行仲裁等手段来回击辱虐实施者,保护受虐当事人的合法权益。
图6 pyLDAvis主题可视化图
表2 主题-词分布表
四、研究结论与展望
(一)研究结论
本文以哔哩哔哩和微博上关于职场辱虐管理的第三方评论文本作为数据,利用python、R 语言等工具,首先对评论文本进行情感分类,然后对每一类情感作词云图,研究拥有不同类别第三方情感人群的特征以及会采取哪些行为,最后对总的评论文本进行了LDA主题模型分析。得到以下结论:
第一,在大连理工大学的中文情感词汇本体库情感类别划分准则的基础上,根据辱虐管理领域相关文献以及相关问卷等资料,并参考了其他情感词典,最终对中文情感词汇本体库的情感类别重新进行了划分,构成本文的情感词典,最后,把第三方评论分为了共情、幸灾乐祸、害怕(恐惧)、沉默、愤慨、其他等六大类情感。
第二,根据词云图分析,在面对职场辱虐时,拥有幸灾乐祸情感的第三方人群,会采取大笑或者背后偷笑的行为,并对此感到很开心,甚至会落井下石、侮辱当事人;拥有共情情感的第三方人群,会顶住负面压力,对受虐当事人做出的同情、安慰和支持等行为,甚至会干预制止施虐者的辱虐行为,如:第三方做出亲社会行为(拥抱、保护)来使受虐当事人获益,在感情上(加油)支持或者倾听受虐当事人的遭遇,或者是给受虐当事人出谋划策、给予行动建议,鼓励受虐当事人对辱虐实施者进行回击;拥有愤慨情感的第三方人群,会对此感到愤慨,例如:“嫌弃”“恶心”“拒绝”等,这类人群可能会采取向公司提出辞职,或直接对辱虐实施者进行反抗,面对职场辱虐现象时,通常会挺身而出、拔刀相助、打抱不平,直接反击辱虐实施者;拥有害怕(恐惧)情感的第三方人群,可能会感到害怕、恐惧,感到难受,甚至大哭,这类人群由于害怕未来也会受到辱虐欺负,因此拥有这类情感的第三方人群就也有可能会选择辞职从而离开公司;拥有沉默情感的第三方人群,可能会产生无助感,从而导致这类人群降低对同事的信任度、降低对企业的忠诚度,同时也会降低对工作的满意度,对现在公司不满意,羡慕他人的公司和上级领导,最后出现消极、混日子、工作摸鱼、怠工等行为;拥有其他情感的第三方人群,则没有清晰的情感态度和行为准则。
第三,根据LDA 主题模型发现,主题1(友情关爱)强度最高,主题2(工作加班)和主题5(收集证据)的主题强度也较高,这三个主题为热门主题,表明公司友情关爱话题在第三方评论中最受关注,也说明在遭受职场辱虐时,最重要的是希望有个朋友来鼓励和支持自己;工作加班的话题也是第三方评论中较为关注的话题,说明工作加班是大家普遍的经历,同时也说明工作难是大家共同的感受;收集证据的话题,说明在第三方评论中对于关心帮助受虐当事人的话题较为重视,当第三方人群看到受虐当事人遭受辱虐管理时,会给其出谋划策、鼓励保护受虐当事人,或者是给受虐当事人提出建议,比如:建议受虐当事人通过录音、进行仲裁等手段回击辱虐实施者,来保护受虐当事人的合法权益。
(二)研究展望
现有文献大多是把职场辱虐管理看作是实施者与受虐者之间人际互动的结果,而忽视了对处于同一生态系统中的“第三方”群体的影响,下一步建议深入研究企业应该采取什么措施来减少或避免辱虐管理的负面“涟漪效应”,尤其是“第三方”的同事被辱虐管理“是否”以及“在什么条件下”会影响第三方员工的情绪以及“第三方”的行为反应,并为企业管控以及预防职场的辱虐管理提供更多的理论与实践建议。