APP下载

移动视频平台的立体化信用评价体系

2023-01-18刘晓丹李春亮

科技创新与生产力 2022年12期
关键词:弹幕信用风险信用

刘晓丹,李春亮

(1.北京信息科技大学信息管理学院,北京 100192;2.中国人民解放军31010部队,北京 100088)

近几年,基于用户生成内容的移动视频平台呈现出井喷式的发展,例如抖音、快手、西瓜视频、哔哩哔哩等。互联网上的用户生成内容正在从单纯的文本内容向视频内容演变,并且具有更活跃的社交交互特点。在移动视频平台中,内容创作者主要以视频直播或者短视频的内容形式吸引大量的粉丝,从而形成一定的知名度,其盈利方式逐渐多样化,例如刷礼物、带货、广告等。在利益的驱动下,移动视频平台面临的挑战是内容的安全性以及带货和广告的欺诈性,如何对非法内容、欺诈内容进行管理是亟待解决的问题。建立适合于用户生成视频内容管理的信用评价体系是促进移动视频平台内容合规性及平台长期健康发展的有效方法之一。

1 移动视频平台的内容和信用风险特点

1.1 内容呈现强交互和多样化特点

移动视频平台的用户生成内容主要呈现以下3个特点。第一,内容创作者与浏览者之间的交互性增强了,主要体现在用户评论的交互、新实时交互方式弹幕的使用、视频直播的实时性、视频内容更加贴近主播的生活等;第二,信息渠道增加了音视频以及相关的描述信息,主要体现在视频流、音频流、视频发布时间、视频播放量等方面,这种多维信息源在内容创作者和浏览者之间建立了一个立体化的交互空间;第三,移动视频平台上的内容渗透到人们生活的方方面面,由于是基于互联网用户的自媒体形式,内容的质量会参差不齐[1]。由此可见,移动视频平台在发展过程中面临着用户生成视频内容的安全性和合规性问题,其强交互、多维信息源的特点也为企业和主管部门对移动视频内容进行规范化管理提出了挑战。

1.2 信用风险的P2P特点

信用风险评价管理起源于传统金融领域的借贷业务,银行需要对借方客户的个人信用进行评估,从而降低银行贷款业务所面临的资金风险。随着数字化经济的发展,互联网促进了个人与个人之间链接的建立,各种基于个人对个人(Peer to Peer,P2P)模式的新形态如雨后春笋般不断涌现,例如电子商务、共享经济、自媒体内容(包括博客、小视频和视频直播)等。在基于P2P的新数字化应用情景中,由于产品或者服务的提供者为个人,他们所提供的产品或服务可能会存在质量问题。针对个人供应者的信用评价和风险管理日益重要,信用评价和风险管理的应用领域也从传统的金融领域扩展到数字化经济背景下人们生活的方方面面,因此需要建立个人的社会化信用评价体系,从而降低个人消费者或者供应者在基于个人链接的新的数字化情景中所面临的风险。

2 国内外研究现状及发展趋势

2.1 关于用户生成视频内容的研究

刘婷艳等[2]在分析国内外视频网站用户生成内容的相关文献后指出,从研究趋势看,此领域的未来研究主要围绕视频网站中用户生成和专业生成相结合的内容、视频网站用户生成内容的生态治理、视频网站VLOG(Video Weblog)及弹幕评论。由此可见,在以用户生成视频内容为主的视频网站上,基于视频流的内容特征和属性发现是未来重要的研究趋势之一。关于用户生成视频内容的研究中,第一类是基于视频内容和数据挖掘技术发现视频内容的特征;第二类是关于用户生成视频内容的生态治理,主要涉及用户生成内容的侵权、个人隐私保护、法律等问题的研究[1];第三类是关于新型即时评论方式的信息挖掘和研究,弹幕评论是一种新的即时评论方式,将视频网站中用户评论内容以实时流动的方式显示在同步播放的视频上,通过挖掘和研究弹幕的文本信息,可发现用户的使用行为及发表弹幕评论的驱动因素、用户情感、舆情导向等。

2.2 关于信用风险评估的研究

信用风险评估主要包括信用风险评估模型的建立和信用风险评估的过程。传统的信用评估指标体系的建立是基于“5C要素评估模型”,包括品质、能力、资本、抵押、条件[3-4],它适用于传统金融领域借贷业务中的信用评估,以个人借贷记录、信用卡记录、历史信用等指标进行分析评价。但这种评估方法缺少数字化经济中与网络空间发展相关的社会资本和社会关系因素,例如线上交易行为、社交行为等。王冬一等[5]基于社会资本视角建立了个人信用动态评价指标体系,并加入社会关系以实现个人信用的动态评估。张丽丽和章政[6]提出可以依据自媒体发布的内容、与行为相关的数据等来建立平台的信用治理体系。因此,在关于用户生成视频内容的信用风险评估中需要考虑数字化背景下来自多种信息源的与信用相关的数据信息。

2.3 关于文本数据挖掘和在线评论的研究

文本挖掘是从自然语言文本内容中发现和提炼隐匿知识的过程。文本分析过程包括文本数据采集和预处理、文本分词和词性标注、文本分类和聚类、情感倾向性分析以及文本摘要和主题抽取。随着社交网络和各类社交平台的兴起,网络评论等短文本已经成为网络中信息传播的主要方式,文本挖掘技术在互联网舆论信息获取过程中扮演着重要的角色。在线评论挖掘的目的是从互联网中大量的用户评论数据中发现与研究目的相关的信息,主要的研究方向包括评论特征挖掘、评论文本情感分析、评论文本主题识别等。在线评论文本的数据挖掘主要基于自然语言处理(Natural Language Processing,NLP)技术,随着该技术的不断发展,在线评论文本情感分析和评论文本主题识别成为近几年在线评论文本挖掘的研究重点。在线评论文本情感倾向分析方法主要包括基于情感词典的方法和基于机器学习的方法。文本主题模型(Topic Modeling)可以发现蕴藏在词汇表面下的潜在语义,该统计模型的研究主要包括潜在语义分析、概率潜在语义分析、潜在狄利克雷分布等。

在基于文本数据挖掘对用户生成视频内容的研究中,洪庆等[7]对视频网站的弹幕信息进行情感分析和聚类以研究视频用户的群体分类;李辉等[8]研究了在线视频评论的情感分类技术,分析了不同的特征提取方法、特征选择方法、分类算法对在线视频评论情感分类精度的影响;张璐等[9]搜集Bilibili网站200个在线教育视频的弹幕与传统评论数据,比较用户弹幕与传统评论行为的异同。

综上,对移动视频平台中的评论、弹幕等文本信息进行分析和挖掘,可以为移动视频平台的自媒体信用体系研究提供有用的情感倾向信息和文本主题信息。

2.4 关于视频内容的摘要和标注生成的研究

在用户生成视频内容的情景中,视频内容的摘要和标注主要考虑两种方法:一种是基于视频内容的摘要技术,基于视频内容的自动标记是根据视频内容来为视频生成文本标记或者描述,主要包括镜头分割、场景提取、关键帧提取、场景标注;另一种是基于文本的视频摘要技术,在用户生成视频内容场景下可以考虑从特有的弹幕评论中提取与视频相关的文本信息。移动视频平台中的弹幕评论内容除了包含用户发表的文本信息外,它还提供了与视频同步的时序性特征,从而为视频内容的标注和摘要提供了一种数据源信息的支持。因此有些研究者结合机器学习算法,尝试从海量的弹幕评论中挖掘与视频内容相关的关键词,以自动对视频进行标注。Wu等[10]将视频语义、交互的用户评论和用户偏好之间的时间依赖性作为先验知识进行联合考虑,对传统主题模型进行扩展,并根据主题模型的关键字抽取来为视频分段生成文字标记。Lv等[11]通过构建神经网络模型,结合弹幕评论在时间上的关联信息,将弹幕评论转换为语义向量,为视频分段得到主题表示,通过监督学习的方式为视频分段生成相应的标记。综上,通过视频内容的摘要技术和弹幕信息的文本挖掘可以获取到与视频场景相关的摘要标记。

3 移动视频平台的立体化信用治理体系构建研究

3.1 研究模型

针对移动视频平台的内容安全性和合规性问题,结合生成内容和信用风险的特点,基于视频流、音频流、文本、图片信息源、基本信息及行为数据进行智能检测,从而为移动视频平台的信用风险管理形成一个多维度的立体管控和预测体系。

图1为基于用户生成内容视频平台的信用治理体系,展示了用户生成视频检测内容及检测结果的应用策略。通过对不同形式内容的自动检测和信息挖掘,检测出用户生成内容(视频、音频、文本)中的潜藏风险和不合规问题,从而进一步建立针对移动视频平台内容创作者的信用和风险评价管理体系。通过对文本信息的挖掘,以及使用视频、音频、图像类多媒体信息的检测和摘要技术,检测出非法内容、信用风险、与用户行为相关的信息。对于移动视频平台,可以针对以上三大类检测结果应用不同的策略。除了对非法内容直接采用黑名单或者下架等操作以及基于用户行为的运营策略外,重要的是可以基于以上三大类内容为平台用户建立分级的信用评价指标体系和评估模型,为平台建立长期、立体的信用风险管控和预测体系。

图1 基于用户生成内容视频平台的信用治理体系

3.2 研究路线

图2为移动视频平台立体化信用治理体系的研究路线。一是根据用户生成视频内容的特点、可获取到的数据源以及信用风险评价模型的建立准则,依据信用评估5C模型建立在线视频的信用风险评估模型。但是相比传统的5C模型,需要考虑增加用户行为、交互、社会资本等维度的指标。信用评价指标的数据主要来源于可获取到的基础属性数据、用户行为数据、内容特征数据等。二是基于文本数据挖掘和机器学习方法,对采集到的与视频相关的描述性信息、互动式评论、弹幕信息、用户基本信息等进行文本数据处理和特征提取,选取一种或者几种机器学习模型完成信用模型的评估以及对比研究。根据信用评估结果给出关于用户生成视频内容的信用风险管理建议。三是利用移动直播视频流中的内容摘要和标注技术,提取用户生成视频内容的特征,完善信用风险评估模型的指标体系,并且基于机器学习算法进行信用模型评估,进一步对单纯基于文本信息建立的信用风险评估模型进行完善和补充。

图2 移动视频平台的立体化信用治理体系的研究路线

4 结束语

为移动视频平台建立关于内容创作者的信用评价体系,支持平台对用户账号进行分级分类管理,是及时发现、防范、管理移动视频平台信用风险的有效方法。本文提出运用和挖掘来自结构化数据、文本、视频流等多信息源的特征信息,建立适合于用户生成视频内容管理的多维度、立体化的信用风险评级和管理体系。对于移动视频平台,可以借助该体系规范和管理平台上个人创作者的行为;对于行政执法部门,可以借助该体系监督和管理移动视频直播平台的运营行为,确保平台内容的合规性。

猜你喜欢

弹幕信用风险信用
油气贸易企业信用风险管理研究
《信用风险管理:从理论到实务》
HOLLOW COMFORT
“弹幕”防御大师
信用收缩是否结束
一大拨弹幕正在向你袭来……
当四大名著遇上弹幕
信用中国网
信用中国网
信用消费有多爽?