大数据技术运用于广播电视内容监测的探究
2022-12-23贵州省广播电视监测中心唐政伟
■贵州省广播电视监测中心:唐政伟
1.大数据技术对广播电视媒体提出的新机遇与新挑战
1.1 关于大数据技术
大数据本身是一个抽象的概念。从一般意义上讲,大数据是指无法在有限时间内用常规软件工具对其进行获取、存储、管理和处理的数据集合。大数据技术不仅可以处理各种各样的数据,还可以对这些数据进行排序、解释和分析。例如,通过大数据技术,可以有效分析出客户网上浏览痕迹和购物记录,从而预测消费者的购物喜好等。大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换而言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。大数据技术不仅能对一些大量的、简单的数据进行处理,还能够处理一些复杂的数据,例如,文本数据、声音数据以及图像数据等等。另外,利用大数据分析技术,可以在短时间内将数据信息中潜藏的价值挖掘出来,以便于工作研究或者其他用途的使用。
大数据牵涉到的数据资源,规模大且内容多,难以实施人工处理,然而却可运用云计算等手段,把数据截取或解读出来,通过数据集成与共享,实现数据资源的整合。以移动互联网、物联网、云计算等为代表的新一代信息技术迅猛发展,向经济社会各领域渗透,不断催生新业态、新产品,大大拓展了消费新领域,其深度应用不仅有助于企业经营活动,还有利于推动国民经济发展。
大数据技术将加速信息产品的创新融合发展。大数据面临着有效存储、实时分析等挑战,必将对芯片、存储产业产生重要影响,将推动一体化数据存储处理服务器、内存计算等产品的升级创新。对数据快速处理和分析的需求,将推动商业智能、数据挖掘等软件在企业级的信息系统中得到融合应用,成为业务创新的重要手段。
1.2 大数据技术对广播电视媒体的影响
从大数据技术的特点来看,大数据技术具有很大的应用价值,它能够准确分析大量数据有价值的内容,并将这些内容应用于相应领域。广播电视媒体面对的观众群体数量庞大,由于缺少与观众群体实时对话的渠道,也没有对观众群体进行细致分类,所以难以准确把握观众群体间差异化的需求。大数据技术的应用,能够帮助广播电视媒体构建出清晰的观众群体画像,这样一来就可以根据观众的偏好、年龄、性别、地域等标签,推荐给他们感兴趣的广播电视节目等个性化服务内容。
随着网络技术的发展,以数字0和1为编码基础,广播电视媒体引入数字化传播技术,为我国广电行业及网络信息技术的发展提供全新传输方式,提升了广播电视内容的共享效率。随着三网融合时代的来临,广播电视网、电信网以及互联网等,原本相互独立的网络如今能够在同一平台之中彼此交融,实现资源共享。这样一来,传统意义上的广播电视也变为网络化体系的组成部分。观众通过电视,不但能够收看原来的电视节目,而且还能共享更加丰富的网络资源,例如点播类视听节目。随着技术手段的不断更新与升级,我国广电行业在大数据背景下将得到更加多元化的发展。
1.2.1 大数据技术能够更好满足观众的多元化需求
通过大数据技术,我们可以对广播电视节目进行统计,能够清晰统计出广播电视节目播出的各种数据,特别是点播量、回复率、评分评价等重要数据,通过对这些重要数据的处理分析,找到创新的源泉或者发现额外的增值服务,从而改善现有的节目内容或制作推出新的广播电视节目,这对于满足观众多元化的需求具有重大意义。
1.2.2 大数据技术能够使广播电视媒体提供的内容更加精准
随着生活水平的不断提高,同一类广播电视观众群体在相同的时间段,也会有不同的视听需求。通过大数据技术预测观众群体的视听行为,识别出不同视听者的需求,从而精准推送视听服务,换言之,就是在合适的时间、合适的地点,将合适的广播电视节目推送给合适的人。
1.2.3 大数据技术能够为广播电视内容带来更加适宜的传播方式
观众观看方式是影响广播电视内容评价的重要指标。大数据技术应用不仅能够满足观众的观看需求,而且能确保通信信息的准确推送,通过对观众观看特性进行数据分析,得到不同观众群体的视听习惯及方法,配置对应节目内容的传播方式。
2.广播电视内容监测的发展现状
目前,广播电视内容监测的主要问题是:首先,监测系统响应速度较慢,技术水平较低,造成监测服务的连接和集成低,难以实现数据信息的快速传输和共享,影响监测工作的效率。其次,各单元之间缺乏数据相互联系的介质,不同子系统间数据难以交互,也无法对数据之间的相关性进行更加详细的研究,造成数据本身价值的利用率不高。第三,硬件设备逐渐呈现高速化,但是软件系统的更新速度太慢,容易出现兼容性问题。
广播电视行业已进入智能化时代,但监测技术仍然落后,监测效果较差,无法实现多种信息的有效整合和分析,很大程度上依赖于人工操作。
3.大数据技术在广播电视内容监测中的应用
3.1 广播电视内容信息数据收集
对于传统模式下的广播电视内容监测,主要是针对平台的节目内容执行的。在广播电视内容监测过程中盛行轮询监测,这种方法存在一定的局限性,需要消耗大量的人工成本,提取出来的信息彼此相对独立,没有交互。大数据技术引入后,可以将各个节目划分成不同的单元,将这些单元进行数据化整合分类,提取出数据特征,实现广播电视内容的信息收集,形成一个较为完整的数据库,这些数据是可以随时调用,并且可以在不同的监测子系统中重复使用。大数据技术在广播电视内容收集过程中的应用,实际是将传统的广播电视节目内容监测转化为了数据监测,不仅提升了监测效果,而且节省了监测成本。依靠基于大数据特征的广播电视内容监测,可以实现贵州省广播电视节目内容的全覆盖监管,全面提高贵州省广播电视内容的监管效率和能力。为政府职能部门提供科学的行政执法依据,净化荧屏、声屏质量,更好地完成国家广电总局要求的监管任务,依法保障人民群众收听收看广播电视的合法权益。
3.2 广播电视内容信息数据库模型构建
3.2.1 广播电视内容信息数据库模型的基本概述
广播电视内容信息数据库模型的建设是广播电视内容监测过程中的重点。在广播电视内容信息模型数据库构建过程中,将采用面向服务的架构,充分利用大数据、云计算、深度学习、人工智能及网络等方面的最新技术与成果,建设技术先进、高效实用、国际一流、国内领先的“内容综合”监和监管平台。广播电视内容信息数据库模型共有六大核心数据库,包括广播电视广告内容智能监测数据库、广播电视新闻舆情监测数据库、广播电视节目在线评议数据库、点播类广播电视节目监测数据库、广播电视敏感人物监测数据库、广播电视节目内容比对数据库,以上数据库模型建成后,通过大数据引擎的处理分析,就可以及时掌握所辖区域内的广播电视节目内容以及点播类广播电视节目,是否存在不符合总局相关规定要求的情况。
3.2.2 广播电视内容信息数据库模型的效益
建立广播电视内容监测数据库,可以帮助监测人员更好地执行监测工作,为监测过程提供强有力的技术支撑。数据库模型在构建时会预先设置好监测风险告警特征,在获得大量监测数据信息后,工作人员不用直接分析处理这些底层数据,只需要通过系统获取这些数据的有效信息,系统会智能化的对这些数据信息进行整理分析,一旦发现异常或违规信息,即形成风险信息告警,从而达到监测效果。
3.3 大数据技术应用于广播电视内容监测
3.3.1 广播电视内容监测的基本概述
通过采集设备对在播特定的广播电视节目内容进行全天24小时录像,采集到的数据经过大数据引擎拆条、分类、压缩整理,并对特有样例进行筛选匹配,构造出标准模版库,再通过数据处理模块,实现对广播电视节目内容广告、新闻、舆情节目的监管以及节目评议等业务功能。
3.3.2 大数据技术在广播电视内容监测的具体应用
通过大数据引擎,采用已知广告样本匹配、未知(新)广告样本查找,自动发现、记录、汇总商业广告、公益广告以及各类违规广告的详细信息,及时掌握各类违规广告的播出动态,准确遏制违规广告的传播,全面提高贵州省广播电视广告内容的业务监管能力。
通过大数据语音识别系统,对广播电视中的新闻节目自动语音识别,将语音内容识别成文字,用户可通过文本关键词的输入,快速查找到自己所关心的新闻舆情视频片段,并对这些新闻内容进行视音频回放、对识别文本浏览编辑。经系统处理后的内容支持下载导出,进而生成舆情统计报告呈报给上级主管单位。
综合采用大数据人脸识别技术,主动对电视中出现敏感人物的画面进行识别,从而自动发现电视中敏感人物的违规播出情况。
大数据共享平台能够为广播电视节目内容监测监管提供节目评议工作平台,提高节目评议工作效能。评议员在监听监看广电节目的同时,通过节目评议系统可以对节目进行分级和评议,可以保存评议需要的视频或者视频截图,并实时归类存储,已存储的评议文档、视频和视频截图,可供再次检索、查阅、编辑和导出。系统整合了节目评议流程,提供了节目评论、批注以及审核的完整流程,支持节目下载审核,结合节目单、关键字搜索、语音转换文本等技术手段提升了评议的效率。
广播电视内容监测监管平台通过大数据引擎,实现全省范围内数据共享,还能实现对点播类广播电视节目的监测,主要完成对互联网持证备案网站、无证重点网站当中的点播类广播电视节目进行内容违规检测。系统在统一的数据采集、数据分析、统计编报的基础上,针对辖区内持证备案、无证视听网站以及网站中的点播类广播电视节目,采用软硬件集成技术,形成的一套可扩展的、一体化的智能化监测监管综合平台。能够自动搜索发现贵州省内持证备案、无证视听网站当中传播的违规点播类广播电视节目内容,初步通过人工智能技术判定节目违规情况以及违规类型,后续由监管人员完成疑似违规点播类广播电视节目信息的判别与审核。
大数据技术连通各个监测子模块,分类配置实现用于语音识别引擎、人脸识别引擎、关键字识别引擎、广告样本识别的广告样本库、敏感关键词库、语音语料库、人脸库、色情样本库、暴恐样本库。并且对以上数据库进行日常数据更新,达成数据的时效性。
3.4 广播电视内容信息数据分析
3.4.1 广播电视内容信息数据分析的基本概述
广播电视内容信息数据分析的主要工作内容是对海量数据信息的筛选、整合和归纳和判定。只有真实可靠的数据信息才能使广播电视内容的监测工作实用化。合理的分析结果和准确的分析结论,有利于对广播电视内容监测数据的理解,也有利于对监测过程中发现的问题及时做出有效的应对。
3.4.2 大数据技术在广播电视内容信息数据分析中的具体应用
广播电视内容信息数据的分析和大数据技术在监测过程中深度融合。在实用化过程中,主要是违规信息的找寻,对广播电视内容进行监管,如果发现不合规的内容,就可以及时进行违规记录并向主管部门通报,这样就可以有效避免观众群体接受到不良的节目内容,从而减少不良信息的传播。
3.4.3 广播电视内容信息数据分析的进一步构想
大数据分析中的核心技术主要包括数据预处理技术、数据管理以及储存技术、数据挖掘及研究技术等,通过各种技术的合理运用,可以快速生产、捕捉、挖掘、分析海量数据,从而得到数据内存价值,让监测监管工作少了很多不必要的麻烦。大数据技术与广播电视监测内容的有机结合的另一个构想思路,在进行广播电视内容监测的过程中,工作人员可以利用大数据技术,通过大数据的分析了解到信息传播的途径位置并且能够对受到影响的人的数量进行统计,也能够提前预判播出事故的发生并且计算出损失的大小。
4.结语
简而言之,网络信息时代到来后,我国科技发展前景广阔。大数据技术适用于各行各业的变革与发展,并且还有很大的上升空间。大数据技术的充分应用,还有许多的优点等待发掘。广播电视行业要充分利用这项技术来促进整个产业的发展,在技术应用过程中,需要确保广播电视内容数据信息的安全,避免不良节目内容信息的传播。广播电视行业的科研人员应该加强对大数据技术研究和开发,尽早实现对广播电视节目内容“全程全网、可管可控”的监测监管目标,从而确保广播电视节目的播出安全和内容安全。