基于广播电视媒体的食品药品安全舆情监测系统设计
2021-03-10覃国孙
□ 覃国孙
据统计,广播电视对食品药品安全事件的首次报道比例仍高于网络媒体,但是,目前国内有关食品药品安全的舆情监测大多针对网络媒体,缺少基于广播电视媒体的舆情监测。本文就如何建立基于广播电视媒体的食品药品安全舆情监测系统提供一些设计思路。
一、系统总体设计思路与目标
采用B/S架构,设计一个基于WEB门户的食药舆情监测系统,通过对中央及地方广播电视台主流频道广播电视栏目中可能涉及食品药品舆情的内容进行实时采集和爬取,并实现对相关舆情的自动发现、音视频内容翻译、内容审核、报表统计等功能,从而快速、及时地发现广播电视媒体中有关食品药品的舆情信息,为食品药品监管部门全面掌握各主流传播渠道的安全舆情动态以及做出科学监管决策提供有效支撑。
二、系统架构
围绕系统的总体思路和目标,系统总体可分四层架构设计,分别是:支撑功能层、数据处理层、监管功能层、对外服务层。系统总体架构如图1所示。
图1 系统总体架构示意图
支撑功能层主要包含数据库管理、分布式计算、系统维护。数据库可选用成熟的数据库管理系统,如Oracle、SQL server等;分布式计算主要是完成各个子系统内部和子系统之间不同节点上的对象调用,实现分布式处理;系统维护包括对各个子系统进行参数配置,监控系统各个组成部分的运行情况,管理用户及其权限。
数据处理层主要完成对数据的采集、存储及管理。数据采集是指对与舆情相关的广播电视节目进行分布式实时采集;数据存储包括管理外部存储系统,实现数据保存、迁移、备份和清洗;数据管理则是对舆情数据的基本信息进行管理,如查询、修改、添加、删除等。
监管功能层负责为系统提供承载监管业务所需的内容分析、信息检索、信息统计等主要功能。内容分析功能主要完成对采集到的广播电视节目信息音视频数据进行分析,包括抽取特征、建立索引、内容识别等,最终检测识别出与食药安全相关的重点舆情信息;信息检索功能主要采用基于文本关键词进行舆情内容检索;信息统计功能完成对采集到的视音频节目和重点舆情信息等进行归类和统计。
对外服务层主要包括系统人机界面和系统接口。系统采用B/S架构搭建门户系统,WEB门户人机界面提供系统各个功能友好的操作界面,能展示舆情信息检索、信息统计、识别定位的结果,并能进行数据审核、系统维护等;系统接口则是考虑提供与其他舆情监管系统对接、数据共享的接口服务,便于监管数据之间的互连互通,信息共享。
三、系统设计
根据系统架构和业务功能需求,整个系统的构建设计由数据采集、舆情发现及翻译、舆情审核及展示、报表分析统计和系统配置与管理五个子系统组成。整个系统功能结构如图2所示。
图2 系统功能结构图
(一)数据采集子系统。主要实现从广播电视节目信号中实时定向采集可能涉及食品药品安全方面的节目,生成相关的音视频片段并进行存储,为舆情监测提供数据基础。系统所需的音视频文件需要实时从节目监测前端服务器上按照指定长度采集到指定的中心存储上。系统对需要采集的音视频节目采用实时增量采集方式,并将采集到的音视频文件的相关信息录入数据库。另外,为了及时发现舆情,系统采取边采集边处理的工作模式,而采集的音视频片段长度也可以根据实际应用效果进行修改调整。该子系统设计包含以下主要功能:(1)音视频数据采集:系统按照指定节目(如新闻类、法制类)和指定时长实时定向地采集可能涉及食药舆情的广播电视音视频数据,数据采用多任务分布式采集和集中存储方式;(2)采集控制和调度:对采集子系统中各个采集任务机进行任务调度,合理分配资源;(3)采集监听:监测各采集任务机的工作情况,出现问题自动恢复;(4)特定数据采集:根据业务需要,可对非本系统中的其他音视频文件进行采集上传和存储。
(二)舆情发现及翻译子系统。主要实现从广播电视节目中发现识别出与食品药品安全相关的音视频片段,并将音视频内容翻译转换成文本信息,从而基于文本形式通过关键词识别完成舆情内容的定位和播放,最后生成相关舆情节目。该子系统运用成熟先进的音视频处理技术和识别引擎来完成对所采集的音视频数据进行分析处理。该子系统设计包含以下主要功能:(1)数据预处理:对采集到的广播电视节目音视频数据统一做提取音频、生成指纹特征的预处理操作,供进一步检索识别使用;(2)音视频播放:对采集到的音视频文件按照条件进行查询播放其中可能涉及舆情的音视频片段,并可快进播放该片段前后指定时长(如前后10分钟)的音视频片段,以便全面浏览节目内容;(3)内容识别翻译:系统利用语音识别翻译引擎自动对音视频节目数据进行语音转文本的内容翻译,并将识别结果入库;(4)关键词识别:系统利用预先录入的关键词信息自动对节目对应的文本信息进行比对识别,将匹配到关键词的结果入库;(5)关键词定位播放:对匹配关键词的结果进行定位播放,即点击选择关键词即可同步播放相应的音视频内容,以便快速定位和查找相关舆情内容;(6)舆情片段截取:数据处理人员根据节目浏览及查询定位播放的情况,将与食品药品舆情相关的音视频文件按照指定时间范围重新截取合并保存成一个新的节目文件,从而完成与舆情相关节目片段的完整截取,正式生成食品药品安全舆情节目数据。
(三)舆情展示及审核子系统。主要实现以舆情门户的方式将舆情节目音视频内容结合系统自动对应生成的字幕信息进行集中展示播放,字幕根据音视频播放进度进行滚动跟进,从而完成对广播电视舆情的展示和快速浏览,监管部门相关工作人员可依据这些生成的舆情数据开展对舆情节目进行内容审核和研判工作。该子系统设计包含以下主要功能:(1)舆情浏览:将所有食药舆情相关且需重点关注的广播电视节目以及系统截取和上传的舆情节目与进行展示和播放,方便集中浏览,可设定指定时间段、展示范围或按照分类对舆情节目进行浏览;(2)字幕联动播放:系统根据音视频节目播放的进度与系统翻译出的文本字幕实现联动播放;(3)字幕定位播放:可点击字幕来定位播放所选字幕所对应的音视频内容;(4)节目查询:可根据频道名称、栏目名称、新闻标题、关键词等条件查询舆情节目数据;(5)舆情审核:提供审核页面供工作人员对系统生成的各种舆情内容进行审核和信息分类,审核人员可记录、编辑和上传针对舆情节目的研判意见或报告;(6)舆情信息编辑:可修改节目数据的舆情信息,包括开始和结束时间、舆情信息、关键词、涉及地区、类型、相关报道等。
(四)报表分析统计子系统。主要实现对系统的各类舆情信息进行查询分类和分析统计,并以报表的形式展现出来。系统要能根据不断变化的业务需求,从不同角度和业务层面生成决策数据报表、宏观分析报表、各种文件格式的统计图表等,为食品药品监管部门提供决策依据。该子系统设计包含以下主要功能:(1)舆情信息查询:针对全库的舆情节目进行集中查询展示,展示列表包括频道名称、栏目名称、关键词、舆情信息、时长、主要内容、舆情信息字数等;(2)频道统计报表:按照频道分类,可定制频道统计报表模板并导出统计报表;(3)栏目统计报表:按照栏目类别分类,可定制节目统计报表模板并导出统计报表;(4)舆情动态报表:按照舆情内容分类,可定制舆情动态统计报表模板并导出统计报表;(5)舆情报告上传:支持将自定义的舆情分析报告上传至服务器;(6)舆情报告查询:对系统中生成的或上传的舆情分析报告查询。
(五)系统配置与管理子系统。主要完成对系统的运行参数等进行管理和配置。根据实际应用系统运行的需要,该子系统设计包含以下主要功能:(1)频道配置:提供对频道信息的配置界面,实现对频道信息的增加、删除、修改等配置和管理,系统可灵活配置频道、栏目、关键词等信息完成对相应系统属性的管理;(2)栏目配置:在频道详细页可对频道所属栏目进行配置,可以增加栏目、删除栏目和设置无效等管理配置;(3)关键词配置:系统支持动态的对识别关键词进行配置,关键词配置由关键词列表和查询框两部分组成,包括新增、编辑、删除和复合规则的配置。系统支持针对不同频道使用不同的关键词识别规则,可通过关键词配置复合规则配置实现。复合规则配置可分别对不同的频道设置不同的关键词,优化关键词匹配搜索;(4)下载管理:对系统中新闻截取的节目和自上传的节目进行管理,包括信息展示、处理状态跟进、删除等操作;(5)用户及权限管理:可进行添加、编辑、删除系统用户信息的配置操作,可以对不同的用户分配功能和操作权限,方便对系统的使用和管理。
四、结语
本研究将食品药品安全舆情的监测范围从网络、报纸和杂志等媒体延伸至广播电视媒体,拓宽了食品药品安全舆情监测的广度,对探索实现食品药品安全舆情的全媒体监测具有重要的现实意义。