雄安新区文化资源传播系统研究
2019-03-28李若楠刘冲
李若楠 刘冲
摘 要 随着新媒介、大数据技术的进步,融媒体、大数据技术的概念也逐渐应用到城市建设领域,城市全媒体建设因此也成为一个趋势和新热点。文章结合正在建设发展中的雄安新区,系统分析在构建雄安新区文化资源传播系统过程中要用到的技术,以及相关功能模块的展现。
关键词 雄安新区;文化资源数据库;大数据;舆情分析;可视化
中图分类号 G2 文献标识码 A 文章编号 2096-0360(2019)03-0027-02
随着“文化资源数字化国家行动”的开展以及媒体融合的不断演进,各地方纷纷掀起了数字化文化建设的热潮。雄安新区历史文化资源丰富,文化底蕴深厚,将其悠久的历史文化资源进行数字化传播亦是潮流。因此媒体融合趋势下,雄安新区融媒体数字化传播势在必行。
目前学术界关于雄安新区融媒体数字化传播的研究和实践项目较少。因此本文以对雄安新区文化资源传播系统的研究为课题,研究雄安新区融合新型的信息技术手段,包括大数据、物联网、云计算、人工智能技術等,以融媒体数字化传播系统为载体进行创新驱动,打造具有雄安新区特色的文化资源数字化平台。让用户以一种新的视角、新的体验、新的方式去认识雄安新区的历史文化资源。
1 雄安文化资源数据库展示平台
雄安特色的文化资源数据库模型的建立,首先对具有雄安特色的、有价值的文化信息资源,以文字、图像、声音、视频等为载体进行收集、处理、分析、评价与存储;之后,按一定标准、原则、规范、流程进行数字化操作;采用数字采集、数字处理、数字存储、数字传播等数字技术将文化资源转化、再现成可共享、可再生的数字形态;最后以新视角进行解读,以新方式进行保存。平台的实施是以数字化集成软硬件系统平台为核心的文化资源数字化基础工程,也是为了建立雄安文化资源数字化信息资源库和数据共享服务平台。该平台的建立,充分应用了各种IT新技术将文化资源转化为数字化形态,向社会提供文化产品和服务,使文化资源得到永久的保存和保护,凸显文化资源的历史价值。
2 基于大数据舆情分析的融媒体智能化信息传播云平台
将雄安新区资源实体通过影像数据采集手段,建立起实物三维或模型数据库。采用网络舆情信息采集系统对传统媒体网络版、新闻网站、论坛、博客的相关信息进行全天候定向抓取,抓取数据后,进行预处理,包括格式转换、数据清理和数据统计,将最终数据存入雄安新区融媒体数字化数据库。
通过大数据的筛选整合,利用地理优势,实时更新内容,追踪热点。利用百度、谷歌、奇虎等搜索引擎进行雄安相关热点消息的补充,并进行关键词、关注度、转载率等数据的统计分析。此外,在网络社交平台如BBS、博客、微博、QQ群、新闻跟帖中打捞出雄安的故事,为用户进行智能推荐。新兴秒拍、微视频等新媒介也直接作用于移动舆论场,并与微博微信无缝结合,促使一些雄安新区的热点事件在极短时间内快速传播。基于舆情分析、舆论监控和导向,让用户以全新的视角阅读新闻,而不再是碎片化、片面的了解雄安。
数据可视化是利用图形、图像处理、计算机视觉以及用户界面,通过表达、建模以及对立体、表面、属性以及动画的显示,对数据加以可视化解释。因此我们对通过利用python爬虫技术爬取到的新闻做了简单的可视化处理,通过把新闻数据可视化,将数据汇总形成可视化图表,借助于图形化手段如饼图、柱形图、词云等,清晰有效地传达与沟通信息,让用户可以更加清晰、直观的了解雄安新区政治、经济、文化等方面的情况。
3 技术分析
1)数据分析处理技术。在大数据的处理采集过程中,会有成千上万的用户同时来进行访问和操作,对于数据库的要求较高。为了避免这种并发数高的现象,就需要在采集端部署数据库MySQL等大量数据库进行支撑。在进行导入时,也就是预处理,最重要的就是要对海量数据进行有效的分析。因此,我们把来自前端的数据导入一个大型的分布式存储集群中,以达到效果。在进行统计分析的过程中,我们主要采用分布式数据库来对存储的海量数据进行分析和相应的汇总。最后,在大数据挖掘中,也就是所谓在现有的数据上面进行基于各种算法的计算,算法的复杂性决定了它的重要性。通过这步,我们可以实现高级别数据分析的需求。
2)数据爬虫采集技术。在雄安新区信息获取方面本系统采用Python数据爬虫采集技术,对搜索引擎的文字、图片、音频及视频进行采集,主要是采集要素、提取关键词、建立全文索引、自动去除重复信息、结构化转换、分区存储等,抓取数据后,进行预处理,包括格式转换、数据清理和数据统计,将最终数据存入雄安新区融媒体数字化数据库。
采用Python Web框架,利用具有分布式抓取系统结构(主从式、对等式)等技术的网络爬虫Python Web从指定的URL入口爬取数据信息,并对这些数据信息进行信息清洗和选取,去重去噪,最终提取出纯文本数据作为信息预处理的数据来源。采集流程如下。
(1)从特定的URL链接入手,进行访问测试。采集的网址的获取一般有两种渠道:一种是通过URL链接制定,也就是默认链接访问,比如有影响力的门户、论坛、垂直行业网站等;另一种是通过元搜索的形式在搜索引擎系统中获得。
(2)通过设置URL参数进行页面的动态采集设置。爬取数据信息、爬取内容数量、爬取页面总数等。也可以通过Robot.txt指定的爬取规则进行合理的爬取设置。
(3)通过采集代码爬取到页面的HTML等相关页面信息后,通过数据分析代码,进行页面的解析。可以通过Python的第三方库,如BeautifulSoup库等提供的解析器从HTML代码或者Joson数据结构中解析出发布时间、题目、摘要、正文、点击量、互动内容等页面的基本信息,在这个过程中,力图去掉重复记录的信息。Python数据爬虫能实现各种爬虫框架,能方便高效的下载网页。
4 研究价值
开发和建设雄安新区融媒体文化资源传播平台将带来四个方面的价值。第一,可作为专属雄安新区的数据库,为雄安新区的旅游、文化等诸多方面提供数据分析,可满足日益增长的信息量需求,提高城市知名度,顺应雄安新区的发展趋势,响应国家政策。第二,具有与时俱进的内容,具有创新性和先进性,利于传统文化转化为社会主义先进文化的有机部分,顺应时代发展与创新趋势,使社会主义先进文化深入人心,宣传习近平新时代中国特色社会主义思想,对雄安新区的传统文化产生积极的传播效果,扩大雄安新区的影响力,增强民族文化自信。第三,为实现雄安新区资源数字化传播平台提供借鉴的同时,为文化资源数字化传播与文化创意传承提供示范,开创文化资源数字化传播与文化创意传承新模式。第四,利用媒介融合的方式给传统文化传播带来了新机遇,在传承城市文脉的同时彰显了雄安新区的特色,为雄安新区的旅游产业带来新的发展机遇,具有开发城市旅游的利用价值。
5 结束语
雄安新区文化资源传播系统的研发为雄安新区的融媒体建设提供了借鉴,并从技术领域提供了合理的方案。在合理分析媒体融合趋势的前提下,充分将雄安文化传播与新媒体的发展更好地结合起来。通过对雄安新区信息资源的汇聚整合,经过加工分析处理,为雄安新区舆情监控和舆论导向服务。研究构建本系统为开展文化创意与文化資源数字化传播应用提供示范,提升文化创意技术集成能力与文化资源数字化传播应用服务效果。区域特色文化资源数字化传播在未来的文化产业发展中将发挥越来越重要的作用,加强对文化资源数字化传播的研究不仅十分必要,而且对弘扬我国优秀传统文化,促进文化产业经济效益提高,正确对待文化产业带来的社会影响等有迫切的现实意义。因此,要充分将文化传播与新媒体的发展融合起来,推动雄安新区文化建设走上数字化建设、全媒体发展的新道路。
参考文献
[1]李实,等.互联网+旅游:创意旅游、旅游融资及平台整合[J].科技与产业,2016,16(2):34-40,45.
[2]胡家强,吴峰.基于三维视觉的室内景观虚拟设计方法研究[J].现代电子技术,2018,41(19):40-43,48.
[3]董大伟.传统媒体与新媒体如何融合互动[N].学习时报,2018-09-21(003).
[4]郑佳武.论融媒体时代电视媒体的突围[J].出版广角,2018(16):64-66.