APP下载

基于搜索引擎的档案网络信息关注度的时空分布特征研究

2021-04-16

兰台世界 2021年3期
关键词:搜狗关注度季节性

邓 磊

随着信息化的快速发展,互联网逐渐成为人们搜索信息、获取信息的主要来源,对档案网络信息的发展也产生了巨大影响。同时,搜索引擎多样化也给公众的选择拓宽了搜索渠道。公众可以通过网络快速搜索获取满足自身需求的档案网络信息,从而推动档案事业的发展。近年来,搜索引擎的市场竞争日趋激烈,各大搜索引擎公司不断改进自家产品以此满足公众的搜索需求,可见人们的搜索需求受到更多的关注。为此,以“档案”为关键词,以百度指数、搜狗指数、360趋势、谷歌趋势为工具,通过对比分析能够客观地了解公众对档案的关注度和需求。公众的关注和需求可以提升档案事业,更好地了解用户的要求,解决存在的问题,推动档案信息化建设。

一、选取搜索引擎与研究方向

通过对比分析国内外多个搜索引擎,最终选取百度、搜狗、360、谷歌作为数据来源。主要因为百度、搜狗、360、谷歌同为综合类搜索引擎,分别为国内外知名搜索引擎,市场份额大,使用人群多,具有研究数据来源的价值;它们所承载的数据分享平台分别是百度指数、搜狗指数、360趋势、谷歌趋势。研究时间段为2013年至2018年,选取“档案”作为关键字进行检索,并对搜集来的数据进行分析。其中,利用各个搜索引擎收集的数据进行对比,分别从时间演变特征、空间演变特征这两个方面进行分析。最后,通过对时空分布的影响因素分析,从而全面揭示档案网络信息关注度的时空发展格局,为完善档案网络信息服务提供参考。

二、研究方法

1.变异系数。变异系数是原始数据标准差与原始数据平均数的比,用来比较数据间的离散程度大小,以此衡量样本数据之间的差异程度。本研究用变异系数来衡量档案网络关注度在时空上的差异情况。其公式为:

公式中,σ表示标准差,μ表示平均值,Cv表示变异系数。变异系数大小决定了档案网络关注度时空差异大小,系数越大,差异越大,反之越小。

2.季节性强度指数。季节性强度指数是用来测定季节性周期变动规律的指数,是衡量变化剧烈程度的有效指标。本文将这种指数用于档案网络关注度的时间差异度和时间集中强度,其公式为:

公式中,R表示档案网络关注度季节性强度指数,Xi表示每月档案网络关注度与全年网络关注度总数的比值再乘以100。其中8.33为一个固定值,是100除以12个月所得结果。季节性强度指数大小决定档案网络关注度的时间差异大小,当指数越大,差异越大,全年分布越不均匀,当指数趋近0时,差异越小,全面分布越均匀。

3.地理集中指数。地理集中指数是描述地理要素分布集中化程度的指数,多应用于研究空间的分布规律。本文将这种指数用于分析档案网络关注度的空间分布情况,地理集中指数越接近100,网络关注度分布越集中,反之分布越分散,其公式为:

公式中,G表示档案网络关注度地理集中指数;qi表示第i个区域的生态旅游网络关注度;q表示生态旅游网络关注度总数;n表示区域总数(n=31)[1]11。

三、时间演变特征

1.年际差异特征。为分析2013—2018年档案网络关注度的年际差异特征,搜集每年查询的数据值,通过计算得出平均值、标准差、变异系数、季节性强度指数等各项的数值,测得数值如下。

表1 百度指数

表2 搜狗指数

表3 360趋势

表4 谷歌趋势

百度指数的变异系数和搜狗指数的变异系数的数据主要都在0.1—0.2之间,说明档案网络信息关注度年际差异变化不大。而360趋势的变异系数和谷歌趋势的变异系数的数据分别出现0.3和0.4,这说明档案网络信息关注度年际差异变化出现了较大波动。百度指数的季节性强度指数越来越趋近0,说明档案网络关注度的时间差异越来越小,全年分布越来越均匀。而搜狗指数的季节性强度指数和360趋势的季节性强度指数在1到2之间徘徊,说明差异比较大,全年分布相对不均匀。谷歌趋势的季节性强度指数变化浮动比较大,说明时间差异大,全年分布不均匀。综合上述各指数的统计结果,从2015年开始,变异系数与季节性强度指数开始逐年下降,这表明国家在推动档案事业方面具有积极向上的效用。

2.关注特征。每年的关注热点主要有两方面:一是国际档案日相关纪念活动报道,比如某地举办档案展、新接收珍贵档案、档案普法活动等;二是六月份临近毕业季,高校毕业生的档案问题。2013年为我国第一个“国际档案日”,但公众关注程度并没有增高,反而下降。2014年的搜索指数大幅上涨,原因主要有两方面:第一,在一次外交部例行记者会上,外交部发言人华春莹表示中国政府为日军强征慰安妇的相关档案和文献申报联合国世界记忆名录,目的是牢记历史、珍惜和平、捍卫人类尊严,以防止此类违人道、侵人权、反人类的行为在今后重演[2]。第二,美中情局开推特和脸书账户,将公布解密档案。受爱德华·斯诺登泄密事件的影响,CIA受到公众的质疑,以此希望通过社交媒体来改变负面形象,增加互动。2015年的热点主要有两个:一是抗战胜利70周年,各地档案馆举办抗战胜利主题展;二是从2015年1月1日起,全国各级公共就业和人才服务机构取消收取学生档案保管费、查阅费、证明费、档案转递费等名目的费用[3]。

四、空间演变特征

1.各省份差异特征。为分析各省份档案网络信息关注度的空间差异程度,利用变异系数和地理集中指数对数据进行计算,结果见表5(见下页)。

如表5所示,各省份变异系数(CV)在0.5上下变动,没有出现较大波动,呈现平缓状态,这表明全国31个省份档案网络信息关注度差异较小。地理集中指数(G)维持在25—30之间,整体较为平稳,各省份档案网络专注度较为集中。

2.地区差异特征。根据中国自然环境共分为七大地理区,即东北、华北、华东、华南、华中、西北、西南。利用地理集中指数和变异系数对全国七大地区档案网络关注度进行测量分析,得到结果见表6、表7。

表5

表6 地理集中指数

表7 变异系数

通过表6、表7分析,七个地理地区的地理集中指数中,华东地区的指数最小,说明档案网络信息关注度较为稳定。华南、华中、东北三个地区的指数相对较高,并且地区内关注度排名差异较大,说明三个地区内档案网络信息关注度分布不太稳定,更倾向于地区内某些城市。在变异系数方面,东北地区系数最小,表明档案网络信息关注度差异较小,而华南地区变异系数相对较大,表明华南地区档案网络信息关注度差异较大。综合上述分析,东北地区档案网络信息关注度差异度最小,华东地区档案网络信息关注度地理集中性更明显,而华南地区内档案网络信息关注度差异最大,地理集中性更分散。

五、分析与总结

从时间档案网络信息关注度差异来看,在档案网络信息资源需求的淡季和旺季有针对性地采取适合的策略,像高考季、毕业季、国际档案日这类具有周期性的时间,公众的档案信息需求激增,档案及相关部门应集中力量做好档案网络信息建设和服务工作,在内容、数量和质量上做好信息保障。还有一种情况是突发事件,比如国家下发的档案政策法规、社会热点事件,这些都考验着档案网络信息资源建设的水平。淡季工作量相对小,则要做好档案网络信息基础性工作,并且挖掘新的档案信息资源。

从地区档案网络信息关注度差异来看,华南地区档案网络关注度差异最大,地理集中性更分散,东北地区档案网络关注度差异最小,华东地区网络关注度地理集中性更明显。这些差异背后反映的是经济因素、公民档案信息素养的差距。面对如此巨大的差异,均衡档案资源空间分布,应从上述两点出发:经济上加大投入,改善硬件和软件设施;邀请经验丰富的档案从业人员去薄弱地区传授先进经验;共建共享档案信息资源,档案资源丰富地区与贫瘠地区建立畅通合作机制,加快档案资源的输出,扩大受众范围。公民档案信息素养的养成则是体现在日常生活中,档案部门、学校、媒体等利用自身优势宣传档案知识,使公众树立正确的档案意识。

猜你喜欢

搜狗关注度季节性
粕类季节性规律:豆粕篇
季节性气候变化对牛疾病的影响及预防分析
腾讯拟147亿元全资收购搜狗
季节性恋爱(外一首)
搜狗:牵头成立AI创新联盟
搜狗二季度财报 表现不如预期
远离季节性过敏
雄安新区媒体关注度
全国两会媒体关注度
暴力老妈