极差数据在统计专题图中的可视化表达
2012-11-27康二梅
康二梅
(甘肃省基础地理信息中心,甘肃兰州 730000;武汉大学资源与环境科学学院,湖北武汉430079)
极差数据在统计专题图中的可视化表达
康二梅
(甘肃省基础地理信息中心,甘肃兰州 730000;武汉大学资源与环境科学学院,湖北武汉430079)
统计数据是地图的重要补充数据,对常规统计专题地图来说,可视化表现手段和方法已比较成熟,但在处理差额较大数据时往往达不到比较理想的效果。通过对统计专题地图性质及用途的分析,研究和总结了适宜不同的制图要素和不同的用图对象的极差数据可视化表达的方法。
极差数据;专题地图;可视化
统计数据是各种社会经济现象的反映,将统计数据纳入专题图不仅使统计数据符号化、可视化,比单纯的数据表格更直观、生动和形象,也使专题地图在保留了地图良好的形象性、动态性和交互探究性的同时具有更强的表现力和说服力,容易被大众接受。近年来反映全国及各省所取得成就的政绩地图、经济地图(集)、在线动态制图、各类领导工作用图等都是统计专题地图。表现统计专题时,常会遇见差额较大的数据需要同时表现,目前已有很多方法可供参考和使用,但仔细分析要真正准确地反映还需要认真选择,本文通过笔者对大量统计地图性质、用途及可视化表达方法的分析和研究,总结了极差数据可视化表达的方法和手段,并亲身进行了验证。针对不同的制图要素和不同的用图对象得出适宜的可视化表达的方法。
1 统计专题地图的特点及常规编制方法
统计专题地图是专题地图的一种,是运用统计数据反映制图对象数量特征的一种图型。它可形象地反映、揭示统计项目和同一项目内不同统计标准间的同一性和差异性,以分析它们在自然和社会经济活动中的分布特征;主要表现各种社会经济活动的特征、规模、水平、结构、地理分布、相互依存关系及其发展趋势。
常规的编制方法有[1-3]:①分区统计图法:根据各区划单位(通常是行政区划单位)的统计资料,将事物总的数量指标绘成不同形式的图形,配置在地图上该区划单位之内,借图形的大小或多少,表示各区划单位同一事物数量上的差别,常用的图形有简单的几何图形、结构图、柱状图、水平条形图等;②分级统计图法:按行政区域或经济区域,以不同颜色或线划符号表示经济活动相对指标的差异;③定位统计图表法:将固定地点的统计资料绘成不同形式的图形,配置在地图的相应地点上,以表示事物的数量特征和在一定周期内的变化。以上3种表示方法虽有其本质上的不同,但在某些形式上仍有相近或相同的地方,统计地图的编制是将众多的数据分级,使成员数据出现可比性,又不出现数据的失真,由于统计数据成员之间的差异,在分级时出现大极差数据在所难免,这给分级和表达带来了困难。
2 极差数据处理方法与手段
2.1 分段等差标尺
根据数值的分布规律划分几个数值区间以对应不同的比率,随着数值的增大,人为缩小比例差距,在图面上一定程度地节省了空间。但在使用这种表示方法时分段比率不宜超过 2种,而且分段时一定要注意各段间的相互关系和对比,要大概成比例。这种做法的缺点是无形之中缩小了数据间的实际差距,一定程度地减弱了内部对比关系,同时随着数值的增大,由于比例尺的变化导致数值精度也会逐渐降低。
图1[4]是按行业区分社会固定资产投资统计图,共分了4个数据段:第一段0~100亿元,公差为100;第二段100~500亿元,公差为400;第三段500~1 000亿元,公差为500;第四段1 000~7 000亿元,公差为2000。分级较多给读数带来困难的同时,很大程度地缩小了数据间的差异,而且公差100、400、500、2000对应标尺比率也不理想,除了没有达到大致成比例外,我们可以看出图例中相差400的反而比相差500的刻度长,所以说这不是一个很好的可视化表达方法。
2.2 折断法加注数字
将数值超出刻度范围之外的图形打断并加注上数字说明,这种表示方法适合大量数据中仅有个别数据较大时,跟第一种方法一样也会缩小数据间的内部对比关系。不过,这种表示方法的缺点可通过改变符号色彩达到一定程度的缓解,比如加重折断柱子的用色,增强视觉冲击,在直观性上能一定程度的渐弱因为制作方法改变而引起的内部关系误差。图 2[4]反映了中东部改革开放30年来 GDP的变化,相比较东部地区2007年GDP较大,这里采用了折断加注数字的方法,不过要是将折断柱子的上部分加重色彩应该效果会更好。
图1 按行业区分社会固定资产投资统计图
图2 改革开放30年GDP变化图
2.3 定长回折法
固定标度尺长度,对较大的数据采取折断图形并叠加的方法。但如若极差数据较多时,折回得多了图形将会较大,美观性不好。图 3[4]是全国少数民族人口数的分区统计图,少数民族人口较多的省市数量不是太多,这时采用定长回折法还是比较理想的。
图3 少数民族人口分布统计图
图4 分省入境旅游人数统计图
2.4 局部扩大法
局部扩大法是针对少数过小的数值可视化表达的方法。如一般小于0.3mm的扩大到0.3mm,小于3°的扩大至3°。但这种表示方法常见的问题是往往会造成不一样的数据生成一样的图形,直观性不强,此时可采用将较小数据同时放大若干倍的方式处理,至于放大倍数应根据具体情况而定了,要分析数据分布情况选好放大的分界点,比如放大数据是3以下的,那放大后肯定要保持和3的相互关系,不能比3更大。图4[4]是全国各省份入境旅游人数的分区统计地图,图中对极个别(如宁夏回族自治区)人数较少的省份采用了放大2倍处理。
2.5 不等宽柱形
对不同数值采用不等宽柱形,对应不同比率的标度尺。这样会有多个刻度,给读者快速获取信息造成影响。如图5[5]所示,柱子宽度有单宽度、2倍宽度、3倍宽度及4倍宽度,读数时分别对应正常刻度、2倍刻度、3倍刻度及4倍刻度。
图5 对外经济合作完成营业额统计图
图6 耕地、林地、草地分布统计图
2.6 零钱法
设计不同大小的定值符号分别代表一定数值,读数只需要简单的数符号个数,是很直观的数值表示方法,估读较准确,不过定值符号最好设计在2~3种,同时,各定值符号间大致保持对应数值的比例。图6[6]是武威市分县耕地、林地、草地分布情况的统计图,这里因数据比较单一只设计了一种定值符号代表20万亩,为了方便读数,将符号每5个为一组进行排列,很大程度上方便了读者阅读。
2.7 面积对比
这种方法常用的符号有圆(见图7)以及圆派生出来的半圆(见图8)和扇形(见图9、图10)等,还有正方形(见图11)以及正方形派生出来的三角形(见图12)等[4]。
这种表示方法可以说是最直观也最简单的表示方式,读专题图有最基本的 2层信息:①图形的相互关系,一眼看过去就能读出指标的大小对比;②刻度,这种表示方法有严格的数学比率关系,根据图例可以量测每一个图形的准确数值。图13[7]反映了陇南市分区规模以上工业总产值。这种表示方法还有一个优点就是可以针对用图对象选择适宜的图例结构。如果读者只需要相互关系或大概的估值,那么这时可以将图例进行简化,如图14[4]所示,在表示城市人口时,人口规模应该是大家最为关心的,这时我们可以将图例按惯常的城市人口规模划分界线进行图例说明。
图7 专利授权数30年变化统计图
图8 文化程度30年变化统计图
图9 地区生产总值30年变化统计图
图10 人口平均寿命30年变化统计图
图11 财政收入30年变化统计图
图12 建筑业增加值30年变化统计图
图13 陇南市分区规模以上工业总产值
图14 城市规模统计图
3 极差数据可视化手段分析评价
专题统计地图可视化手段根据地图的性质、用途要求应有所调整,这就要求必须根据实际需要来选择合适的表现手段以满足读者需要。比如,科学图集和公众地图就有差异,前者更强调数值的精确性及可靠性,所以分段等差标尺、局部放大等可视化表达就不太适合;公众地图主要强调数据的直观性,首先需考虑图形对视觉的冲击感受,数据的精确程度要求相应稍低一些。不过在公众地图中,不同的用图对象对数据的要求程度及侧重点也不一样,有的在乎数据的整体情况,有的却更在乎数据间的变化规律或强调对比关系,这就要求表现手段也应有所变化。强调对比关系或变化规律的最好不采用如分段等差标尺、折断法加注数字、局部放大等可视化手段。如《地图见证辉煌——中国改革开放30年》地图集主要是反映全国经济建设在30年间的巨大变化,强调的是对比关系,此时应尽可能实事求是,实在表示不下的可采用面积对比。
还有,专题统计可视化表达也应根据专题现象和物体的空间分布特征而有所区别。比如,分段等差标尺较适合数据分布有阶段性区间分布规律的专题统计;折断法加注数字、局部扩大法、定长回折法、不等宽柱形法适合极差数据较少的情况,当极差数据较多时,表示的图形或表格就会比较庞大,影响美观;零钱法、面积对比法比其他可视化手段适应范围更广一些。
4 结 语
随着科学技术的发展,社会对地图的日益需求和广泛使用为地图制作创造了良好的条件,再加上传输论、符号学、模型论、感受论、信息论等新理论的不断渗透介入,地图内容、类型、表示方法和整饰手段得以不断变革和创新,近年来随着表达指标整饰手段的改进,出现了不少新的图形,同时在不同条件下对现有的表示方法和表示手段进行转换,形成了统计专题地图可视化表达的新变种,所以,我们还需要不断地探索和总结。以上是笔者的工作积累和经验,希望能给读者一点启发和参考。
[1] 祝国瑞,尹贡白,徐永利,等.地图设计与编绘[M].武汉:武汉大学出版社,2003
[2] 俞连笙,王涛.地图整饰[M].北京:测绘出版社,1995
[3] 黄仁涛,庞小平,马晨燕.专题地图编制[M].武汉:武汉大学出版社,2003
[4] 李永雄,徐根才,王东华,等.地图见证辉煌-中国改革开放30年[M].北京:中国地图出版社,2008
[5] 牛岸英,施建勇,鲁明东,等.甘肃省地图集[M].西安:西安地图出版社,2009
[6] 施建勇,陈春玲,康二梅,等.武威市地图集[M].西安:西安地图出版社,2006
[7] 施建勇,陈春玲,康二梅,等.陇南市地图集[M].西安:西安地图出版社,2010
Poor Data Visualization Expression Method in the Thematic Maps
by KANG Ermei
Statistical data isan important complement to the map data, to the conventional statisticfor special map,visual performance means and method is more mature,but in dealing with the bigger difference when data often hit an ideal effect.This article analyzed the statistical propertiesand USESspecial map,researched and summed up the appropriate poor data visualization expression method and means.
poor data,thematic maps,visualization
2012-02-14
P285
B
1672-4623(2012)03-0163-03
康二梅,工程师,主要从事地图与地理信息工程设计与开发工作。