APP下载

识别时间序列中的时期与时点概念

2023-02-01邹文慧

山东纺织经济 2023年12期
关键词:时点分母数据处理

邹文慧

(山东经贸职业学院,山东 潍坊 261011)

1 引言

数据化时代背景下,统计数据处理是数据分析全流程的基础性环节。在众多的数据类型中,时间序列数据在社会经济问题中最为广泛存在,且每种细分类型下,对应的数据处理方法区别较大。然而,一些研究者在对时间序列数据进行统计处理过程中仍采用“一刀切”策略,无论是何种类型时间序列数据,均采用直接汇总得总值又或者加总取均值的方式,忽略了时间序列细分类型之间的区别,导致不符合实际需求的数据处理结果。

针对上述问题,本文以统计数据处理过程中最为常见的时间序列数据为研究对象,区分各细分类型的基本概念,说明每种细分类型下的数据处理差异,旨在为数据分析者提高理论性认识和提供可操作性参考。

2 基本概念解析

在统计学理论中,首先需进行数据处理才能开展随后的统计分析,统计数据处理尤其以同一空间不同时间的时间序列数据为对象,可从动态角度反映目标对象的发展水平和变化程度,因而要深入理解和把握时间序列数据的基本概念。当今时代背景下,数据已渗透到生活的方方面面,小到菜市场买菜比价,大到政府宏观调控的政策依据;数据的形式也不仅限于1、2、3、4...这些数字,还有图片、文字、音频和视频等都是数据的表现形式。而时间序列数据不是通常意义上的数据,是目标对象的数据表现与时间项T 的组合,换言之,给每一个数据赋予一定的时间意义,以时间继起原则进行排序。例如菜市场的白菜,早市2 元,午市3 元,晚市1 元,那么就形成了一个,,的时间序列数据。以此为例,就可以理解生活中许多的数据现象都是时间序列。综上,所谓时间序列指的就是同一经济现象在不同时间点上的数列组合。这一概念与截面数据,即同一经济现象在不同空间上的数列组合是不同的。因而,时间序列数据需正确区分类型,针对不同类型的数据需采用不同的处理方式,否则会出现结果上的重大偏颇。在此强调,处理和分析数据的第一步是正确识别它们的类型。

时间序列构成的基础是大大小小众多的指标,其中最为常见的是总量指标,它是构成平均指标和相对指标的基础。总量指标依据时间状态的反映不同可以区分为时期指标和时点指标,前者是指某一时间区间内的流量,而后者是指某一时间节点上的存量。

将时间序列数据各细分类型整理如图1所示。

图1 时间序列数据类型

3 差异分析

由于时期指标和时点指标在进行数据处理时有显著的差别,因而需明确识别时间序列数据总量指标中的时期指标和时点指标。下文对两者在定义、可加性及数据处理中的差异进行详细说明。

3.1 时期和时点指标在定义上的区别

从该角度分析时期指标和时点指标的不同,首先要区分“时间长短”和“时间点”的概念。如果将两者放在直尺等测量工具上进行描述,那么前者就是线段,即一段区间;而后者只是直尺上的某个点,又称时刻。时期指标反映研究对象在观测的一段时间内发展变化的总量,它与观测的时期长短有着直接的关系,所以由于观测时间段的不同也会导致时期指标结果的不同;而时点指标反映研究对象在某一时间点(瞬间或者时刻)状态上的水平,它与观测时间长短没有直接的关系,只与所处的时间点有关系,所以不同时刻上的时点指标也不同。举例说明上述两个概念:首先,“人口出生数”这一指标,反映的是一段时间内某地区的出生人口总数,与“时长”相关,因此是时期指标,则2019 年和2020 年的人口出生数不一致可以理解为,两者所观测的时间段是不同的;其次,“年末总人口”指标,反映的是某一时刻上的数值,不涉及变化量,因而它是一个时点指标,则2019 年和2020 年的年末总人口不一致可理解为,两者所处的时间点是不同的。综上,时期指标依赖于所丈量的时间段,而时点指标则有赖于所处的时间点。

3.2 时期和时点指标在可加性上的区别

时期指标在经济管理上被称作流量,数学性质和经济意义上具有可加性;而时点指标被称作存量,不具有可加性。这就好比是蓄水池某段时间内的流量和容积问题:流水量的多少与时间有直接关系,把这一小时和前一小时的流水量相加代表两个小时内的流量,加总后具有实际意义,因此具有可加性;蓄水池的容积则是存量概念,把每个时间节点上的容积相加没有任何意义,即存量不具有可加性。再比如,去超市购物得积分,会显示新增积分和积分总额,其中每两期或多期新增积分相加是有意义的,代表该段时期的总积分,因而新增积分是时期指标;而任意几期的积分总额相加是不具有任何实际意义的,即不具有可加性的就是时点指标。综上,区分时期指标和时点指标的另一重要依据,就是看指标相加是否有意义。

3.3 时期和时点指标在数据处理上的区别

3.3.1 计算序列平均发展水平

在数据处理中常用取平均以反映一般水平的情况,即计算序列平均发展水平。通常意义上的平均,即加总除以个数,然而这在序列水平分析中是不能通用的,需要根据指标类型选择恰当的均值计算方法。

对于时期指标构成的序列是具有可加性的,因而可直接使用简便均值计算法。公式1 如下所示。

而对于时点序列,前文已述不可直接加总,那么如何进行平均呢?为计算某一时点指标在一定时间段内的平均水平,操作步骤如下所述:第一步计算各时间节点之间的平均值作为该段时间的代表值,第二步以时点间隔长度为权数进行加权平均。公式2 如下所示。

特别地,当登记时点指标的各时点间隔相等时,采用 “首尾折半法”,公式3 如下所示。

3.3.2 计算平均指标和相对指标的平均发展水平

前文已述,时期指标和时点指标是针对时间序列中总量指标而言的,实际上,时间序列以总量指标为基础,还衍生出相对指标和平均指标,此上三者构成时间序列全类型。因而,要将时期和时点指标的概念扩展到平均指标和相对指标的平均发展水平计算和分析过程中。

在构建由总量指标衍生的众多指标时,要注意区分不同状况。分析之,平均指标和相对指标的类型不外乎三种,第一,分子和分母都是时期指标;第二,分子和分母中其一是时期指标,另一是时点指标;第三,分子和分母都是时点指标。针对第一种情况,例如“商品平均流通费用率”,处理方法是:首先拆解“流通费用率”的构成,其分子“流通费用额”和分母“零售额”都是时期指标,进而对分子和分母分别使用简单平均(公式1),再结合计算最终平均流通费用率的水平。第二种情况,例如“商品平均流转次数”“人均GDP”等,无论分子、分母谁是时点谁又是时期指标,只需将时点指标按首尾折半法处理(公式3),时期指标简单平均处理即可。第三种情况,分子和分母都是时点指标,在时间间隔相等的前提下,都运用首尾折半法处理,再结合为对应的平均指标或相对指标即可。综上,无论是平均指标还是相对指标,计算其平均发展水平时,首先要对指标进行拆解,例如,分析分子 和分母 的指标类型,再根据其类型选择相应的平均数处理方法,最后结合为对应的平均指标或相对指标 。需要强调的是,由于两者都是分数类型的指标,在处理时注意不要混淆平均的概念,这里的平均是指分数线上下分别取平均,最后再结合分数形式。

4 示例

为帮助研究者深入理解和把握时期和时点指标的区别,设想下列情形:某人手里共有50 元钱,现在打算全部花出去,所以买衣服花20,剩30;买拖鞋花15,剩15;买糖果花9 元,剩6 元;最后6 元买了食品。综上花的钱一共是50 元,可为什么剩余金额总计51 元了呢?上述过程如表1 所示。

表1 某人消费支出与剩余情况 单位:元

在深入理解上文关于时期指标和时点指标的区别之后,该问题就不再是难题,因为剩余的钱相加是没有意义的。从数据可加性的角度,“剩余的钱”是不同时点上的数据,代表的是一种存量,即不可相加。这就好比我们每次去银行取钱,流水单会显示支出和卡内的余额,试想把几次取款的卡余额相加并不能代表财富的多少,也没有其他意义,所以诸如该类的时点指标是不能相加的。

5 结语

综上所述,进行时间序列分析的必要前提是正确区分构成时间序列各指标的类型,切勿盲目进行一般化的处理,否则会造成结果有失。时间序列是目标社会现象在不同时间点上的连续记录,按时间先后原则顺次排布,它是数据存在的主要形式之一,也是大数据时代数据生成并记录的重要形式。正确识别时间序列的类型,掌握时期指标和时点指标序列差别化的数据处理方式,有助于后续数据分析过程顺利开展,以准确指导决策行为。

猜你喜欢

时点分母数据处理
认知诊断缺失数据处理方法的比较:零替换、多重插补与极大似然估计法*
“去括号与去分母”能力起航
ILWT-EEMD数据处理的ELM滚动轴承故障诊断
“去括号与去分母”检测题
O2O模式下我国网约车企业收入确认的探析
“去括号与去分母”检测题
论“前后”的时间义
建造中船舶特定化属性分析
资金时间价值计算方法再探
基于希尔伯特- 黄变换的去噪法在外测数据处理中的应用