APP下载

影响江苏省出口总额因素的多元回归分析研究

2020-12-23沙静杨扬曾巩俐

软件 2020年10期
关键词:多元回归分析R语言进出口

沙静 杨扬 曾巩俐

摘  要: 进出口贸易可以促进经济总量增长,是拉动国民经济发展的重要力量。本文选择固定资产投资总额、社会消费品零售总额、财政支出、地区生产总值、城镇常住居民人均可支配收入和人民币对美元汇率这六个因素,使用R语言借助多元线性回归模型分析其对进出口总额的影响,并通过检验对模型进行改进。根据实证分析的结果,提出相应的对策建议。

关键词: 多元回归分析;进出口;R语言

中图分类号: O212    文献标识码: A    DOI:10.3969/j.issn.1003-6970.2020.10.065

本文著录格式:沙静,杨扬,曾巩俐. 影响江苏省出口总额因素的多元回归分析研究[J]. 软件,2020,41(10):256259

【Abstract】: Import and export trade can promote the total economic growth, and is an important force to promote the development of national economy. In this paper, six factors are selected: total investment in fixed assets, total retail sales of social consumer goods, fiscal expenditure, gross regional product, per capita disposable income of urban residents and exchange rate of RMB to us dollar. R language is used to analyze its influence on total import and export with the help of multiple linear regression model, and the model is improved by testing. According to the results of empirical analysis, the corresponding countermeasures and suggestions are put forward.

【Key words】: Multiple regression analysis; Trade; R

0  引言

进出口贸易可以看做是推动国民经济发展的重要工具,在提高国民收入方面,增加就业方面和促进全世界各国的联系方面都发挥着重要作用。但如果对外贸易发展失衡,会适得其反,引发严重后果,因此研究我国贸易进出口总额的影响因素具有很强的现实意义。对外贸易是指一个国家(地区)与另一个国家(地区)之间的商品、劳务和技术的交换活动,这种贸易由进口和出口组成。江苏省作为中国进出口贸易的重要组成部分,2019年外贸进出口占同期中国进出口总值的13.8%,在一带一路战略的推进下,积极开拓新市场,进一步优化全球市场布局。因此,选择固定资产投资总额、社会消费品零售总额、财政支出、地区生产总值、城镇常住居民人均可支配收入和人民币对美元汇率,研究这六个因素对江苏省进出口总额的影响,有助于更好的促进江苏省经济发展。

1  影响进出口总额的变量分析

1.1  文献综述

胡登通过Eviews使用多元线性回归模型对陕西省2000年-2016年的各项经济指标数据进行研究,发现生产总值对进出口总额起着至关重要的作用[1]。荀梓莹等通过Eviews使用多元线性回归分析中国1993-2016年贸易进出口总额及其影响因素[2]。田瑞秀通过Eviews使用多元线性回归分析对1997-2016影响中国进出口贸易相关因素[3]。王姝涵利用1995-2015年的货物贸易等相关数据,将文化距离作为变量进行实证分析,得出我国需要多方式弘扬中国文化,缩小文化距离的结论[4]。丁欲晓是研究人民币汇率波动对中国进出口贸易的影响,并且提出如何规避风险的建议和策略[5]。郑斌研究了中国进出口贸易作为GDP三大马车,利用了模型和实证分析了对国民经济的影响[6]。

1.2  引入变量

结合目前理论研究,影响进出口总额的因素很多。首先,进出口贸易的发展在很大程度上取决于本地区的经济发展水平,衡量一个地区经济发展水平最有效的指标就是GDP。国民经济越发达,与国外的联系也会越紧密,从而推动国家进出口贸易的发展。其次汇率变动对进出口贸易的影响也不小,一般情况下,如果人民币对外升值,以外币表示的中国出口产品的价格将上升,这将会削弱中国产品在国际市场上的竞争能力,导致出口减少,出口总额下降。如果以人民币表示的出口商品价格下降,中国出口商品的竞争力就会提高[7]。最后,影响进出口总额的因素还有实际利用外资额,城乡居民人民币储蓄存款年底余额,全社会固定资产投资,外汇储备,人民币对美元汇率等。本文选择以下6个变量来进行分析。

1.2.1  固定资产投资额

固定資产投资额是以货币表示的固定资产建造、购置工作量及相关费用的总称。它反映了固定资产投资规模、速度与投资比例关系的综合指标。投资规模是国家制定投资计划和控制的重要依据。固定资产投资额的增加,带动了产品的生产能力,可以拉动经济增长,提高进出口贸易。

1.2.2  社会消费品零售总额

社会消费品零售总额是指企业(单位)向个人和社会团体销售不用于生产经营的实物商品的数量和提供餐饮服务取得的收入。社会消费品零售总额反映的是批发业和零售业,它的增加表示人们的生活需求增加,商品需求量增加,从而进出口贸易增加。

1.2.3  财政支出

财政支出又称政府支出,是指在市场经济条件下,政府为满足公众需求而提供的公共产品和服务的总额。财政支出的增加带动了经济增长,扩大了进出口贸易。

1.2.4  地区生产总值

地区生产总值GDP不仅是区域经济核算的核心指标,也是衡量一个地区整体经济状况的重要指标。自改革开放以来经济增长迅速,也拉动了进出口贸易,因此地区生产总值是影响进出口总额的重要因素。

1.2.5  个人可支配收入

个人可支配收入是个人收入减去个人纳税额后的余额。它是指消费者、个人或家庭可以自由控制的金额。在一般情况下,个人可支配收入分为以下三个部分:用于个人消费支出的收入;个人储蓄,包括储蓄存款和现金;其它可支配收入,如各种债券、股票、应收应付款、个人保值商品等。个人可支配收入增加,促进生活用品、文化教育、娱乐用品等消费增长,带动现金流通量增长,也带动了进出口貿易。

1.2.6  人民币对美元汇率(美元=1)

汇率是一国货币对另一国货币的比率。本文介绍了人民币对美元的汇率(美元=1)。如果人民币升值,中国以外币表示的出口产品价格将上涨,这将降低中国产品在国际市场上的竞争力,减少出口。我国汇率相对稳定,但其对贸易进出口的影响不可低估,因此引入了这一变量。

2  建立模型

2.1  多元线性回归

在回归分析中,多元线性回归是最基本的建模技术。因变量要求是连续的,自变量可以是连续的或离散的。回归线的性质是线性的,其模型函数通常表示为:

其中y是因变量;x1,x2,xn为n个自变量;1,2,n代表n个回归系数;是随机变量,代表随机误差,一般要求其服从正态分布。对于实际问题,将实测数据代入模型中,通过最小二乘原理拟合出回归系数,之后对模型进行诊断和修正,最终对实际问题进行控制或预测。

2.2  逐步回归模型

在实际中,有许多因素变量会对因变量y产生影响,有些因素是次要的,有些是主要的,当指标因素太多时,往往会影响我们的判断,因此变量筛选变得相当重要,逐步回归分析便应运而生。逐步回归分析的基本原理是根据自变量对y的影响程度或显著性的大小,由大到小引入回归方程,如果影响不显著,则可不引入回归方程中。逐步回归分析的步骤如下:

(1)先逐个建立p个自变量对y的一元回归方程,比较哪些显著,挑选f检验值最大的,即最显著的f值对应的变量引入回归方程,记为x1;

(2)建立(x1,x2),… (x1,x3)、…、(x1,xp)对y的回归,将f检验值最显著的变量引入回归方程,记为x2;

(3)考察以x1,x2为基础,逐个添加x3,x4,…之后的回归方程,将f检验最显著的变量引入回归方程,记为x3;

(4)重复(3),直到f检验值最大,则得到了回归方程。

2.3  模型构建

本文选取进出口总额(亿美元)y作为因变量,以固定资产投资总额(亿元)x1、社会消费品零售总额(亿元)x2、财政支出(亿元)x3、地区生产总值(亿元)x4、城镇常住居民人均可支配收入(元)x5和人民币对美元汇率(美元=1)x6自变量。为了便于回归分析和比较研究,本文根据收集到的经济指标数据,建立了以下多元线性回归模型:

其中,xi(i=1,2,…,6)为选取的影响因素经济指标,i(i=1,2,…,6)为各指u标对应的系数。如模型所示,被解释变量和解释变量之间呈线性关系。0为截距系数,它表示解释变量为零时进出口的数额;1、2、3、4、5、6为斜率项系数;i为随机干扰项,将影响y的其他因素归入其中。

3  选择数据

本文数据来源于江苏省统计年鉴,通过对1991- 2017年的固定资产投资总额、社会消费品零售总额、财政支出、地区生产总值、城镇常住居民人均可支配收入和人民币对美元汇率(美元=1)数据分析影响江苏省进出口总额的因素,构建进出口总额预测模型。数据的具体情况如表1所列。

4  实证分析

通过观察表1可以发现,江苏省的贸易进出口总额总体呈递增趋势,且除汇率外其他指标皆与贸易进出口总额呈正相关变动。为了进一步准确地分析江苏省贸易进出口总额与相关因素的关系,在上述数据的基础上,运用R语言对数据进行了分析。

4.1  自变量的筛选

本文采用Pearson相关系数来反映两个变量之间的相关程度。Pearson相关系数用于度量两个数据集是否在一条直线上,以及距离变量之间的线性关系。相关系数绝对值越大,相关性越强:相关系数越接近1或–1,相关度越强;相关系数越接近0,相关度越弱。

通过Pearson相关性分析结果可知:进出口总额与固定资产投资总额、社会消费品零售总额、财政支出、地区生产总值和城镇常住居民人均可支配收入都具高度相关,与人民币对美元汇率中等程度相关。但自变量之间可能存在多重共线性等问题,为了消除多重共线性的影响,我们采用逐步回归分析方法。

4.2  逐步回归分析

当有多个自变量时,使用逐步回归分析不仅可以保证所选变量的有效性和重要性,而且减少了额外冗余变量所引入的误差。在本文的研究中,由于有多个影响指标,采用逐步回归法可以有效地将对进出口总额这个因变量贡献大的自变量找出来,将贡献不显著的指标自变量剔除,即通过双向消除逐步回归分析,得到最终的回归模型:

经过逐步回归最终得到的模型,发现当只有变量x2和变量x4时模型极为显著,也就是社会消费品零售总额和地区生产总值对进出口总额的影响是最显著的。接下来用检验方法对模型进行检验。

4.3  模型检验

拟合优度检验(R2检验)反映了回归方程和数据的拟合程度。R2表示拟合优度,其最大值为1。R2值越接近1,拟合度越好;反之,R2值越接近于零,拟合度越差。由检验结果可知,R2=0.9959,修正的可决系数为R2=0.9956,两个数据表明,该模型与样本的拟合度非常好。

显著性水平F检验因变量与所有自变量之间的线性关系是否显著。从检验结果可以看出,F统计量P值极为显著,说明模型在90%置信水平下建立的线性关系显著。

怀特检验是一种比较普遍的异方差检验方法,这种检验方法不需要对异方差的性质做任何假定,是一种常用的异方差检验方法。结果表明,nR2=5.167194,给定=0.05,nR2<20.05(4)=9.49,接受原假设,表明模型不存在异方差。

6  结论

从以上实证结果可以看出,江苏省进出口总额的大幅度变动的主要影响因素是社会消费品零售总额和地区生产总值;固定资产投资总额、财政支出和城镇常住居民人均可支配收入对江苏省进出口总额的影响不显著,特别是人民币对美元汇率与江苏省进出口总额呈中等程度负相关性。可以看出,经济越发展,国内生产总值就越大,社会消费品零售总额就越大,进出口贸易也就越发达。鉴于传统宏观经济指标数据存在频率较低、时滞较强等问题,后续将使用频率高且更新及时的微观经济大数据指标,继续进行深入研究。

参考文献

[1]胡登. 陕西进出口总额影响因素研究——基于多元线性回归模型[J]. 当代经济, 2018(14): 88-89.

[2]荀梓莹, 蒋少华, 曹桢, 等. 我国贸易进出口总额影响因素的实证分析[J]. 景德镇学院学报, 2019, 34(1): 10-15.

[3]田瑞秀. 影响中国进出口贸易相关因素的实证分析[J]. 现代商业, 2019(15): 47-48.

[4]王姝涵. 文化距离对中国进出口贸易的影响[D]. 天津财经大学, 2017.

[5]丁欲晓. 人民币汇率波动对中国进出口贸易的影响分析[J]. 財会学习, 2018(2): 214.

[6]郑斌. 中国进出口贸易对国民经济影响的因素分析[J]. 现代商业, 2011(26): 176-177.

[7]胡登. 陕西进出口总额影响因素研究——基于多元线性回归模型[J]. 当代经济, 2018(14): 88-89.

[8]靳文利, 张建. 电子商务对传统企业的影响及对策[J]. 软件, 2015, 36(6)158-162.

[9]马亮, 肖建军, 刘锦文. 西部形变数据分中心在提升数据服务能力方面的探究[J]. 软件, 2016, 37(1): 120-121.

[10]谌迅. 大数据资产管理系统的设计与实现[J]. 软件, 2016, 37(2): 50-53.

[11]孙伟. 中国期货市场组合交易保证金算法研究[J]. 软件, 2018, 39(1): 183-187.

[12]王鹏飞, 余开朝. 基于多元线性回归的昆明市房价影响因素分析[J]. 软件, 2018, 39(9): 152-157.

[13]崔蓬. 基于ThinkPHP的物流配送系统的设计与实现[J]. 软件, 2018, 39(7): 194-198.

猜你喜欢

多元回归分析R语言进出口
今年上半年我国化肥进出口双双下降
前两个月我国化肥进出口量均减少
基于GPS轨迹数据进行分析改善城市交通拥挤
基于R语言的Moodle平台数据挖掘技术的研究
注重统计思维培养与应用为主导的生物统计学课程建设