APP下载

色谱经济分析法在股票分类中的应用研究

2015-04-06游士兵

中南财经政法大学学报 2015年3期
关键词:色谱分析分析法组分

游士兵 廖 祺

(武汉大学 经济与管理学院,湖北 武汉 430072)

一、色谱经济分析法用于股票分类的特点与优势

对股票的分类分析的主要目是为投资者选取高内在价值股票和构建合理的投资组合提供参考,分类的聚焦点在于发现股票基本面信息和价格增长之间的关系。在相关的分析方法中,多元统计方法是解决复杂经济现象分类问题最传统的方法,因此常被用于探索投资组合的分析。多元统计方法可以对研究对象进行简化,实现对社会经济现象和事物的分类[1]。但该方法存在以下不足:

第一,科学依据与标准有待完善。例如,聚类和判别分析的分类依据是基于样本或指标的距离,然而所有距离定义都存在将指标同等对待的缺点。不同距离算法的结果也是不一致的,而对距离算法的评价至今尚未形成标准。再如,判别分析是基于多维空间点在二维平面投影形成的图像,通过图形分析得出结果,具有很强的主观性。

第二,分辨率有待进一步提高。传统多元统计方法在分类过程中,由于主观因素的存在及被分离对象性质特征的交叉性,导致了分离分类结果的分辨率较低。如主成分分析和因子分析,通过对指标的数学处理和计量将多个指标融合为综合指标以作为经济事物特征的代表,虽简化了分析,但产生了遗漏重要分类指标的可能性,使事物的归类、判别可能产生错误和纰漏。

第三,方法的有效性和包容性需要提升。由于传统多元统计方法集中于被分离对象的某一特征,运用数学计量方法进行归纳辨析而达到分离目的,忽略了复杂经济现象之间及它们与所处环境间的相互作用,脱离了经济系统的单纯分类,更多体现的是事物的表象,而较少涉及到对分离对象深层次属性的探究。因此,传统多元统计方法的应用受到局限。例如,典型相关分析是对线性相关关系的分析,如果变量间不是线性关系,则不适用。

色谱经济分析法是将化学色谱分析法应用于经济学领域的一种分析方法。色谱分析法本身是分析化学领域中分离与分析多组分混合物的强有力工具,将其借鉴到经济学领域可以实现对复杂经济现象的分类、鉴别和评析等功能[2][3]。该方法具有以下特点和优势:

1.分辨率高。色谱分析法的分离系统能使待分离组分经过多次选择和分配后分离,能够对各组分的纵向信号和扩散信号进行精准检测,从而大大提高分析的分辨率,减少信息遗漏。若设定每一期股票下跌概率和上涨概率的比值恒定,即股票的分配比恒定,不同类别股票的样本会在经过分离系统的多次选择、分配后,在色谱柱内先后流出。由于对于某一类股票,其总体在色谱柱中的流动会形成一个类似于正态分布的流出曲线,将每类股票每一时期流出样本数对时间作散点连线图,可以分别得到每类股票的流出曲线图。当峰完全分离时,可以认为在其中的每个峰值处,流出的股票是属于同一类别的,即可清晰看出股票流出曲线的差异。

2.分离效率高。PB级以上的大数据带来的数据维度和规模的增大对分析工具的效率提出更高要求,色谱分析法能够高效快速完成分离和分析,在很短时间内分离多达几百个组分的复杂物质。色谱经济分析法应用在股票分类时,在流动相和固定相发挥作用下,无论样本中哪类股票的实际个数是多少,只要两类股票的分配比存在差异,在短暂时间内就能经历多次分配平衡,因此可以同时处理大量的股票样本。

3.检测能力强。色谱分析法中独特的色谱柱系统,能够将各组分之间微小差异放大化,再加上高灵敏检测器的使用,可以识别各组分性质上的微小差别,完成复杂混合物的精确检测。色谱图即由流出物通过检测器产生的响应信号产生,它反映了待分离的各组分从色谱柱随时间的变化。将色谱柱分成若干个互相连接的塔板,适当增加色谱柱的塔板数,可以得到完全分开的色谱峰。股票之间的微小差别经过色谱经济分析过程将得以放大,即使涨跌趋势非常相近的股票也能分离开来,实现完全的分离。

4.主观性评价是许多统计方法的主要特征,色谱分析法以还原论为基础,强调系统内部各部分之间的相互联系和作用来决定现象的性质。是从自然界物体内部的信号检测来确定事物的科学依据和评价标准,是期望的真实标准。分配比其实间接地反映了组分的物理化学性质。相对于概率论和数理统计方法对数据结构和特征的要求,该方法对数据的特征和分布要求更弱。其信号来自于事物本身,所以本质上是根据客体系统响应来探究系统内部的一种方法。

5.同时满足定性定量分析。色谱经济分析法由于其独特的色谱柱分析系统和样本信息信号检测系统,能够对样本进行有效分离,并同时对复杂经济现象的各个组成部分同时进行定性和定量分析,这是其他传统分析方法所不能比拟的优势。

正是因为色谱经济分析法具有上述传统分类方法缺乏的特点和优势,而影响股票的股价信息因素又纷繁复杂,因此,应用该分析方法可以满足股票分类理论和实践需求。

二、色谱经济分析法应用于股票分类的理论概述

(一)色谱经济分析法的基本理论

在化学中,色谱分析法的原理可以简述为:待分离的组分进入色谱柱,在柱内与两相发生作用,一相静止不动,对组分起阻碍作用,称为固定相;另一相是携带组分流出色谱柱,对组分起推动作用,称为流动相。组分经过多次反复的分配可以达到分离的目的[4](P6)。分离核心在于组分在流动相和固定相中具有不同的分配系数,其大小反映了组分在固定相上的溶解或吸附的能力。分配系数大的组分在固定相上的溶解或吸附能力强,则在柱内的移动速度慢;分配系数小的组分在固定相上的溶解或吸附能力弱,在柱内的移动速度快。这种内在的选择差异使各组分在柱内形成差速移行,经过多次分配后会使组分最终流出色谱柱的时间不同,最后通过信号检测对各组分进行定性定量分析[5](P23)。

色谱经济分析法主要是借鉴了化学色谱分析法中的分离过程及分析方法。待分离组分对流动相和固定相存在稳定的反应,这种反应是组分对于外界其他物质属性和性质的一种响应。这种分离思想并不是建立在具体物质的结构和性质上,而是依赖于待分离物质对目标对象连续且稳定的动态反应。从自然现象到经济现象,色谱经济分析法的研究对象不是自然科学领域的具体物质,而是伴随着不确定性的经济主体复杂经济行为,其动态反应条件在跨学科转化中并没有被违背。相反,色谱经济分析法正是在探索和建立某种社会经济实验环境,使这种动态反应条件能够在经济领域中得到系统的运用。经济现象中虽不存在化学领域中的物理或化学反应(如吸附、溶解),但经济主体对外在环境和约束的变化会做出反应[6](P317)。如果待分离对象相对于分离目标的核心特征是连续的,那么色谱经济分析法能满足色谱分析法的分离思想。相对于稳定的化学或物理反应,经济现象对环境约束的反应会更为复杂,这一复杂性既来自于复杂的外在环境,又来自于经济人的主观因素。

色谱经济分析系统包括:样本预处理系统、色谱经济柱系统、色谱经济信号检测系统和定性定量分析系统等四个过程。色谱经济分析法的分离目标是待分离对象,它与大环境交换各种信息,这对色谱经济分析系统存在较强的扰动。伴有随机扰动的待分离对象样本进入色谱经济柱系统,在柱系统中设置有固定相和流动相,它们共同作用于分离对象,使组分流出柱系统的时间不同。待分离后输入到信号检测系统,经过检测后如果分离效果好,将直接输出分离完成的组分,最后由色谱经济分析系统对流出的组分进行定性定量分析。

色谱分析的基本理论主要包括:平衡理论、塔板理论、速率理论和分离度理论。这四大理论是建立分离机制与检测机制的基础。其中塔板理论是最基础最核心的理论之一。色谱经济分析法的模拟分析严格遵循化学领域色谱分析法的基本原理,通过设置色谱经济实验条件,使经济主体在连续的脉冲式约束下连续发出反馈信息。色谱经济分析法能够将反馈信息中的个体选择差异通过色谱柱形象化放大,使不同特征的经济主体经过多次分配后流出色谱柱的时间不同,通过信号检测得到相对分离的流出曲线,从而实现对复杂经济现象的分类。

(二)塔板理论的基本原理

在化学中,由于组分、流动相和固定相三者的热力学性质使不同组分在两相中具有不同的分配比,而分配比的大小反映了组分在固定相上的溶解—挥发和吸附—解吸的能力。分配比大的组分在固定相上的溶解或吸附能力强,在色谱柱内的移动速度慢;分配比小的组分在固定相上的溶解或吸附能力弱,在柱内的移动速度快[7]。换言之,流动相在柱内起着推力的作用,固定相起着阻力的作用,各组分受到的阻力与推力大小不同,使得组分在柱内的运动速度不同,表现为流出色谱柱出现峰值的时间(即保留时间)不同,从而最终得到分离。

塔板理论将色谱分离过程比作化学中的分馏过程,将色谱柱假想为含有多个塔板的分馏塔,固定相和流动相在每个塔板中都占据一定的空间。当流动相带着待分离的组分进入色谱柱后,组分就会根据该组分的分配比在这些塔板中的流动相和固定相之间不断地达到分配平衡,并最终流出色谱柱[7]。例如假设分配比k=1的某组分在开始时拥有单位质量m=1,将其置于第0号塔板上,由于分配比k=1,当塔板内分配达到平衡时组分在流动相中的质量mm和在固定相中的质量ms相等,即mm=ms=1。当一单位塔板体积的流动相以脉动形式进入0号塔板时,就将该塔板中流动相中的质量为mm的组分顶到1号塔板上,此时0号塔板和1号塔板又根据分配比将组分在流动相和固定相之间进行分配。以后每当新的流动相进入塔板时,上述过程就重复一次,如表1所示。

表1 塔板理论的分配过程

根据上述原理,组分在流动相的带动下流出色谱柱。将流出色谱柱的组分质量作为纵坐标,进入色谱的流动相体积作为横坐标画成流出曲线,可以证明塔板数足够大时流出曲线趋近于正态分布曲线。当组分中不同物质的分配过程差异足够大时,它们在色谱柱中的保留时间便有足够的差别,从而先后流出色谱柱,形成峰形错开的流出曲线,达到分离的效果。

借鉴色谱分析的方法将股票按照其上涨概率的大小进行分类时,为了分析的简便,假定股票市场是一个有效市场。由于有效市场中所有与股价有关的信息都反映在股票的市场价格中,因此股票的价格可以看成是一个随机游走(random walk)[8]。这样,我们可以认为股票在每一期上涨和下跌都具有固定的概率,同时认为同类股票(可以是同一行业或是同一属性)在每一期上涨和下跌的概率是相同的[9]。通过选取适当的固定相和流动相,依据塔板理论的模型,使得不同种类的股票在色谱柱内先后流出,最后形成峰形错开的流出曲线,从而将各类股票进行分离,实现对股票的分类。

(三)应用于股票分类的基本假定与概念

化学中色谱柱由流动相和固定相组成。在色谱经济分析中,这两相可以抽象为:固定相对组分有吸附作用,或者说是阻止流动相推动作用的因素;流动相对组分有推动作用,或者说是克服固定相吸附作用的因素。它们对于组分的影响是对立的、反向的。在股票分类的问题中,我们对固定相和流动相进行如下设定:

定义1:在股票分类的色谱分析中,流动相为每一期股票的上涨趋势,而固定相为每一期股票的下跌趋势;

定义2:对于第i类股票si,记其分配比为ki,则ki满足:

式(1)中Pd(si)表示股票si下跌的概率,Pu(si)表示股票si上涨的概率。

依据各组分的分配比不同而进行分离是色谱分析法分离原理的实质,分配比可以认为是两相对组分的作用大小的比值,两相对于不同分配比的组分的作用力大小不同,导致组分在色谱柱中的运动速率存在差异,进而实现物质的分离[7]。在塔板理论中,分配比具体决定了在每个塔板中组分在固定相和流动相之间的分配比例。对于每一类股票而言,定义2给出的分配比即是每一期股票下跌概率和上涨概率的比值。为了让研究需要的分配比与化学中色谱分析法和塔板理论的要求相吻合,我们还需做如下假定:

假定1:对于第i类股票si,其每一期上涨的概率Pu(si)是恒定的,满足Pu(si)+Pd(si)=1且概率只与该类股票的性质有关;

假定2:第i类股票每一期上涨和下跌的情况与前一期的情况无关,即每一期的股票的走势都是独立的。

以上两条假定保证分配比在对股票进行色谱分离的过程中是恒定的,且只与股票本身的性质有关。但是由于用概率比作为分配比在直观上难以看出股票在两项中的分配规律,我们将上述定义直接应用于塔板理论还存在一定的困难,为了将分配比转化为与化学中质量比类似的数量比,在分析中引入大数定律:

定理1(伯努利大数定律):设μn 是n重伯努利试验中事件A 出现的次数,A 在每次实验中出现的概率为P(0<p<1),则对任意的ε>0,有:

根据伯努利大数定律,在样本充裕的条件下,第i类股票si的上涨和下跌的概率可以用其样本中实际上涨和下跌的股票频率进行代替,因此可以将分配比进行改写。

命题1:对于第i类股票,由伯奴利大数定律,在样本充足的条件下,其分配比ki满足:

命题1可以视作分配比的第二定义。根据上述第二定义可知第i类股票si的分配比为每一期该类股票样本中上涨的频数与下跌的频数之比。值得注意的是,这与传统的大盘分析的辅助方法——回归式的腾落指数(又称涨跌比率)是不同的。涨跌比率是统计并求出一定期间内股价上涨的股票家数与下跌的股票家数比率,因此,它是对大势而言。第i类股票si的分配比与化学色谱分析中定义的分配比(即该类组分在两相中的质量比)非常类似,因此我们将此分配比的定义运用到塔板理论的模拟中。通过对以上基本概念的置换,完成了运用塔板理论进行股票分类的准备工作。接下来对某一类股票进行分析,模拟塔板理论的全过程。

三、塔板理论应用于股票分类的模拟

(一)单一类别股票的塔板理论模拟

同化学色谱分析中一样,我们将色谱柱分成若干个互相连接的塔板,每个塔板由固定相和流动相占据,根据塔板理论的原理,将某类股票放入第一个塔板内,为了简便,将股票的个数标准化为1。根据上述分配比的定义可以看出,随着时间的推移,每一期都会有固定比例的该类股票表现出上涨,从而随着流动相进入下一个塔板,而表现出下跌的股票则停留在当前塔板。若干期后,最后一个塔板的末端就会有样本流出,将流出的股票个数与时间在同一个图像中画出,便可以得到与化学色谱法中类似的流出曲线图。设塔板数为5,第i类股票si的分配比为ki=1,组分在任意板上的分配情况由表2给出。

表2给出了从t=1到t=34的34个时期内,第i类股票在塔板中的分配情况。可以看出当t=5时出口处开始有股票样本流出,t=9时,流出的样本数达到峰值,到t=33时,该类股票几乎全部通过色谱柱。将出口处流出的样本数与时期t在同一个平面上绘制出散点连线图,可以获得类似化学色谱分析中的流出曲线图。

以上分析表明,对于某一类股票,其总体在色谱柱中的流动会形成一个类似于正态分布的流出曲线,这与化学色谱分析中的结论是一致的。相应地,当两类股票的分配比差异足够大时,两类股票的流出曲线便会产生明显的差异,形成两个错开的峰,这便是我们对股票分离的理论基础。

(二)多类别股票分类模拟

我们讨论了单一类别的股票在色谱柱中的分配过程,根据塔板理论的原理,若通过色谱柱的是含有不同类别股票的样本,各组分的分配比有差异,经过多次分配平衡之后,则不同类别的股票在柱出口处达到峰值的时间不同实现分离。根据上述思路,我们给出如下假定:

表2 第i类股票的塔板分配

(1)市场上仅有两类股票,记为s1和s2;

(2)s1和s2的分配比分别为k1和k2,为了分析的简便,取k2=4,色谱的塔板个数n=10;

(3)待分类样本容量为500只股票,其中s1、s2各250只。

需指出的是,假定3分别设定了两类股票的具体样本数,在实际操作中,并不一定先验地知道待分类样本中每一类股票的具体个数,但是这并不影响色谱柱的分离结果。无论样本中每一类股票的实际个数是多少,只要两类股票的分配比存在差异,色谱柱便能将两者分离。这里之所以对每一类样本的个数做出假设,是为了通过数值计算更好的阐明样本在各塔板中的分配过程,在实际的应用中无须作此假定。根据上述讨论,可以得到股票在色谱柱中的分配情况,如表3所示。

图1 分配比为1的流出曲线

表3 两类股票在色谱柱中的分配

从表3中可以看出,s1类股票在t=10时开始有样本流出色谱柱,当t=12时流出的样本数达到峰值。s2类股票在色谱柱中的分配过程也可以用与表2类似的表格描述。分别将两类股票每一时期流出样本数对时间作散点连线图,可以分别得到两类股票的流出曲线图。将两条流出曲线在同一个坐标轴上表示出来,便可以看出两类股票流出曲线的差异。

从图4中可以看出,由于分配比的不同,两类股票经过色谱柱之后,形成了两个明显错开的峰。本例中假设的色谱柱塔板数只有10,只要再适当增加色谱柱的塔板数,就可以得到完全分开的色谱峰,两类股票也就通过色谱柱的实现了完全的分离。以上的模拟说明,色谱分析法可以有效地将不同类别的股票进行分离,只要两类股票的分配比差异足够大,就可以得到如图4所示的流出曲线。当两峰完全分离时,可以认为在其中的每个峰值处,流出的股票是属于同一类别的。这样便通过色谱分离的方法完成了对股票的分类。

图2 s1类股票流出曲线图

图3 s2类股票流出曲线图

图4 两类股票的流出曲线图

四、结论与启示

从股票分类的需求出发,本文引入融合数据筛选和数据分析的一种新方法——色谱经济分析法。该方法对复杂经济现象进行分离和分析,从而实现对纷繁复杂的股价脉冲式信息数据的挖掘与利用。色谱经济分析法的这种筛选功能根源于色谱分析法的基本原理,即待分离的复杂经济现象脉冲式的信息资料多次反复地在流动相和固定相之间进行分配,当复杂经济现象对同一约束多次反复地做出反应,这种经济行为会产生一系列连续的脉冲式数据,通过色谱分析系统的分析达到对复杂经济现象的特征进行分类分析目的。

本文提供了色谱经济分析法在经济学领域的应用范例,即用色谱经济分析法塔板理论对有效市场假定下股票的分类问题进行了模拟演示。在有效市场的假定下,我们认为不同类别股票在每一期表现出上涨的概率是不同的,而色谱柱放大了各类股票的差异性。一般对股票进行分类的方法主要依靠传统的多元统计分析方法,而色谱经济分析法所具有的高分辨率、客观性强、检测能力强等等优势为股票分类分析提供了一种新的思路和分析方法。色谱分析系统独特的分配比概念和方法使得我们可以对不同的股票股价信息进行精确、快速、客观的分类分离和定性定量分析,对于选取交易策略、投资者决策、股票价格走势预测都有一定的理论和实际意义。同时,该方法对于探索纷繁复杂股价信息分析技术也是一个有益的尝试。

[1]黄丽.聚类分析方法在股票评价中的应用[J].商业会计,2011,(25):65-66.

[2]游士兵,吴比,沈萍,等.复杂经济现象分类方法创新的理论前瞻——基于化学“色谱分析法”的借鉴与思考[J].统计与决策,2011,(7):4—7.

[3]游士兵,梅敏,吴比.色谱分析法在经济领域中的应用展望[J].统计与决策,2011,(11):4—7.

[4]史景江.色谱分析法[M].重庆:重庆大学出版社,1990.

[5]达世禄.色谱学导论[M].武汉:武汉大学出版社,1999.

[6]陈文辉,李扬,魏华林.银行保险国际经验及中国发展研究[M].北京:经济管理出版社,2007.

[7]沈萍,张佩,毛锴苑,等.色谱经济分析法置换系列研究:分配比[J].统计与决策,2011,(17):4—7.

[8]柳思维,刘凤根.股票市场弱势有效与股票价格的随机游走[J].系统工程,2003,(6):71—74.

[9]雷鸣,叶五一,缪柏其,等.生存分析与股指涨跌的概率推断[J].管理科学学报,2010,13(4):57—66.

猜你喜欢

色谱分析分析法组分
异步机传统分析法之困难及其克服
组分分发管理系统在天然气计量的应用
污泥好氧堆肥中反硝化作用与腐植酸组分稳定化关系研究
层次分析法在起重机械腐蚀评估中的应用
煤的族组分基本特性研究
抗倒酯原药超高效液相色谱分析方法研究
20%吡噻菌胺悬浮剂的高效液相色谱分析
20%三氟苯嘧啶水分散粒剂高效液相色谱分析方法研究
层次分析法在生态系统健康评价指标体系中的应用
基于时间重叠分析法的同车倒卡逃费探析