基于改进Chameleon算法的IPO定价方法研究
2014-03-31王华
摘要:IPO定价一直是理论界和实务界争相讨论的热点话题,以往构建于单一指标的估值方法误差较大,怎样采用合适的办法对IPO定价相关指标进行量化分析是一个难题。文章对研究对象数据采用主成因分析法对影响IPO定价的有关指标矩阵数据进行预处理,再采用改进的Chameleon算法进行聚类分析,最后对待分析的新上市股票进行贝叶斯分类,从而实现其定价的指导。实验证明,该方法能够比较客观、科学的对IPO定价进行调整指导,具有一定的实际意义。
关键词:聚类算法;改进Chameleon算法;IPO定价
中图分类号:F803 文献标识码:A 文章编号:1009-2374(2014)04-0029-03
在第四次新股发行体制改革稳步推进的大背景下,IPO定价理论研究近期得到了广泛关注,传统的IPO估值办法由基于资产的估值方法、现值估价方法、可比公司法、实物期权估价法等,但采用少数单一指标比对的估值办法难免有失偏颇,而多指标估值法因指标间的复杂关系,采用人工或某些简单的基数对比算法难以厘清各种指标间的关系,实用性受到极大影响。聚类算法作为可行、高效、客观的计算机自动处理划分技术在信息处理领域得到了广泛应用。现有的聚类算法主要有:划分法、密度法、网格法等,这些算法大都存在初始参数需要人工给定,分类过程需要人工调整干预的缺陷,影响了算聚类的无监督性和客观性。
本文的思路是在回归分析的基础上,遴选变量作为聚类指标,再利用改进的Chameleon算法进行聚类分析并得到一组分类判别函数,最终实现对IPO的定价调整。实验证明,该算法具有无监督和泛化能力强的
特点。
1 数据预处理
如表1所示,每一个对IPO定价具有影响的分指标的量纲和数量级都不同,未消除不同指标间的差别,同时考虑到分类器收敛的需要,采用适当调整过的主成分分析法(PCA)对数据进行降维预处理。具体步骤为:(1)对原始数据进行预处理,剔除大于95%分位的和小于95%分位的极端数据;(2)再对处理后的数据用平均值法进行处理;(3)计算协方差矩阵;(4)计算矩阵的特征根和特征向量,由此得到各成分的方差贡献率及累计方差贡献率;(5)依据累计方差贡献率大小依次排列,取前t个为主成分。
3 具体流程
挑选具有一定代表性的股票样本数据,按照表1列出因素矩阵,并利用调整过的主成分分析法对数据进行预处理确定t个主成分;选定某行业作为分析范围,利用改进Chameleon算法对相关行业股票数据进行聚类分析;(1)利用预处理后的矩阵计算得到加权图;(2)假设初始加权图分为n个独立的簇,然后每次选取结构等价相似度小的两个簇进行合并,并计算模块度;(3)模块度达到最大时停止计算,此时的划分结果即为聚类
结果。
计算不同类别的费氏线性判别函数,将待分析的新上市股票定价因素值带入求得函数值,依据最大值判定分类归属,并依此进行最终定价分析。
4 实验及其结果
选取1993年4月至2005年2月期间我国沪深市场所发行36只电力板块IPO股票为样本,依靠各自上市时的财务数据,进行数据预处理,设定累计方差贡献率阈值为85%,求得主成分为:每股净资产(POE),市盈率(PE),区域(A),主营业务利润率(PR),发行股数(QN)共5项,利用本文给出的改进的Chameleon算法进行聚类分析,其分析过程如图1所示,当Q的最大值为0.54时,37支股票被划分为3类。
运用判别函数时,将带判别股票的各指标数据分别代入3个判别函数中,每个样本点对应的3个函数的值进行比较,其中,函数值最大的那个是第几个函数,则该股票就归为第几类,由此可以得出IPO定价的参考值。
下面分别采用2006、2011年上市的大唐发电和中国水电IPO时相关数据进行验证,计算得到表3。
可以看到对于大唐发电,其判别函数最大值为-23,IPO参考定价为5.99;对于中国水电,其判别函数最大值为-26,IPO参考定价为4.68。对照两者实际上市价格6.68和4.5,发现利用本文方法给出的参考定价具有较强的参考价值。
5 结语
IPO定价是一项复杂的系统工程,聚类算法作为一种客观的定量分析方法,具有规范性、科学性等特点,本文利用聚类算法对IPO定价进行了初步的量化讨论分析,是数据挖掘技术在IPO定价中实际应用的有益尝试,对于指导新股定价改革具有一定的借鉴意义。
参考文献
[1] Jiawei Han,Micheline Kamber,范明,孟小峰.数据挖掘:概念与技术(第1版)[M].机械工业出版社,2002.
[2] 龙真真,张策,刘飞裔,张正文.一种改进的Chameleon算法[J].计算机工程,2009,35,(20).
[3] E.F.Fama and K.R.French.The cross-sectionof expected stock returns.Journal of Finance,1992,47:427-465.
[4] Newman M E J, Girvan M.Finding and evaluatingcommunity structure in networks.Phys.Rev.E,2004,69:026113
[5] R.S.Burt,Positions in networks[J].Social Forces55,93-122(1976)
[6] 王双成,苑森淼,王辉.基于类约束的贝叶斯网络分类器学习[J].小型微型计算机系统,2004,25(6):969-971.
作者简介:王华(1978—),女,河北人,新时代证券有限责任公司资深投资经理,北京大学经济学院学生,研究方向:投资学与资本市场。
摘要:IPO定价一直是理论界和实务界争相讨论的热点话题,以往构建于单一指标的估值方法误差较大,怎样采用合适的办法对IPO定价相关指标进行量化分析是一个难题。文章对研究对象数据采用主成因分析法对影响IPO定价的有关指标矩阵数据进行预处理,再采用改进的Chameleon算法进行聚类分析,最后对待分析的新上市股票进行贝叶斯分类,从而实现其定价的指导。实验证明,该方法能够比较客观、科学的对IPO定价进行调整指导,具有一定的实际意义。
关键词:聚类算法;改进Chameleon算法;IPO定价
中图分类号:F803 文献标识码:A 文章编号:1009-2374(2014)04-0029-03
在第四次新股发行体制改革稳步推进的大背景下,IPO定价理论研究近期得到了广泛关注,传统的IPO估值办法由基于资产的估值方法、现值估价方法、可比公司法、实物期权估价法等,但采用少数单一指标比对的估值办法难免有失偏颇,而多指标估值法因指标间的复杂关系,采用人工或某些简单的基数对比算法难以厘清各种指标间的关系,实用性受到极大影响。聚类算法作为可行、高效、客观的计算机自动处理划分技术在信息处理领域得到了广泛应用。现有的聚类算法主要有:划分法、密度法、网格法等,这些算法大都存在初始参数需要人工给定,分类过程需要人工调整干预的缺陷,影响了算聚类的无监督性和客观性。
本文的思路是在回归分析的基础上,遴选变量作为聚类指标,再利用改进的Chameleon算法进行聚类分析并得到一组分类判别函数,最终实现对IPO的定价调整。实验证明,该算法具有无监督和泛化能力强的
特点。
1 数据预处理
如表1所示,每一个对IPO定价具有影响的分指标的量纲和数量级都不同,未消除不同指标间的差别,同时考虑到分类器收敛的需要,采用适当调整过的主成分分析法(PCA)对数据进行降维预处理。具体步骤为:(1)对原始数据进行预处理,剔除大于95%分位的和小于95%分位的极端数据;(2)再对处理后的数据用平均值法进行处理;(3)计算协方差矩阵;(4)计算矩阵的特征根和特征向量,由此得到各成分的方差贡献率及累计方差贡献率;(5)依据累计方差贡献率大小依次排列,取前t个为主成分。
3 具体流程
挑选具有一定代表性的股票样本数据,按照表1列出因素矩阵,并利用调整过的主成分分析法对数据进行预处理确定t个主成分;选定某行业作为分析范围,利用改进Chameleon算法对相关行业股票数据进行聚类分析;(1)利用预处理后的矩阵计算得到加权图;(2)假设初始加权图分为n个独立的簇,然后每次选取结构等价相似度小的两个簇进行合并,并计算模块度;(3)模块度达到最大时停止计算,此时的划分结果即为聚类
结果。
计算不同类别的费氏线性判别函数,将待分析的新上市股票定价因素值带入求得函数值,依据最大值判定分类归属,并依此进行最终定价分析。
4 实验及其结果
选取1993年4月至2005年2月期间我国沪深市场所发行36只电力板块IPO股票为样本,依靠各自上市时的财务数据,进行数据预处理,设定累计方差贡献率阈值为85%,求得主成分为:每股净资产(POE),市盈率(PE),区域(A),主营业务利润率(PR),发行股数(QN)共5项,利用本文给出的改进的Chameleon算法进行聚类分析,其分析过程如图1所示,当Q的最大值为0.54时,37支股票被划分为3类。
运用判别函数时,将带判别股票的各指标数据分别代入3个判别函数中,每个样本点对应的3个函数的值进行比较,其中,函数值最大的那个是第几个函数,则该股票就归为第几类,由此可以得出IPO定价的参考值。
下面分别采用2006、2011年上市的大唐发电和中国水电IPO时相关数据进行验证,计算得到表3。
可以看到对于大唐发电,其判别函数最大值为-23,IPO参考定价为5.99;对于中国水电,其判别函数最大值为-26,IPO参考定价为4.68。对照两者实际上市价格6.68和4.5,发现利用本文方法给出的参考定价具有较强的参考价值。
5 结语
IPO定价是一项复杂的系统工程,聚类算法作为一种客观的定量分析方法,具有规范性、科学性等特点,本文利用聚类算法对IPO定价进行了初步的量化讨论分析,是数据挖掘技术在IPO定价中实际应用的有益尝试,对于指导新股定价改革具有一定的借鉴意义。
参考文献
[1] Jiawei Han,Micheline Kamber,范明,孟小峰.数据挖掘:概念与技术(第1版)[M].机械工业出版社,2002.
[2] 龙真真,张策,刘飞裔,张正文.一种改进的Chameleon算法[J].计算机工程,2009,35,(20).
[3] E.F.Fama and K.R.French.The cross-sectionof expected stock returns.Journal of Finance,1992,47:427-465.
[4] Newman M E J, Girvan M.Finding and evaluatingcommunity structure in networks.Phys.Rev.E,2004,69:026113
[5] R.S.Burt,Positions in networks[J].Social Forces55,93-122(1976)
[6] 王双成,苑森淼,王辉.基于类约束的贝叶斯网络分类器学习[J].小型微型计算机系统,2004,25(6):969-971.
作者简介:王华(1978—),女,河北人,新时代证券有限责任公司资深投资经理,北京大学经济学院学生,研究方向:投资学与资本市场。
摘要:IPO定价一直是理论界和实务界争相讨论的热点话题,以往构建于单一指标的估值方法误差较大,怎样采用合适的办法对IPO定价相关指标进行量化分析是一个难题。文章对研究对象数据采用主成因分析法对影响IPO定价的有关指标矩阵数据进行预处理,再采用改进的Chameleon算法进行聚类分析,最后对待分析的新上市股票进行贝叶斯分类,从而实现其定价的指导。实验证明,该方法能够比较客观、科学的对IPO定价进行调整指导,具有一定的实际意义。
关键词:聚类算法;改进Chameleon算法;IPO定价
中图分类号:F803 文献标识码:A 文章编号:1009-2374(2014)04-0029-03
在第四次新股发行体制改革稳步推进的大背景下,IPO定价理论研究近期得到了广泛关注,传统的IPO估值办法由基于资产的估值方法、现值估价方法、可比公司法、实物期权估价法等,但采用少数单一指标比对的估值办法难免有失偏颇,而多指标估值法因指标间的复杂关系,采用人工或某些简单的基数对比算法难以厘清各种指标间的关系,实用性受到极大影响。聚类算法作为可行、高效、客观的计算机自动处理划分技术在信息处理领域得到了广泛应用。现有的聚类算法主要有:划分法、密度法、网格法等,这些算法大都存在初始参数需要人工给定,分类过程需要人工调整干预的缺陷,影响了算聚类的无监督性和客观性。
本文的思路是在回归分析的基础上,遴选变量作为聚类指标,再利用改进的Chameleon算法进行聚类分析并得到一组分类判别函数,最终实现对IPO的定价调整。实验证明,该算法具有无监督和泛化能力强的
特点。
1 数据预处理
如表1所示,每一个对IPO定价具有影响的分指标的量纲和数量级都不同,未消除不同指标间的差别,同时考虑到分类器收敛的需要,采用适当调整过的主成分分析法(PCA)对数据进行降维预处理。具体步骤为:(1)对原始数据进行预处理,剔除大于95%分位的和小于95%分位的极端数据;(2)再对处理后的数据用平均值法进行处理;(3)计算协方差矩阵;(4)计算矩阵的特征根和特征向量,由此得到各成分的方差贡献率及累计方差贡献率;(5)依据累计方差贡献率大小依次排列,取前t个为主成分。
3 具体流程
挑选具有一定代表性的股票样本数据,按照表1列出因素矩阵,并利用调整过的主成分分析法对数据进行预处理确定t个主成分;选定某行业作为分析范围,利用改进Chameleon算法对相关行业股票数据进行聚类分析;(1)利用预处理后的矩阵计算得到加权图;(2)假设初始加权图分为n个独立的簇,然后每次选取结构等价相似度小的两个簇进行合并,并计算模块度;(3)模块度达到最大时停止计算,此时的划分结果即为聚类
结果。
计算不同类别的费氏线性判别函数,将待分析的新上市股票定价因素值带入求得函数值,依据最大值判定分类归属,并依此进行最终定价分析。
4 实验及其结果
选取1993年4月至2005年2月期间我国沪深市场所发行36只电力板块IPO股票为样本,依靠各自上市时的财务数据,进行数据预处理,设定累计方差贡献率阈值为85%,求得主成分为:每股净资产(POE),市盈率(PE),区域(A),主营业务利润率(PR),发行股数(QN)共5项,利用本文给出的改进的Chameleon算法进行聚类分析,其分析过程如图1所示,当Q的最大值为0.54时,37支股票被划分为3类。
运用判别函数时,将带判别股票的各指标数据分别代入3个判别函数中,每个样本点对应的3个函数的值进行比较,其中,函数值最大的那个是第几个函数,则该股票就归为第几类,由此可以得出IPO定价的参考值。
下面分别采用2006、2011年上市的大唐发电和中国水电IPO时相关数据进行验证,计算得到表3。
可以看到对于大唐发电,其判别函数最大值为-23,IPO参考定价为5.99;对于中国水电,其判别函数最大值为-26,IPO参考定价为4.68。对照两者实际上市价格6.68和4.5,发现利用本文方法给出的参考定价具有较强的参考价值。
5 结语
IPO定价是一项复杂的系统工程,聚类算法作为一种客观的定量分析方法,具有规范性、科学性等特点,本文利用聚类算法对IPO定价进行了初步的量化讨论分析,是数据挖掘技术在IPO定价中实际应用的有益尝试,对于指导新股定价改革具有一定的借鉴意义。
参考文献
[1] Jiawei Han,Micheline Kamber,范明,孟小峰.数据挖掘:概念与技术(第1版)[M].机械工业出版社,2002.
[2] 龙真真,张策,刘飞裔,张正文.一种改进的Chameleon算法[J].计算机工程,2009,35,(20).
[3] E.F.Fama and K.R.French.The cross-sectionof expected stock returns.Journal of Finance,1992,47:427-465.
[4] Newman M E J, Girvan M.Finding and evaluatingcommunity structure in networks.Phys.Rev.E,2004,69:026113
[5] R.S.Burt,Positions in networks[J].Social Forces55,93-122(1976)
[6] 王双成,苑森淼,王辉.基于类约束的贝叶斯网络分类器学习[J].小型微型计算机系统,2004,25(6):969-971.
作者简介:王华(1978—),女,河北人,新时代证券有限责任公司资深投资经理,北京大学经济学院学生,研究方向:投资学与资本市场。