APP下载

投资者视角下的奖励型众筹问题研究①

2017-07-19倪宁曦陈玉婕金百锁

计算机系统应用 2017年7期
关键词:项目数决策树众筹

倪宁曦, 陈玉婕, 金百锁

(中国科学技术大学 统计与金融系, 合肥 230026)

投资者视角下的奖励型众筹问题研究①

倪宁曦, 陈玉婕, 金百锁

(中国科学技术大学 统计与金融系, 合肥 230026)

随着众筹行业的迅猛发展, 众筹项目数量迅速增长, 使得投资者在项目选择上花费了大量的时间精力. 本文旨在帮助投资者以最少时间成本选择优质的众筹项目. 在假设众筹项目优质程度与融资完成比有正相关关系的前提下, 本文基于京东众筹数据, 利用CART回归树算法进行决策树建模, 模型R2达到0.746. 研究结果表明, 投资者应重点关注目标金额, 关注人数, 项目进展和话题这四个指标. 本文研究结果仅适用于奖励型众筹, 对于其他类型众筹应当重新选择自变量进行模型建立, 但决策树模型仍然可以适用.

奖励型众筹; 投资者角度; 决策树模型; 京东众筹; 成功因素分析

众筹指通过互联网方式发布筹款项目并募集资金.相对于传统的融资模式, 融入更多互联网元素的众筹模式, 这无疑能够得到更多的关注和支持, 而因为本身含有的梦想情愫, 使得资金回报不再成为投资者衡量项目的绝对标准, 这给更多的创业者提供了更多实现梦想的可能, 同时, 也成为了推动大众创业、万众创新的重要力量, 具有巨大的发展潜力和市场前景[1,2].

世界银行报告称, 中国将会在2025年成为世界上最大的众筹投资方. 2016年8月, 网贷之家联合盈灿咨询发布了《2016年7月众筹行业报告》. 月报数据显示,据不完全统计, 截至2016年7月底, 全国各类型正常运营的众筹平台总计369家, 其中奖励型众筹平台数反超非公开股权融资平台数, 位居榜首, 与6月相比增加12家, 达150家. 7月新增平台数量26家, 倒闭众筹平台24家, 平台众筹板块下架的有1家, 转型的有2家.2016年7月, 众筹行业共新增项目6278个, 其中, 奖励型众筹项目最多, 为4574个, 占总项目数72.86%, 众筹平台数目仍在增长, 但速度趋于平缓.

创业孵化器遍地开花, 路演项目层出不穷, 而且众筹为投资者的财富增值打开了方便之门, 可这是一把双刃剑, 如何培养一副火眼金睛, 在百里挑一中寻找优质的众筹项目就成为了投资者关注的问题.

因此, 本文旨在通过决策树模型, 以奖励型众筹项目为研究对象, 从投资者的角度出发定量探究各因素对众筹项目融资绩效的影响程度, 为投资众筹项目提供相关建议.

1 文献综述

BARABAS(2012), AHLERS G K C, CUMMING D J和GUENTHER C(2013)根据回报形式, 将众筹分为捐赠型、奖励型(产品众筹)、借贷型(P2P借贷)、股权型、收益分享型[3,4]. 作为众筹融资的重要类型, 基于奖励的众筹是指项目发起人在筹集款项时, 投资人可能获得非金融性奖励作为回报. 这种奖励仅是一种象征,也可能是由某投资人来提供. 基于奖励的众筹通常应用于创新项目的产品融资, 尤其是对电影、音乐以及技术产品的融资.

随着众筹的兴起, 国内外学者对于众筹项目成功因素做了众多相关研究.

Schwienbacher和Larralde(2010)通过对法国一项音乐项目的调研认为众筹通过互联网有效匹配了资金供给与需求, 让投资者更容易关注项目本身而非其债权股权的回报, 为难以进入传统融资的初创企业带来低成本且全新的融资方式[5]. Ordanini A, Miceli L和Pizzetti M(2011)对美国三个流行众筹平台的案例研究表明, 通过众筹平台实现与项目发起人的互动是提高众筹投资者投资积极性的重要因素[6]. Belleflamme P,Lambert T, Schwienbacher A (2011)尝试建立一个理论模型, 主要用于分析不同情形下影响人们评判众筹项目价值的条件与因素[7]. Gerber等人研究表明, 由于在众筹社区中的互动, 既是项目发起人又是其他项目投资者的众筹项目更容易获得成功. Mollick E(2014)的实证研究表明众筹项目的支持者对众筹项目成功起着重要作用[8].

郑海超, 黄宇梦, 王涛和陈冬宇(2015)根据信号理论基于“大家投”网站数据分析股权众筹项目融资绩效的影响因素, 研究表明项目动态更新次数、项目估值、员工人数、股东人数的影响显著[9]. 陈亮(2015)对“点名时间”上的众筹项目进行研究, 探索影响国内众筹项目成败的因素, 发现项目所属行业、回报方式、目标融资额、公告数量等因素对筹资成功影响显著[10].陈玉婕, 倪宁曦和苟小菊(2016)基于追梦网的数据, 分析了项目信息、人力资本、项目风险这三个维度对项目融资成败的影响, 发现项目支持人数、项目动态更新次数、项目图片数量与项目团队规模均对融资成功有显著的正向影响[11]. 吴文清, 付明霞和赵黎明(2016)实证考察了驱动众筹成功的因素, 检验了众筹市场上的羊群现象. 研究发现, 众筹项目的关注人数、互动话题数、价格梯度、筹资周期是驱动众筹成功的因素,它们能增大众筹实际筹资额[12].

目前, 大多数学者的研究是针对影响奖励型众筹项目融资结果的因素开展, 例如有学者研究了发起人社交网络与社会资本对奖励型众筹的价值[6,8,13,14]、资助人的动机等[6]. 在模型方面大部分学者都选择使用逻辑回归进行数据拟合, 该模型在自变量与因变量之间不存在线性关系或者线性相关不明显时并不能具备良好的可解释性, 且学者们的研究大多基于项目发起人的角度进行[9-11]. 随着互联网飞速发展, 数据量不断增大, 大规模众筹项目数据集同样应当被使用. 通过大规模数据集训练得到的模型在统计学中更具适用性, 以往文献中数据集的样本量基本仅有数百条, 以现在的角度来, 数据量有些偏少.

针对上述问题, 本文决定采用非线性模型进行建模, 并且选取大规模数据集进行训练, 希望能通过数据挖掘相关方法为投资者提供切实可行的建议, 帮助他们选择优质的众筹项目, 使投资者节省时间成本, 合理使用资金流.

2 研究设计

2.1 变量选择

本文采用融资完成比率作为因变量, 融资完成比率指的是融资总金额与目标金额之比, ZHENG H等人于2014年的研究指出该指标是有效的度量方式[14].融资完成比率指的是融资总金额与目标金额之比, 京东众筹采用“all or nothing”的原则, 如果融资完成金额高于项目发起者预先设定的目标融资金额, 则将所得资金转给项目发起者, 否则将筹得的资金退还给投资者.

在自变量方面, 本文选取目标金额、关注数、项目进展、话题数、支持项目数、发起项目数、关注项目数、档位数来解释因变量. 本文变量简介、类型、定义与文献来源如表1所示.

表1 变量描述

2.2 数据收集及初步数据分析

本文数据来源为京东众筹. 京东众筹作为京东金融第五大业务板块于2014年7月1日正式诞生, 京东作为国内最大的自营式电商企业, 其强大的供应链能力、资源整合能力, 能为筹资人提供从资金、生产、销售到营销、法律、审计等各种资源, 扶持项目快速成长.

截止2016年5月, 在奖励类众筹平台(回报式众筹,众筹成功之后能够获得实物回报)中, 京东众筹成功筹资金额24344万元, 位居众筹金额榜首.

截止2016年8月, 京东众筹平台上共存在2318个众筹项目. 由于本文关注的是自变量对融资完成比率的影响, 故项目是否到截止时间对此并不加以区分. 对这2318个样本数据, 首先进行对数处理, 防止变量变化过大, 影响模型拟合效果. 其次根据3-sigma定理剔除异常值, 最后选定的样本数据有2299条, 即有2299个项目数据被选入训练数据集.

表2为本文所选取自变量的描述性统计(本文所有变量均进行了对数处理故在命名变量时不加入log前缀, 特此说明, 且在下文分析所提及的变量名也指进行对数变换之后的变量).

由表2可知, 我们所选取的自变量除项目发起人支持项目数之外, 标准差与均值相比都比较小, 可以看出在取对数操作之后数据整体趋于稳定, 为决策树模型的建立奠定了良好的基础, 且除了项目发起人支持项目数和项目发起人关注项目数这两个自变量之外, 其余自变量的中位数与均值相差并不是很大, 这可以假设其余自变量的分布为正态分布, 而项目发起人支持项目数和项目发起人关注项目数这两个自变量则应该属于偏态分布, 且在第三章节中我们也可以看到这两个自变量的特征重要性与其他自变量相比较低.

表2 变量描述性统计

表3为本文选取自变量的相关性矩阵. 从分析结果可以看出, 各变量之间的相关系数均小于0.3, 表明变量间呈极弱相关或无相关. 选择弱相关自变量也是建立良好树模型的基础之一.

2.3 模型选择及介绍

在机器学习众多分类决策算法中, 决策树是一种简单但是广泛应用的分类器. 通过训练数据构建的决策树, 可以高效的对未知的数据进行分类. 决策树有两大优点:

1) 模型可读性好, 具有描述性, 有助于人工分析.

2) 效率高, 决策树只需要一次构建、反复使用, 每一次的最大计算次数不超过树的深度.

图1为一个简单的决策树分类模型示意图, 决策树回归模型与分类模型类似.

表3 变量相关性分析

图1 简单决策树回归模型示意图

其中Rule是针对样本自变量来进行筛选, 直到样本走到叶子节点, 样本所落在的叶子节点的Value值即为模型预测该样本的因变量的值.

本文章研究目标为给投资者提供选择优质众筹项目的意见和建议, 故选择决策树模型十分恰当. 首先,众筹项目属于投资项目, 一个透明且具有可解释性的模型更易受到投资者的青睐. 在模型训练完成之后投资者更可以利用自身实际经验与模型结果相互验证,从一定程度上可以判断模型是否符合市场实际规律.其次在预测过程中, 决策树具有较低的时间复杂度, 一个有效的决策树模型可以经受长时间的实践检验, 持续为投资者提供合理的建议.

本文目标问题是回归问题, 故在此采用了CART回归树算法, 具体算法如下:

STEP1. 训练回归树模型.

输入: 训练数据集D(京东众筹项目数据集);

输出: 回归树f(x);

在训练数据集所在的输入空间中, 递归地将每个区域划分为两个子区域并决定每个子区域上的输出值,构建二叉决策树:

(1) 选择最优切分变量j与切分点s, 求解:

(2) 用选定的对(j, s)划分区域并决定相应的输出值:

(3) 继续对两个子区域调用步骤(1), (2), 直至满足停止条件.

(4) 将输入空间划分为M个区域, 生成决策树:

STEP2. 投资者建立众筹项目池, 对池中众筹项目进行预测, 选择其中优质的众筹项目.

3 实证结果与分析

模型对全量数据进行了决策树回归树模型的建立,得到模型R2为0.746, 并且根据所建立的模型计算了特征重要性, 见图1. 本文选择决策树的超参数为max_depth为7, min_samples_leaf为9, 选择的树的分割方式为根据mse进行分割, 其中max_depth代表着决策树的最大深度为7, min_samples_leaf代表着叶子节点最少样本数, 为算法的停止条件.

图2 模型特征重要性

由图2可知目标金额的特征重要性最大(TA), 关注(Follower)和话题数(Topic)次之, 接下来的则为项目进展(Progress)和档位(Gear). 其余的变量在模型中相比之前提及的自变量则显得并不是很重要, 但是仍存在着一定的重要性. 表4为选取自变量的特征重要性的数值表示.

表4 特征重要性

由于篇幅所限, 在此仅列出模型预测结果较高的一些项目所具备的条件(Rule), 这些节点一共包含了535个项目, 约占总项目数23%(阈值为12.5, 即叶子节点取值大于12.5).

模型表示(见表5), 在融资完成比较高的项目中, 影响较大的因素有目标金额、关注、项目进展和话题.王琰和朱小栋的研究指出中国众筹平台项目成功的因素仅有评论数、支持者数量以及目标金额[19]. 本文成功的发现了其他影响因素, 并给出了具体的划分标准.

在目标金额小于11.3374时, 整体的融资完成比例较低, 有且仅有一个叶子节点超过我们设定的阈值. 观察该节点可以看出在目标金额较低的情况下, 获取较高的融资完成比需要项目发起人的发起项目数达到一定水平. 这表明, 项目发起人的创业能力对在发起目标金额较低的众筹项目时有着明确的区分度, 作为投资者来说, 在关心的众筹项目目标金额较低的情况下, 需观察其关注人数, 话题是否超出相同水平目标金额的众筹项目, 并且需要对项目发起人进行一定程度的调研, 确保其有着丰富的创业或众筹项目经验, 该点与Haines等人的研究保持一致, 即有丰富创业或者众筹项目经验的项目发起人更有可能发起一个优质项目[18].

表5 Model

表6 Model

在目标金额大于11.3374时我们可以看到模型叶子节点预测值大于15的仅有两个, 且这两个叶子节点需要满足的共同的条件有目标融资金额(TA)需大于13.8105, 关注人数(Follower)需大于7.2551, 项目进展数(Progress)需大于1.9356, 话题数(Topic)需大于5.0561.这表明优质的众筹项目包含以下条件: 首先, 目标融资额不能过小, 需要符合一定的资金阈值, 该点发现符合黄健青, 刘雪霏和郑建明的研究[20]. 项目所需的资金从一定程度代表了这个项目的质量水平但并不绝对, 故模型仍对项目进展、关注、话题有一定的要求. 其次,项目进展的数值越大代表着项目动态更新越频繁, 该指标的大小代表了项目发起者更新项目进展的频繁程度. 项目发起者主动地更新项目的动态是一个积极的信号[9]. 最后, 关注度和话题数则代表了投资者群体对该项目的感兴趣程度, 同时也从一定程度反应了项目社区的活跃程度, 往往一个活跃的项目社区可以孵化出一个成功的项目[6].

同时本文也发现有四个叶子节点对项目发起人关注项目数也有一定的要求, 并且发现在其他条件相同的情况下, 项目发起人关注项目数较多的叶子节点取值相对较大. 项目发起人关注项目数从一定程度表明了项目发起人对其他领域的众筹项目的了解程度, 这有助于项目发起人集众家之长, 更易开发出被投资者认同的优质项目, 这也印证了Kim K和Viswanathan S关于奖励型众筹的理论研究, 故此点也需投资者注意[21].

本文模型在某些叶子节点上对档位进行了更细致的划分, 合理分级投资额度有利于资金筹集, 更容易达到甚至超额完成目标融资金额. 对于投资者来说, 在选择优质众筹项目时, 应当将档位因素加入考虑范畴. 档位因素在以往的奖励型众筹研究中并未引起重视, 但该因素的发现表明我国众筹项目正在追赶国外众筹市场, 日趋成熟.

基于投资者的视角, 在选择优质众筹项目时, 本文建议投资者首先根据自己的投资意愿建立自己的众筹项目池(即先选择感兴趣众筹项目入池), 再利用模型进一步从项目池中选出符合条件的优质众筹项目.

4 结语

本文利用决策树模型对京东众筹平台上2299个奖励型众筹项目进行了全量数据的模型建立, 试图站在投资者的角度为投资者选择项目提供合理建议, 帮助其选择优质的众筹项目, 节省其时间成本、资金成本.

本文不足之处在于数据特征维度较少, 实证结果只能解释众筹项目融资完成比例的一部分信息, 仍然存在着大片蓝海等待发觉, 在未来希望能够利用更好更具有可解释性的模型以及能够找到更多维度的众筹数据进行数据挖掘, 从而找到更加有价值的信息, 为投资者提供更好、更具有操作性的建议.

1方琳瑜. 科技型中小企业自主知识产权成长机制与脆弱性评价研究[博士学位论文]. 合肥: 中国科学技术大学, 2010.

2黄健青, 辛乔利. “众筹”——新型网络融资模式的概念、特点及启示. 国际金融, 2013, (9): 64–69.

3Barabas R. Crowdfunding: Trends and developments impacting entertainment entrepreneurs. NYSBA Entertainment, Arts and Sports Law Journal, 2012, 23(2): 38–40.

4Ahlers GKC, Cumming D, Günther C, et al. Signaling in equity crowdfunding. Entrepreneurship Theory and Practice,2015, 39(4): 955–980. [doi: 10.1111/etap.2015.39.issue-4]

5Schwienbacher A, Larralde B. Crowdfunding of small entrepreneurial ventures. Handbook of Entrepreneurial Finance. Oxford: Oxford University Press, 2010.

6Ordanini A, Miceli L, Pizzetti M, et al. Crowd-funding:Transforming customers into investors through innovative service platforms. Journal of Service Management, 2011,22(4): 443–470. [doi: 10.1108/09564231111155079]

7Belleflamme P, Lambert T, Schwienbacher A.Crowdfunding: Tapping the right crowd. Journal of Business Venturing, 2014, 29(5): 585–609. [doi: 10.1016/j.jbusvent.2013.07.003]

8Mollick E. The dynamics of crowdfunding: An exploratory study. Journal of Business Venturing, 2014, 29(1): 1–16.[doi: 10.1016/j.jbusvent.2013.06.005]

9郑海超, 黄宇梦, 王涛, 等. 创新项目股权众筹融资绩效的影响因素研究. 中国软科学, 2015, (1): 130–138.

10陈亮. 基于众筹视角的互联网金融创新模式实证研究. 特区经济, 2015, (3): 55–56.

11陈玉婕, 倪宁曦, 苟小菊. 创新创业环境下众筹项目成功与否的影响因素研究. 上海经济研究, 2015, (11): 12–19.

12吴文清, 付明霞, 赵黎明. 我国众筹成功影响因素及羊群现象研究. 软科学, 2016, 30(2): 5–8.

13Agrawal A, Catalini C, Goldfarb A. The geography of crowdfunding. NET Institute Working Paper No. 10-08,2010.

14Zheng HC, Li DH, Wu J, et al. The role of multidimensional social capital in crowdfunding: A comparative study in China and US. Information & Management, 2014, 51(4): 488–496.

15Kuppuswamy V, Bayus BL. Crowdfunding creative ideas:The dynamics of project backers in Kickstarter. UNC Kenan-Flagler Research Paper No. 2013-15, 2013.

16黄健青, 陈欢, 李大夜. 基于顾客价值视角的众筹项目成功影响因素研究. 中国软科学, 2015, (6): 116–127.

17Balboni B, Kocollari U, Pais I. How can social enterprises develop successful crowdfunding campaigns? An empirical analysis on Italian context. 2014.

18Haines GH Jr, Madill JJ, Riding AL. Informal investment in Canada: Financing small business growth. Journal of Small Business & Entrepreneurship, 2003, 16(3-4): 13–40.

19王琰, 朱小栋. 奖励型众筹项目成功的影响因素研究——以“众筹网”为例. 管理现代化, 2016, 36(5): 23–25.

20黄健青, 刘雪霏, 郑建明. 众筹项目成功的关键因素——基于KIA与AON融资模式的实证研究. 财贸经济, 2015, 36(9):74–84.

21Kim K, Viswanathan S. The ‘Experts’ in the crowd: The role of ‘Expert’ investors in a crowdfunding market. TPRC 41:The 41st Research Conference on Communication, Information and Internet Policy. 2013.

Research on the Problem of Reward-Based Crowd-Funding with Perspective of the Investors

NI Ning-Xi, CHEN Yu-Jie, JIN Bai-Suo
(Department of Finance and Statistics, University of Science and Technology of China, Hefei 230026, China)

With the rapid development of the crowd-funding, the rapid increase in the number of such projects costs investors a lot of time and effort. This paper aims to help investors select high-quality crowd-funding projects with the least time. Under the assumption that there is a positive correlation between the quality of public projects and the completion ratio of financing(Ratio), the model in this paper is modeled using the CART regression tree algorithm based on the JD Crowd-funding data with R2reaching 0.746. The results show that investors should focus on the Target Amount(TA), the Follower, the Progress and the Topic. The results of this paper are only applicable to reward-based crowdfunding projects. For other types of Crowd-funding, the independent variables should be re-selected for model building,but the decision tree model can still be applied.

reward-based crowd-funding; perspective of the investors; decision tree model; JD crowd-funding; analysis of success factors

倪宁曦,陈玉婕,金百锁.投资者视角下的奖励型众筹问题研究.计算机系统应用,2017,26(7):17–23. http://www.c-s-a.org.cn/1003-3254/5831.html

基金委面上基金项目(11571337)

2016-10-17; 收到修改稿时间: 2016-11-28

猜你喜欢

项目数决策树众筹
《哪吒》手办上线众筹,为其操刀的是手办界的“国产之光”
众筹
决策树和随机森林方法在管理决策中的应用
“中国PPP大数据” 之全国PPP综合信息平台项目管理库2017年报
“中国PPP大数据” 之全国PPP综合信息平台项目库季报
决策树学习的剪枝方法
决策树多元分类模型预测森林植被覆盖
中国式众筹升级记
决策树在施工项目管理中的应用
京津沪渝穗主要经济指标2008年1-12月