数字通证市场操纵行为对通证价格影响研究

2022-04-21史博文胡代平

上海管理科学 2022年2期

史博文胡代平

(上海交通大学安泰经济与管理学院，上海 200030)

2017年，比特币价格从年初的973美元，到年底的1.8万美元，暴涨14倍，成为全市场最令人瞩目的资产品种。与此同时，另一个和比特币同样基于区块链技术的应用也逐渐走入人们的视野——数字通证(crypto token)。

区块链最早作为比特币的底层技术由Nakamoto在2008年提出，它本质上是一个去中心化的数据库，通过分布式数据存储、点对点传输、共识机制、加密算法等计算机技术，在存在各种差错、恶意攻击以及可能不同步的对等式网络中(peer-to-peer network)，并且在没有中央协调的情况下，确保分布式账本在不同网络节点上的数据是一致的。

随着2014年美国R3公司的创立和2015年Linux基金会发起Hyperledger项目，区块链受到了越来越多主流机构的重视。高盛(2016)讨论了区块链在共享经济、智能电网、房地产保险、股票市场、回购市场、杠杆贷款交易以及反洗钱(anti-money laundering，简称 AML)和“了解你的客户”(know your customer，简称KYC)中的应用。中国区块链技术和产业发展论坛 2016 年 10 月发布的《中国区块链技术和应用发展白皮书(2016)》讨论了区块链在金融服务、供应链管理、文化娱乐、智能制造、社会公益和教育就业等领域的应用场景。2018年开始，中国人民银行、摩根大通、Facebook、阿里、腾讯都推出了自己的区块链项目，并且很多知名资产管理公司将数字通证纳入了投资范围。

但是在缺少监管的情况下，价格操纵是数字通证经常被诟病的现象，也是影响市场效率和参与者积极性的一个很重要的因素。本文研究了数字通证中一种叫拉升与抛售的操纵行为对于数字通证价格的影响。

1 相关文献概述

1.1 数字通证的价值

徐忠等(2018)提出了通证的范式，即：(1) 通证是区块链内定义的状态变量，具有若干类似货币的特征；(2) 智能合约是运行在区块链内、主要对通证进行复杂操作的计算机代码，可以实现通证的定义、发行、销毁、转让、抵押、冻结和解冻等功能，但无法确保区块链内债务的履约，也很难处理不完全契约；(3) 共识算法的功能是确保通证状态和涉及通证交易的信息真实准确。

Catalini和Gans(2016)分析了区块链、通证对市场形成中的两个重要因素——验证成本和网络成本的影响。他们认为，区块链允许市场参与者以较低成本验证与交易有关信息，会促进新的市场形态出现；通证可以在无需传统受信任中介的情况下降低网络成本并启动市场。

Cong et al.(2018)用动态资产定价模型分析了通证价格及其对用户采用(user adoption)的影响。通证交易为平台用户提供了跨期互补性(intertemporal complementarity)，从而在通证价格和用户采用之间形成了一个反馈环。通证价格反映了平台未来增长，均衡时通证价格将随平台生产力、用户异质性和网络规模的提升而呈现非线性增长。

1.2 数字通证与股票的拉升和抛售行为

Kamps J、Kleinberg B(2018)从文献中总结了拉升与抛售这种行为的历史，并通过异常检测的方法通过价格和成交量的异常识别拉升与抛售事件。这篇文章发现拉升与抛售事件容易聚集在一些交易所和数字通证上，小市值的数字通证更容易被拉升与抛售。

Hamrick J T、Rouhi F、Mukherjee A, et al(2018)在2018年6个月的时间里，发现了在Telegram平台上的3767次以及在Discord平台上的1051次不重合的拉升与抛售信号，涉及300多个数字通证，他们发现市值和成交量是决定拉升与抛售行为盈利性的最重要因素，低成交量的数字通证的拉升与抛售往往能产生更高的收益。

Li T、Shin D、Wang B(2019)使用逐笔数据研究了可以精确确定开始时间的拉升与抛售事件，他们发现拉升与抛售事件可以在短时间内让数字通证价格、成交量和波动率大幅增加。几分钟内，被拉升的通证的价格达到最高值，随后反转。他们还发现，在拉升开始之前，通证的价格就会开始增加，这表明提前知道拉升时间的人提前买入通证。他们还通过研究交易所禁止拉升与抛售事件，为拉升与抛售对于数字通证的流动性和价格有害提供了证据。此外，他们还从行为金融学的角度解释了外部参与者参与拉升与抛售事件的动机。

Xu J、Livshits B(2019)研究了2018年7月21日到2018年11月18日期间在Telegram上组织的220次拉升与抛售事件，然后建立了一个预测模型，预测在拉升之前哪个数字通证将被拉升。根据他们的模型，数字通证的市值和拉升前1小时的收益率是最重要的两个特征，此外拉升前1小时和72小时的成交量也在预测中起到了重要影响。

Mirtaheri M、Abu-El-Haija S、Morstatter F, et al(2019)提出一种可以同时使用Twitter和Telegram社交媒体信息自动识别拉升与抛售行为的方法，并且还开发了一种预测拉升与抛售事件是否成功的算法。此外，他们还将其研究数据集开源，这个数据集将在本文的鲁棒性分析中使用。

1.3 事件研究方法

文献中记录的最早的事件研究是Dolley(1933)(Campbell (1997)中提及)进行的研究，这项研究通过研究股票分拆时的价格变化来考察股票分拆事件对于股票价格的影响。这项研究使用从1921年到1931年的95个股票分拆事件作为样本，Dolley发现其中57个样本股价上升，26个股价样本价格下降。现在的事件研究基本范式主要形成于Ball、Brown(1968)和Fama、Fisher、Jensen、Roll(1969)的两篇论文。在这些开创性的研究之后，有大量的研究讨论了事件研究方法中存在的一些问题并改进了事件研究的方法。例如：收益和异常收益数据分布不是正态的，最小二乘法估计市场模型参数可能导致偏差，非同步交易问题，以及方差估计中的问题等。Brown和Warner (1980, 1985)对这些问题进行了系统的研究，这两篇文章中运用的事件研究方法的效度评价方法也被后续的实践研究所广泛采用。

在事件研究中，由事件引起的方差增加会导致传统的统计量失真，增加犯第一类错误的概率。Brown和Warner认为可以通过对波动建模解决这个问题。其他的一些研究，比如Aktas et al.(2007), Harrington和Shrider(2007)和Higgins和Peterson (1998)也指出，所有的事件都会导致横截面方差增加，这些方差在研究事件日异常收益的显著性时必须被估计，并且在统计量中进行方差调整。Boehmer、Musumeci和Poulsen(BMP)(1991)认为，事件期间的异常收益需要通过除以估计区间的标准差加以标准化，标准化之后的异常收益的横截面均值需要除以横截面标准差加以标准化从而产生统计量。BMP方法的隐含假设是样本中所有证券因为事件所引起的标准差是相同的。Corrado (1989)使用非参数秩检验处理事件引起的方差增加问题，仿真结果表明秩检验比传统的检验具有更高的效力。

事件研究中的另外一个问题是横截面相关性问题。Kolari和Pynnönen (2010)对Patell(1976)，Boehmer、Musumeci和Poulsen (1991)的统计量进行了改进，以消除横截面相关带来的影响。他们的研究表明，当没有事件引起的波动增加时，这两个修正过的统计量的检验效力是近似相等的，并且当没有异常收益的原假设为真时，可以以正确的概率拒绝原假设。

除了检验事件日的异常收益，多日的累计异常收益(CAR)的有效性检验也经常出现在事件研究的论文中。但是随着检验区间长度的增加，区间的波动增加，需要整个事件区间有更大的累计异常收益才能被检测出来。Cowan (1992)和 Campbell、Wasley (1993)通过简单的累加CAR区间内的每日异常收益的秩来检验累计异常收益，但是随着事件窗口的增加，这种方法快速失去效力。

为了克服上述难题，Kolari、Pynnönen (2011)提出了一种基于广义标准化异常回报的广义秩检验，该方法既可以检验单日的异常收益，又可以检验累计异常收益。同时，这种方法对于异常收益的序列相关事件引起的方差增和事件日聚集引起的截面相关等问题也是稳健的。

2 事件研究方法框架与步骤

Campbell、Lo和MacKinlay (1997)提供了一个典型的事件研究框架，本文将按照这个框架进行研究，具体步骤如下：

2.1 定义事件和事件窗口

进行事件研究的第一步是定义要研究的事件(比如公司的季度盈利公告)，并且定义需要检查的金融工具价格区间。这个区间被称为事件窗口(或者叫事件区间)。一般来说，事件窗口的选择可以是任意的，事件对价格的影响可能发生在事件之前，事件发生当日或者事件之后一段时间，研究者需要自己判断。

2.2 选择研究样本并做描述分析

确定要研究的事件后，下一步是确定纳入研究的公司的选择标准，建议只选择那些在大型交易所频繁交易的公司。此外，要排除事件窗口内有多个事件的公司。在这一步，最好对入选公司进行描述性统计(比如公司市值、行业等)，并指出样本选择中可能存在的偏差。

2.3 定义预期回报和异常收益

为了评估事件的影响，需要对异常收益进行衡量。正常的收益(预期回报)是在事件没有发生时所期望的回报。对于公司i，在t时刻的异常回报按照如下方式定义：

ARit=Rit-E(Rit)

ARit、Rit、E(Rit)分别是异常收益、实际收益和预期收益。常见的预期收益模型有平均收益模型、市场模型、资本资产定价模型(CAPM)、Fama-French 3因子模型、Carhart 4因子模型、参考投资组合模型和配对公司模型。

2.4 估计预期回报模型参数

选定正常收益模型后，一般选择事件前一段时间对模型的参数进行估计。一般来说，事件窗口不应该被包含在估计区间内，以防止事件影响预期收益模型参数的估计。对于使用每日采样间隔的数据，使用市场模型作为预期收益模型，估计区间可以选择事件窗口前的120日。

2.5 显著性检验

事件研究一般是先从单个股票单期的异常收益(ARit)开始，然后根据研究的需求，将ARit按照时间和横截面聚合成不同层次。比如，将ARit沿时间序列聚合，就形成了单个股票的累计异常收益CARi，将多个股票的CARi在横截面上取平均，就形成平均累计异常收益CAAR。也可以将ARit直接在横截面上聚合，变成平均异常收益AARt。ARit、CARi、AARt、CAAR数学定义如下：

ARi,t=Ri,t-E[Ri,t│Ωi,t]

事件研究需要对这些不同层次的异常收益进行假设检验。按照假设检验的一般原则，原假设(H0)是事件窗口内不存在异常收益，而备择假设(H1)认为在事件窗口内存在异常收益。正式定义如下：

H0:μ=0

H1:μ≠0

在事件研究领域， Kolari和Pynnönen(2011)提出的广义秩检验(GRANK)是到目前为止最有效和有鲁棒性的检验方法，并且可以适用于短事件窗口和长事件窗口，所以本文使用广义秩检验作为检验事件异常收益显著性的方法。本文同时还报告了T检验，广义符号检验(Cowan, A. R., 1992)和BMP检验(Boehmer, Musumeci, Poulsen, 1991)的结果作为参考。

2.6 实证结果

除了按照计量经济学设计的公式展示实证结果，对于结果的一些深入分析也会非常有成果。有时候，特别是在研究样本有限的研究中，实证结果会受到1～2家公司严重的影响，弄清楚这一点对于衡量结果的重要性有至关重要的影响。

2.7 解释和总结

理想的情况下，实证研究的结果会让研究者了解事件对于证券价格的影响。为了区分相互矛盾的解释，可能还需要进行额外的分析。

3 实证分析

3.1 样本选取

本文使用的数字通证拉升与抛售数据来自PumpOlymp，该网站收录了Telegram上393个公开的拉升与抛售群组和一些非公开的拉升与抛售群组。网站收录了从2018年6月起的550多起拉升与抛售事件。数字通证的价格数据来自CoinMarketCap。本文使用网络爬虫和数据API获取以上数据，经过数据去重、数据序列化、数据标准化、数据关联等步骤，生成研究用数据集。

在PumpOlymp获取的数字通证拉升与抛售事件时间范围是2018年6月17日到2019年8月10日，共有拉升与抛售事件510个，涉及数字通证213个。剔除无法关联，在CoinMarketCap中无法找到数据的通证后，剩余事件403个，涉及通证151个，时间范围不变。

为了保证预期收益模型估计的准确性和避免事件日期前缺失数据对于分析的影响，要求事件日之前30天数据不能缺失，事件前30～250天，至少要有120天数据。统计发现，大部分事件都满足这一要求，并且事件后至少有86天，大部分通证事件后都有120天有效数据。按照上述标准剔除后，剩余事件376个，涉及数字通证142个，日期范围为2018年6月18日至2019年8月10日，这个数据集作为PumpOlymp拉升与抛售事件分析的基础数据集。

事件日期分布和对应市场指数关系如图 1所示。

图1 事件日期分布和对应市场指数

3.2 拉升与抛售事件短期特征统计

PumpOlymp数据中报告了每次拉升与抛售事件的持续时间、事件前通证价格、拉升后最高价、按照他们预测的信号交易的理论利润，这些指标的统计信息如表 1所示。

从统计中可以发现，平均来看，数字通证中的拉升与抛售事件会在非常短的时间(一般不超过1分钟)内对通证价格有一个相对大幅的拉升。虽然并不是每次拉升与抛售事件都会成功，偶尔还伴随着比较大的亏损，但是75%的抛售与拉升事件是盈利的。

笔者认为，数字通证的拉升与抛售行为，可能会让投资者认为，这个数字通证并不像它的白皮书所说的那样，要去搭建某个系统、提供某项服务，而更多的是通过投机炒作收割投资者，从而在中长期损害这个项目的价值。下面本文将通过实证研究来验证这一猜测。

表1 拉升与抛售事件短期特征统计

3.3 拉升与抛售行为对于通证价格的影响

因为本文要研究的是拉升与抛售事件对于数字通证收益的影响，所以有必要将事件的收益从市场预期的收益中分离出来，仅研究事件日期附近的异常收益。

股票市场上常用的预期收益模型有CAPM模型、Fama-French 3因子模型、Cohart 4因子模型、Fama-French 5因子模型。但是由于数字通证市场的特征与股票市场特征不完全一致，在股票市场上常用的3因子、4因子、5因子模型在数字通证市场不完全适用，所以本文选择比较简单的市场模型作为预期收益模型。Brown(1985)的研究也表明，市场模型相对其他更复杂的模型，大部分情况下表现相差不大。所以，预期收益模型按照如下方式定义：

lneRjt=αj+βjlnRmt+ujt

Pjt=数字通证j在t日的收盘价；Rjt=Pjt/Pj,t-1数字通证j在第t期的相对价格

Rmt=全市场数字通证在第t期的加权平均相对价格

αj和βj是每个数字通证j预期收益模型的参数，分别表示数字通证j超越市场的收益和相对市场收益的敏感度；ujt是残差项(在事件研究中一般叫做异常收益)，表示数字通证j收益中不能被市场收益解释的部分。

本文使用事件前250日到事件前30日作为估计区间，估计预期收益模型的参数，模型参数统计信息见表2。

表2 使用事件前250日到事件前30日

接下来将数字通证的事件日对齐，然后对残差等权重求平均数，获得事件聚合后的异常收益(AAR)，然后将AAR从观察第一天开始累加，得到累计事件聚合后异常收益(CAAR)。图 2展示了从事件前250日到事件后120日的AAR和CAAR。

图2 PumpOlymp数据集AAR、CAAR

从图2中可以发现，在事件日，事件集的AAR具有非常明显的正向异常收益，同时在事件发生后的120日内，事件集的AAR负值居多。从CAAR曲线上看，拉升与抛售事件发生后，事件集的CAAR出现了明显的下降。不过在事件前30日，事件集的CAAR也是向下的，所以本文对事件前后的AAR和CAAR进行显著性检验。

在对学生的采访过程中，发现大多数学生英语学习的目的在于获得证书或满足未来就业的条件，有的甚至不清楚自身学习英语的动机，只是“随大流”，出于长期以来形成的学习本能进行自主学习，这种情况导致了英语自主学习更多地是为了应试而非应用。其中最直接的体现便是对于网络环境的应用不足，不注重自身的英语口能能力以及沟通交流能力的增强，英语的实用性被大大削弱，所应该起到的宣传湖南文化以及彰显湖南人才素养的作用难以在国际友人中展现。

表 3报告了事件前后一段时间的累计聚合异常收益(CAAR)的显著性检验结果。本文选取了事件前29日、事件前5日、事件后5日、事件后10日、事件后30日、事件后50日作为CAAR的检验区间，检验结果表明两个事件前检验区间的累计聚合异常收益均不显著，而事件后4个检验区间的累计聚合异常收益都显著为负。

表3 事件CAAR的显著性检验

3.4 结论鲁棒性分析

本文从研究数据的代表性、统计检验方法和CAAR的检测区间讨论研究结论的鲁棒性。

首先是研究数据的代表性问题。由于PumpOlymp收集的数字通证的拉升与抛售事件可能不全或者有选择偏差，不能代表全体数字通证的拉升与抛售事件，所以本文使用Mirtaheri M, Abu-El-Haija S、Morstatter F, et al(2019)提供的数据集重新检验本文的研究结论。Mirtaheri M、Abu-El-Haija S、Morstatter F, et al(2019)使用机器学习算法在2017年5月18日到2018年7月23日的区间内识别出22336个拉升与抛售行为，在这个数据集上的研究与在PumpOlymp数据集上的研究结论一致，说明本文的结论具有通用性。

其次，本文使用GRANK-T统计量作为显著性的判断依据，该方法可以处理非正态数据，对收益率序列的时间序列相关、横截面相关以及事件引发的方差变化具有鲁棒性。同时，在大部分显著的CAAR中，本文同时报告的T检验、BMP检验、广义符号检验也都是显著的，所以本文得出的显著性判断是稳健的。

最后，在检验CAAR显著性时，本文选择了多个CAAR区间，避免某个区间选取带来的偶然性。

因此，本文得出的结论是稳健的，具有鲁棒性。

4 套利策略和监管建议

4.1 套利策略

本文发现的数字代币拉升与抛售后产生的长时间负向异常收益的一个实际应用是套利策略。当前，大多数数字代币平台都允许融券卖空，由于拉升与抛售事件后，数字通证会产生严重的负向异常收益，所以本文将前50日内发生拉升与抛售的数字通证构建一个等权重的投资组合，进行做空。同时，为了对冲市场收益波动带来的投资组合波动，本文选择比特币构建与空头组合市值相等的多头投资组合进行对冲。选择比特币作为多头对冲品种，有两个原因：

(1) 比特币是市值最大的数字通证，其市值在整个数字通证领域占比很高，从历史数据看，其收益序列也与数字通证加权指数的收益序列高度相关。

(2)由于比特币受到数字通证参与者的广泛认可，交易活跃，所以交易成本低，没有通证清盘的风险。

图3是事件组合、比特币(BTC)和对冲组合在2018年6月19日到2019年9月29日的收益曲线，表4统计了套利策略的收益和风险指标。在这段时间内，对冲套利策略年化收益122%，夏普比率1.24。收益率大于单独做多比特币和单独做空事件投资组合的收益率。夏普比率与单独做空事件组合相差不大，但是回撤明显降低。

不过需要特别指出的是，本文的研究没有考虑交易成本、融券的利率。之前在股票市场上的研究指出，对于小市值股票，融资成本一般较高，本文只是指出套利行为的理论可行性，套利策略的实际收益应该小于理论值。此外，在事件发生后，事件数字通证的套利机会长期存在，也说明了数字通证市场的定价在研究期间还是无效的，这可能是由于数字通证市场还处于早期阶段，散户多、专业投资者较少、数字通证定价理论尚不完善导致的。

图3 BTC对冲事件组合后收益

表4 套利策略收益和风险指标

4.2 监管建议

由于数字通证拉升与抛售行为对于数字通证有较大的危害，并且会给投资人造成潜在的损失，所以在此向监管部门建议：

(1) 应当将数字通证的拉升与抛售行为认定为非法，同时使用信息技术自动监测可能的拉升与抛售行为。从文献综述中我们发现，已经有研究可以以较高的准确率通过社交媒体数据预测拉升与抛售行为，并通过价格变化加以印证，结合其他大数据技术，可以及时准确地发现拉升与抛售行为及其组织者。

(2) 建立数字通证拉升与抛售的预警名单，提醒投资者远离发生过拉升与抛售的数字通证。本文的研究表明，发生拉升与抛售行为之后的数字通证在几个月的时间内产生了负向异常收益，持有这些通证的投资者将有可能蒙受损失。所以，为了保护投资者，监管机构可以定期公开有拉升与抛售行为的数字通证名单。

(3) 允许数字通证做空，降低做空成本，让市场自动将那些发生拉升与抛售行为的数字通证出清。监管机构应当鼓励交易所为投资者提供做空工具，并且规范卖空工具以降低交易成本，从而达到加速市场出清的作用。

5 结论和讨论

本文通过对数字通证拉升与抛售数字行为的实证分析，发现虽然数字通证拉升与抛售这种市场操纵行为持续时间往往在几分钟以内，但是它使得数字通证产生长达几个月负向异常收益。基于这个发现，本文开发了一个有效的套利策略，通过做多比特币，做空拉升与抛售通证的投资组合，在不考虑交易成本和融券成本的情况下，获得了年化123%的收益率，夏普比率1.24。同时本文还向监管机构提出建议，以减少拉升与抛售这种市场操纵行为带来的危害。

由于受相关条件限制，本文对数字通证拉升与抛售行为的研究还存在一些不足，需要做进一步的研究：

(1) 数字通证拉升与抛售行为导致通证产生长达几个月负向异常收益的原因需要进一步探究。本文只是通过事件研究方法发现了这一现象，但是这一现象背后的原因尚不清楚，需要进一步研究。

(2) 数字通证拉升与抛售行为对于数字通证的开发者、使用者的影响可以进一步研究。数字通证经济的核心在于激励开发者和使用者，拉升与抛售行为对于开发者和使用者的影响需要进一步研究。

(3) 哪些数字通证容易被拉升与抛售，这些通证的开发运营人员和拉升与抛售活动的组织者是否有关联也值得进一步探究。