分析师对创新相关信息的关注能提高预测准确性吗?
2023-05-22刘璐洪剑峭
刘璐 洪剑峭
(1.上海师范大学商学院,上海 200234;2.复旦大学管理学院,上海 200433)
一、引言
分析师作为资本市场重要的信息中介,扮演着信息使用者和信息提供者的角色,通过不断地对公司相关信息进行收集、加工、处理,做出盈利预测和投资建议,并将相关信息以研究报告的形式提供给投资者,成为投资者主要的外部信息来源之一(马黎珺等,2022)[35]。特别是其中的盈利预测作为分析师综合分析评价得出的核心结论,得到投资者的高度关注,是投资者进行投资决策的重要依据。因此,分析师盈利预测质量的高低关系着研究报告价值的大小,影响着分析师信息中介作用的有效程度。如何提高分析师的盈利预测质量,促使分析师充分发挥其在信息传递、提高资本市场运行效率中的重要作用,也是学者们一直关注和探讨的热点话题。
研究表明,分析师在预测过程中,主要利用公司的公开会计信息(胡奕明等,2003)[30],但对其他类型的信息如非财务信息的关注度也逐渐增加。Orens and Lybaert(2010)[20]指出,某些非财务信息如研发信息和前瞻性信息与公司未来的盈利能力和市场价值具有一定的相关性,分析师对这类非财务信息进行关注和利用有助于更好地预测公司未来的经营业绩和市场表现。Brown et al.(2015)[7]基于对分析师的调查,发现分析师将智力资本信息看作盈利预测最重要的输入变量之一。Beccalli et al.(2015)[4]、Martens and Sextroh(2021)[17]指出,分析师对作为公司财务信息重要补充的非财务信息较高的获取和利用程度有助于提高其专业能力,进而提升预测质量和影响力。这些研究在一定程度上证实了非财务信息的重要性,分析师对这类信息进行关注和利用有助于更好地把握公司发展前景和推断公司未来的盈利情况,从而做出更加准确的预测,提高研究报告的质量。
一方面,创新是企业进步的源泉,是推动企业源源不断地创造价值、保持市场竞争优势的不竭动力,关系着企业的生存与长远发展。这说明创新信息作为重要的非财务信息之一,具有一定的价值相关性,代表了企业的核心竞争力和未来发展潜力,对于预测企业未来经营业绩和财务状况起到了不容忽视的作用(韩鹏和岳园园,2016;程新生等,2020)[27][25]。由此看来,分析师在分析和预测过程中理应关注和利用公司的创新相关信息(Bellstam et al.,2021)[5],这些信息是分析师对公司相关情况进行分析并对未来业绩进行预测的重要依据。例如光大证券的分析师于2019年10月25日对恒瑞医药发布的研究报告《恒瑞医药(600276):创新驱动业绩逐季加速 吡咯替尼疗效进一步验证》中提到:“考虑到创新药品种放量超预期,我们上调公司收入预测,同时由于重磅产品正进入临床后期,研发投入将保持高增长,我们小幅上调19―21年EPS预测……”。可以看出,分析师在对公司的成长能力和发展前景的分析中关注并利用了公司的创新相关信息,在预测过程中考虑到了创新活动对公司未来业绩所产生的影响。
另一方面,创新活动具有较高的复杂性和不确定性(Wyatt,2005)[23],再加上公司财务报告对这类活动的信息承载能力不足(徐欣和唐清泉,2010)[37],存在较大的信息缺口,分析师获取和解读创新相关信息的难度较大(Nguyen and Kecskés,2020)[19],这对分析师的能力和努力程度提出了更高要求。分析师如果没有充分地收集和利用创新相关信息,往往无法全面理解创新活动对公司未来盈利情况的影响,容易造成较高的盈利预测误差,可能会误导投资者做出错误的投资决策,损害投资者利益,甚至可能会扰乱资本市场运行效率,影响实体经济的持续、高质量发展。相关研究表明,对于创新活动水平较高的公司,分析师盈利预测的难度较大,准确性相对较低(Amir et al.,2003;Gu and Wang,2005)[2][12]。Amir et al.(2003)[2]研究指出,对于研发活动强度较大的公司,分析师能够在一定程度上弥补公司财务报告的缺陷,但弥补作用有限,特别是当分析师忽视研发活动的重要性、没有完全理解这一活动的价值时,盈利预测的准确性往往较低。这会对分析师预测结果的质量和研究报告的价值造成负面影响,从而极大地削弱分析师在信息传递、改善信息环境、提高资本市场运行效率、促进资源合理配置中所发挥的积极作用。
那么,如果分析师凭借自身的专业能力和信息渠道优势,对创新相关信息进行深入的挖掘和解读以及充分的分析和利用,是否能够改善盈利预测质量,提高预测的准确性?为了回答这一问题,本文利用2012―2020年分析师对我国A股上市公司发布的研究报告,通过对研究报告进行文本分析,发现分析师研究报告中创新相关信息的含量与盈利预测质量之间正相关。特别是当公司的创新活动强度较高、盈余质量较差、信息不对称较为严重时,分析师的创新信息关注和利用对于提高预测准确性、改善预测质量所起到的作用更大。这说明分析师对创新相关信息的关注是通过更为有效地获取和解读盈利预测相关的重要信息,从而带来预测质量的提升。
本文的研究贡献主要体现在以下方面:第一,丰富了关于分析师盈利预测的文献。以往的研究主要从分析师个人特征、预测特征以及公司特征等方面考察分析师盈利预测质量的影响因素(Clement,1999;廖明情,2012)[9][34],本文着眼于分析师的信息使用过程,深入到研究报告信息层面,发现分析师对信息的关注和利用程度与预测质量密切相关,有助于更为深入全面地认识分析师的研究过程,打开分析师信息使用和预测的“黑箱”,深刻理解信息的收集和使用对分析师研究结果的重要影响,为分析师信息中介作用的发挥及其有效性提供了一定的证据。第二,拓展了关于公司创新活动与分析师盈利预测关系的研究。现有文献大多数将分析师作为一个整体,发现公司的创新活动对分析师的盈利预测准确性会产生负面影响,忽视了分析师对创新相关信息的关注和利用程度存在差异,这种差异影响了分析师的预测质量。本文从分析师报告的视角出发,基于研报中所体现的信息差异,证实了分析师对创新相关信息进行充分的关注和利用有助于提高预测质量,回应了以往文献对分析师价值的质疑。第三,丰富了非财务信息价值的文献。相关研究指出,分析师在进行盈利预测时会考虑到非财务信息。然而,分析师对这些非财务信息较高的关注和利用程度的价值何在?文献对这一问题的回答并不充分,而且大多采用问卷调查或访谈的方法,实证结论较为匮乏。本文利用文本分析的方法,探究了分析师对创新这一非财务信息的关注程度,提供了非财务信息在改善分析师盈利预测质量方面价值的实证证据。本文响应了Palmon and Yezegel(2012)[21]提出的利用文本分析法,对比分析师研究报告内容的差异,判断分析师信息关注的不同方面和做出业绩预测的不同依据,以此来考察非财务信息价值的建议,并为如何提高分析师研究报告的质量、充分发挥分析师在资本市场中的重要作用提供了新的研究视角。第四,本文结论对于分析师的信息关注和利用、投资者的信息理解和判断、政策制定和监管部门的信息评价和规范具有一定的实践指导价值。在当前规范和引导资本健康发展、坚持高质量创新驱动高质量发展的时代背景下,本文也在一定程度上为如何提升我国证券研究行业水平、促进分析师信息中介作用有效发挥、提高资本市场运行效率、推动公司创新进而实现高质量发展提供了新思路。
二、文献回顾与研究假设
围绕着分析师盈利预测行为的影响因素,学者们展开了大量研究,相应的结论表明,分析师对信息的分析利用能力以及掌握信息的深度和广度会影响预测的质量。作为分析师的主要信息来源(Schipper,1991)[22],公开信息的数量和质量直接影响了分析师的预测水平。Hope(2003)[14]的研究表明,公司披露信息质量越高,分析师盈利预测越准确,预测分歧越小。李丹和贾宁(2009)[31]的研究也支持,公司的盈余信息质量与分析师预测误差和预测分歧负相关。同时,分析师盈利预测的质量也会受到预测任务的难度和复杂程度的影响(Brown et al.,1987)[8]。由于公司的创新活动具有较高的复杂性和不确定性(Wyatt,2005)[23],分析师对这类活动进行分析和解读的难度较大,信息收集和处理成本较高(Nguyen and Kecskés,2020)[19],再加上公司财务报告对这类活动的信息承载能力不足(徐欣和唐清泉,2010)[37],公司盈余信息含量较小,公开信息的质量较低,导致分析师盈利预测较为困难,预测质量会受到负面影响。Barron et al.(2002)[3]、Amir et al.(2003)[2]、Gu and Wang(2005)[12]都发现,分析师对于研发活动强度较大的公司预测难度较高,导致预测准确性较低。Dinh et al.(2015)[11]进一步提供实证证据证实,研发投入会计处理的复杂性造成了分析师较低的预测质量。Jia(2017)[15]、李哲等(2021)[33]的研究表明,突破式创新提高了分析师信息获取和解读的难度,一定程度上会增加预测误差和分歧。Hill et al.(2019)[13]的研究指出,分析师并没有理解公司研发活动对未来盈利状况的影响,导致其预测误差较大。
此时,公司提高研发和无形资产等创新相关信息的披露水平有助于降低分析师预测的难度和不确定性,从而做出更准确的盈利预测。J o n e s(2007)[16]、Merkley(2014)[18]的研究表明,公司对于研发信息的自愿披露能够降低分析师盈利预测误差。Beyhaghi et al.(2022)[6]的研究证实,专利相关信息的披露有助于提高分析师盈利预测的准确性。李岩琼和姚颐(2020)[32]的研究也支持,公司年报中研发相关文本信息的披露能够降低分析师预测误差和分歧。这些研究表明,创新信息作为分析师预测过程中的重要投入要素,会影响分析师预测水平,关系着分析师的预测结果和预测质量。然而,这类研究相对较为匮乏,并且主要关注的是公司相关信息的披露对分析师预测行为的影响。在跟踪公司自身的公开信息之外,分析师还会通过多种途径进行信息挖掘,以提高信息获取水平和分析能力。由此看来,分析师是否对创新相关信息给予了充分关注,并进行了有效的信息收集、利用和解读仍不得而知,对于分析师关注和利用创新相关信息所能产生的价值仍缺乏足够的说服力和证据支持。
创新活动会影响公司基本面情况,如销售收入、费用、收益、现金流等。如果分析师忽视了创新活动对未来盈余的影响,没有充分关注创新相关信息并纳入预测和分析中,将会影响其预测模型参数估计的精确性,进而影响最终盈利预测结果的准确度(Amir et al.,2003;Hill et al.,2019;李岩琼和姚颐,2020;何雨晴,2021)[2][13][32][28]。具体来说,创新活动具有较高的复杂程度、较大的不确定性和较强的风险,包括未来成功或者失败的可能性、预期收益的实现程度和取得时间、与之伴随的内部经营风险的大小等等。无论是创新活动取得成功带来的收益还是创新活动失败造成的损失,都可能会对企业的正常发展产生重要影响,未来的盈余状况也会因此改变。从投入角度看,创新活动具有一定的异质性,其投入也相应地具有独特性的特征,分析师难以估计后续的投入情况以及判断投入的合理性。并且,企业对于创新相关支出的会计处理具有一定的主观性和灵活性,哪些投入能够资本化,哪些投入要计入费用,也需要分析师结合创新活动的进展以及成功与否的可能性进行估计。这加剧了信息的复杂程度,造成信息处理难度增加,影响分析师对于相关成本费用的预测准确性。从产出角度看,创新产出具有一定的滞后性和不确定性,投入与产出并不完全匹配,增加了分析师的预测和评估难度,影响分析师对于相关收益的预测准确性。
由此看来,分析师需要充分关注和利用创新相关信息,才能准确把握创新活动对公司未来盈余状况的影响。这对分析师的信息挖掘和解读工作提出了更高要求,分析师需要具备较高的信息获取和分析能力,收集更多的信息,进行更为深入全面的分析。此时,分析师除了关注公司报表中的相关定量信息如研发投入水平之外,还需要充分解读公司披露的其他定性信息如研发周期和进展等。除此之外,分析师还需要考虑多种因素,通过多种途径进行信息挖掘,并从多种角度进行分析和解读。例如通过实地调研等方式获取私有信息,并结合行业信息、公司公告、问询函信息、新闻媒体信息等多渠道多方式,搜寻与公司创新活动密切相关的有用信息并进行验证;深入挖掘创新活动背后的详细信息,例如借助项目计划书、相关政策支持、支出核算方法和标准、人员配置、项目进展、发展前景和预期等非财务信息,形成更为审慎可靠的判断。通过对相关信息进行充分的搜集和深入的分析研判,分析师对公司创新活动相关情况能够形成更为客观全面的认识,从而提高其对创新活动风险的认知,更为准确地把握公司未来的经营业绩,对于相关的收入和成本费用形成更为合理的估计,最终保证预测结果的准确性。
研究报告作为分析师工作成果的主要呈现,其文本内容反映了分析师的预测依据和分析过程。如果分析师对创新相关信息给予了充分关注,进行了深入全面的信息搜集和解读并将其纳入预测和分析过程中,理应会通过研究报告文本中较高的创新信息含量体现出来。根据上述分析,本文可以通过检验分析师报告中创新相关信息含量与盈利预测准确性之间的关系,探究分析师对创新相关信息的关注是否能够起到提高预测质量的效果。由此本文提出如下假设:
H1:分析师研究报告中创新相关信息的含量与盈利预测准确性正相关。
对于创新活动强度较高的公司,一方面,创新相关的非财务信息价值更高,在预测公司未来业绩表现中的重要性和有用性更强(Barron et al.,2002)[3],分析师对这类信息的关注和利用对其预测准确性提高能够起到更大的作用;另一方面,高强度的创新活动往往会造成更严重的信息不对称,分析师对这类公司的分析和预测难度更大,特别是当分析师没有充分理解公司创新活动的价值及其对未来盈利情况的影响时,会产生较高的预测误差(Amir et al.,2003)[2]。在这种情况下,如果分析师对创新相关信息给予了充分关注,进行了有效的收集和利用,在预测过程中全面深入地分析了相关信息对未来盈利情况的影响,那么其预测准确性会显著提高,预测质量会得到更明显的改善。因此,本文进一步探究创新活动强度对结果的影响,验证对于创新活动强度较高的公司,分析师的创新信息关注在提高盈利预测准确性方面的作用是否更大。由此,本文提出如下假设:
H2:对于创新活动强度较大的公司,分析师研究报告中创新相关信息的含量与盈利预测准确性之间的正相关关系更强。
以往的研究表明,分析师对非财务信息的关注程度取决于财务信息的可利用程度(Coram et al.,2011)[10],与公司的盈余质量和盈余信息含量负相关(Orens and Lybaert,2010)[20]。作为分析师的主要信息来源,公司公开会计信息的数量和质量是分析师盈利预测准确性的重要影响因素(白晓宇,2009)[24]。当公司的公开会计信息数量较少、质量较低时,财务信息的价值较低,对于预测和估值的作用较小;相反,研发投入和无形资产等非财务信息的重要程度更高(Amir and Lev,1996)[1]。分析师仅依靠公开会计信息进行预测的难度较大,误差较高,需要更多地关注和利用其他渠道和其他类型的信息进行补充,确保预测和分析的质量。此时,公司的非财务信息,如创新相关信息,作为公司公开会计信息的有益补充,在预测过程中的地位更加重要,对于提高预测准确性的作用更大,分析师关注和利用创新相关信息所产生的增量价值相应更高。
此外,公司的信息不对称程度对于创新相关信息的价值也会产生一定的影响。创新活动的复杂性、不确定性以及财务报告对其信息承载不足,加剧了公司的信息不对称,特别是在创新活动的专业程度和复杂程度较高、创新项目的专有程度较高以及根据其他信息推断公司创新情况的难度较大时,信息不对称更为严重(Palmon and Yezegel,2012)[21]。此时,分析师提高努力程度,增加对创新相关信息的关注,获取更多私有信息以及充分解读公开信息,有助于深入全面地理解公司创新活动的进展、内在价值和未来收益情况,做出更为合理的分析和预测,从而提升盈利预测的准确性,改善预测质量。
基于上述分析,本文进一步探究公司的信息环境对分析师创新信息关注与盈利预测质量之间关系的影响,验证是否对于盈余质量较低、信息不对称程度较高的公司,分析师研究报告中创新相关信息的含量与盈利预测准确性之间的正相关关系更强。由此,本文提出如下假设:
H3:对于信息环境较差,即盈余质量较低、信息不对称程度较高的公司,分析师研究报告中创新相关信息的含量与盈利预测准确性之间的正相关关系更强。
三、研究设计
(一)样本选择与数据来源
本文选取2012―2020年分析师对我国A股上市公司发布的研究报告为样本,并进行了以下的筛选:(1)剔除当年度新上市的公司样本;(2)剔除研究报告发布时间在相应预测年度年报发布日及之后日期的样本;(3)剔除ST类特殊处理公司样本;(4)删除金融行业公司样本;(5)删除相关数据缺失的样本;(6)只保留每个分析师当年度对该公司的最后一次预测。具体的样本筛选步骤如表1所示。经过筛选,最终得到的样本数量为104646,涉及的公司为3039家,公司-年度观测值为14627,平均每家公司在每一年度的跟踪分析师数量为7.15,研报数量为16.87。为了控制极端值对结果的影响,本文对所有连续变量进行了上下1%的缩尾处理。
表1 样本筛选过程
本文所使用的分析师研究报告文本内容来自于新浪财经和慧博投研平台,分析师盈利预测数据、券商和分析师相关数据、公司相关数据来自于万得数据库(Wind)和中国研究数据服务平台(CNRDS),并结合手工搜集进行核对和补充。
(二)分析师研究报告中创新相关信息含量的衡量
参照胡楠等(2018)[29]、张俊瑞等(2022)[42]方法,本文使用“种子词+Word2Vec相似词扩充”的方法提取分析师研究报告中的创新相关词汇,并进行词频统计,以此衡量研究报告中创新相关信息的含量。具体包括以下三个步骤:
首先,借鉴以往的文献(胡楠等,2018)[29]确定创新相关词汇的种子词集,以“技术创新、研究、开发、研发、专利、发明”作为创新的种子词汇。
其次,由于语言的复杂性,对同一概念或者事物可能会存在多种不同的表达方式,因此需要对选取的种子词进行近义词的扩充。本文运用Word2Vec神经网络模型对分析师研究报告文本进行训练,获取创新相关词汇在分析师研究报告语料中的相似词集。先找出每个种子词的前200个相似词,剔除重复词和相似度较低的词汇,形成候选词集。再由两名专家对候选词集中的词汇进行逐一确认和筛选,并对比分析师研究报告文本样例进行核验,最终得到373个创新相关词汇作为本文构建的创新词库。表2展示了这一创新词库中包含的部分创新相关词汇。
表2 本文构建的创新词库部分词汇示例
最后,利用Python软件统计本文构建的创新词库中的每个词汇在每一份分析师研究报告中出现的频数,所有创新相关词汇出现的频数之和与总词汇数(排除停用词)之比为该分析师研究报告中创新相关信息的含量。这一数值越大,代表分析师对创新相关信息的关注和利用程度越高,研究报告中包含的创新相关信息越多。
(三)模型设定与变量定义
本文利用模型(1)对假设H1进行回归检验:
Acc为本文的主要被解释变量——分析师盈利预测的准确性。借鉴杨青等(2019)[40]的研究,本文利用分析师对上市公司最近一期的每股收益预测值与对应年度公司每股收益实际值之间差异的绝对值衡量分析师盈利预测的误差,并用期初股价进行调整,将这一数值乘以-100,作为分析师盈利预测准确性的代理变量。这一数值越大,代表分析师盈利预测的准确性越高,具体的计算方法如式(2)所示:
其中,FEPSi,j,t为分析师i对上市公司j于t年度发布的最近一期每股收益预测值,EPSj,t为上市公司j在t年度的每股收益实际值,Pj,t-1为上市公司j在t-1年度的期末收盘价。
本文的主要解释变量为分析师研究报告中创新相关信息的含量(Innw)。根据假设H1,如果分析师研究报告中创新相关信息的含量与分析师盈利预测的准确性正相关,那么模型(1)中自变量Innw的系数α1应该显著为正。
本文借鉴以往的文献(杨楠和洪剑峭,2019;杨青等,2019)[39][40],对分析师个人层面、分析师预测层面、券商层面和公司层面等可能影响分析师盈利预测准确性的因素进行了控制:分析师的公司经验(Fexq),即分析师对该公司的首次研究报告与本次研究报告发布时间的月份间隔,并取自然对数;分析师的总体经验(Gexp),即分析师的首次研究报告与本次研究报告发布时间的月份间隔,并取自然对数;分析师的专注度(Anacov),即分析师当年度跟踪的公司数量,并取自然对数;分析师的预测频率(Freq),即分析师当年度对该公司发布的研究报告数量,并取自然对数;分析师的预测范围(Horizon),即分析师盈利预测发布日期与对应公司年度报告发布日期的天数间隔,并取自然对数;券商规模(Broker),即分析师所在券商雇佣的分析师数量,并取自然对数;公司规模(Size),即公司总市值的自然对数;公司的账面市值比(Bm),即公司的权益账面价值与总市值的比值;公司的盈利能力(Roa),即公司的总资产报酬率;公司的资产负债率(Lev),即总负债与总资产的比值;公司年龄(Age),即公司上市年度与当年度的年份间隔,并取自然对数;公司的研发投入水平(Rd),即公司的研发费用与总资产的比值;公司年报中创新相关信息的含量(Ino),即公司年报中创新相关词汇数占总词汇数的百分比。此外,本文还控制了行业和年度效应。
对于假设H2和假设H3,本文构建模型(3)进行回归检验:
其中,Intvar为调节变量。对于假设H2,Intvar为创新活动强度(Inten),参照李岩琼和姚颐(2020)[32]的研究,利用是否属于科技密集型企业这一哑变量来衡量(属于科技密集型企业则赋值为1,否则为0)。具体来说,定义属于C2(家具、造纸、印刷、石油、化学、医药制造业)、C3(金属、非金属、设备、汽车、航天、器械、电子制造业)、I(信息传输、软件和信息技术服务业)、M(科学研究和技术服务业)四类行业的公司为科技密集型企业,这类公司创新活动强度较大,创新信息相应更为重要,信息价值也相对更高。其他行业的公司为劳动和资本密集型企业,即非科技密集型企业,这类公司创新活动强度相对较小,创新相关信息对于预测公司未来业绩变化的相关性和有用性相对较低。对于假设3,Intvar这一调节变量分别为公司的盈余质量(Nge)和公司的信息不对称程度(Fdis)。借鉴石桂峰等(2007)[36]、杨楠和洪剑峭(2019)[39]的研究,本文利用非经常性损益占净利润的比例衡量公司的盈余质量Nge。非经常性损益的比例越大,表示公司的盈余质量越差,可预测性越低。根据杨楠和洪剑峭(2019)[39]、伊志宏等(2019)[41]的研究,公司的信息不对称程度越高,分析师盈利预测的分歧越大,因此本文利用分析师预测分歧衡量公司的信息不对称程度Fdis。具体计算方法为所有分析师当年度对该公司盈利预测的标准差与盈利预测均值的比值。这一数值越大,代表分析师的预测分歧越高,公司的信息不对称程度越大。
其他变量的定义同模型(1),这里主要关心的系数为β1。根据假设H2和假设H3,如果对于创新活动强度较大、盈余质量较低、信息不对称程度较高的公司,分析师研究报告中创新相关信息的含量与盈利预测准确性之间的正相关关系更强,那么模型(3)中交乘项Innw×Intvar的系数β1应该均显著为正。
表3对上述变量的定义进行了详细解释。
表3 变量定义
四、实证结果与分析
(一)描述性统计
表4列示了主要变量的描述性统计结果。被解释变量分析师盈利预测准确性(Acc)的均值为-1.113。解释变量分析师研究报告中的创新相关信息含量(Innw)的均值为0.682%,标准差为0.900%,说明分析师研究报告中创新相关信息的含量存在较大差异,这为本文的研究提供了良好的基础。同时,公司年报中创新相关信息含量(Ino)的均值为0.727%,均值和中位数都高于分析师研究报告中的创新信息含量,而标准差相对较小,说明公司自身的创新相关信息披露与分析师的创新相关信息关注之间存在一定的差异。
表4 变量的描述性统计结果
(二)单变量分析
本文首先利用单变量分析,检验给予公司创新相关信息更高关注的分析师发布的盈利预测是否更准确。这里,将分析师研究报告中的创新相关信息含量按照是否高于公司-年度中位数进行分组,考察对于同一家公司而言,不同创新信息关注水平的分析师所发布的盈利预测准确性的差异。表5显示,在分析师研究报告中创新相关信息含量(Innw)较高的组中,分析师盈利预测准确性的均值为-1.047,而在分析师研究报告中创新相关信息含量较低的组中,盈利预测准确性的均值为-1.159,且两组的差异在1%水平下显著,说明给予公司创新相关信息较高关注的分析师盈利预测准确性要显著高于创新信息较低关注的分析师的预测。单变量检验结果初步证实,分析师对创新相关信息的关注和利用程度越高,盈利预测的准确性越高、质量越好。
表5 单变量分析结果
(三)回归分析
表6报告了模型(1)的回归结果。第(1)列是只控制了分析师和券商相关变量、没有控制公司相关变量的回归结果。解释变量分析师研究报告中创新相关信息含量(Innw)的系数为0.050,t值为8.31,在1%水平下显著为正,说明在控制分析师特征、券商特征和分析师预测等因素的影响后,分析师研究报告中的创新相关信息含量与分析师盈利预测准确性正相关,支持了本文假设H1。第(2)列是在第(1)列的基础上控制了公司相关因素后的回归结果,在加入所有控制变量后,Innw的系数为0.020,t值为3.40,在1%水平下显著为正,进一步证明在控制分析师和公司其他因素的影响后,分析师对创新相关信息的关注有助于提高其盈利预测准确性。综合第(1)(2)列结果,本文的假设H1得到了证实,即分析师研究报告中的创新相关信息含量与盈利预测准确性之间存在正相关关系,分析师对创新相关信息的关注和利用程度越高,盈利预测的质量越好。
表6 模型(1)的回归结果
表7报告了加入调节变量之后模型(3)的回归结果。第(1)列显示,当调节变量(Intvar)为创新活动强度(Inten)时,交乘项Innw×Intvar的系数为0.040,t值为2.69,在1%水平下显著为正,表明对于科技密集型企业,分析师研究报告中的创新相关信息含量与盈利预测准确性之间的正相关关系更强。这个结果支持了假设H2,即在公司创新活动强度较高的情况下,分析师的创新信息关注对盈利预测质量的提升作用更大。第(2)(3)列的回归结果显示,当调节变量(Intvar)为盈余质量(Nge)和信息不对称程度(Fdis)时,交乘项Innw×Intvar的系数分别为0.056和0.227,均在1%水平下显著为正,表明对于盈余质量较差、信息不对称程度较高的公司,分析师研究报告中的创新相关信息含量与盈利预测准确性之间的正相关关系更强。这个结果支持了假设H3,即在信息环境较差的情况下,分析师的创新信息关注对盈利预测质量的提升作用更大。
表7 模型(3)的回归结果
对于这三个调节变量与分析师盈利预测准确性之间的关系,表7中的结果与之前的研究结论基本相符,即公司的创新活动强度、盈余质量和信息不对称程度均与分析师盈利预测准确性显著负相关。这说明在公司创新活动强度较高、盈余质量较差、信息不对称较为严重时,分析师盈利预测的难度较大,从而引起较为严重的预测误差。此时,分析师对创新相关信息充分的关注和利用能在一定程度上缓解这些因素对预测准确性的负面影响,提升其信息掌握程度和分析水平,有效降低预测难度和不确定性,减少预测误差,进而起到提高预测准确性、改善预测质量的作用。
(四)稳健性检验
1.内生性检验
由于分析师在进行信息获取和利用的选择时会受到某些公司以及自身因素的影响,这些因素可能与分析师盈利预测准确性相关。也就是说,分析师对公司创新相关信息的关注可能会存在自选择的问题,本文的结果在一定程度上会受到内生性的影响。针对这一问题,本文分别采用两阶段最小二乘法和倾向得分匹配法(PSM)这两种方法缓解可能存在的内生性问题。
(1)两阶段最小二乘法
借鉴许汝俊等(2021)[38]的研究,选取同行业同年度其他公司的分析师研究报告中创新相关信息含量的均值(Innw_m)作为工具变量。行业内同年度其他公司的分析师研究报告中创新相关信息含量反映了该行业分析师对创新信息关注的整体情况,与分析师对该公司发布的研究报告中创新相关信息含量具有较高的相关性,但与分析师对该公司的盈利预测准确性没有直接相关关系。
工具变量两阶段回归的结果如表8第(1)(2)列所示。第(1)列是第一阶段回归结果,工具变量(Innw_m)与分析师研究报告中的创新相关信息含量(Innw)具有显著正相关关系,相关系数为0.602,证实了这一工具变量的选取是合适的。第(2)列报告了第二阶段的回归结果,分析师研究报告中的创新相关信息含量与分析师盈利预测准确性仍然显著正相关(Innw的系数为0.211,t值为7.45,在1%水平下显著为正),说明在使用工具变量对可能存在的内生性问题进行控制后,本文的主要结果仍成立,一定程度上证明了结果的稳健性。
表8 内生性检验结果
(2)倾向得分匹配法(PSM)
将分析师研究报告中创新相关信息含量大小设置为虚拟变量(若Innw大于同一年度同一行业中位数则赋值为1,否则为0),利用本文的控制变量对其进行Logit回归,计算出倾向得分。然后根据倾向得分,采用1:1相邻匹配构建配对样本。对匹配之后的样本利用模型(1)进行回归检验,结果如表8第(3)列所示。可以看到,解释变量Innw的系数依然显著为正,进一步验证了本文结果的稳健性。
2.更改解释变量和被解释变量的衡量方法
首先,更改被解释变量分析师盈利预测准确性(Acc)的衡量方法。借鉴管总平和黄文锋(2012)[26]的方法,用公司实际每股盈余的绝对值对预测误差进行调整。考虑到每股盈余可能为0,导致盈利预测准确性无法计算,为避免这一原因造成的数据缺失,本文用实际每股盈余的绝对值加0.5进行调整,保证衡量方式的有效性。同样将这一数值乘以-100,作为分析师盈利预测准确性的替代变量。具体计算方法如式(4)所示,变量的定义同式(2)。
更改被解释变量衡量方法后的回归结果如表9第(1)列所示。可以看到,Innw的系数仍然显著为正,说明被解释变量分析师盈利预测准确性的衡量方法不会影响本文的主要结果。
表9 更改变量衡量方式以及控制遗漏变量的回归结果
其次,更改解释变量分析师研究报告中创新相关信息含量(Innw)的衡量方法。以分析师研究报告的句子为单位,采用分析师研究报告中包含创新相关词汇的句子占总句子数的比例来衡量分析师研究报告中的创新相关信息含量。更改解释变量衡量方法后的回归结果如表9第(2)列所示,Innw的系数仍然显著为正,说明解释变量分析师研究报告中的创新相关信息含量的衡量方法不会影响本文的主要结果。
3.控制遗漏变量
本文进一步对可能影响分析师盈利预测质量的其他遗漏变量进行控制,包括发布研究报告的分析师是否是明星分析师的虚拟变量(Star),该研究报告是否由分析师团队发布的虚拟变量(Team),公司当年度的创新成果产出即专利申请数量(Apply),公司的无形资产比例(Intang),是否是国有企业的虚拟变量(Soe),机构投资者持股比例(Inst),以及分析师跟踪数量(Analyst)。加入这些控制变量后的回归结果如表9第(3)列所示,Innw的系数仍然显著为正,说明本文主要结果受到遗漏变量影响的可能性较小,具有一定的稳健性。
五、结论与启示
本文利用2012―2020年分析师对我国A股上市公司发布的研究报告,通过文本分析,检验分析师的创新相关信息关注对于其盈利预测准确性的影响。研究发现,分析师研究报告中创新相关信息的含量与盈利预测准确性正相关,即分析师对创新相关信息的关注和利用程度越高,盈利预测质量越好。特别是在公司创新活动强度较高、盈余质量较差、信息不对称程度较大的情况下,分析师的创新相关信息关注和使用对于提高其预测准确性的作用更强。这说明分析师的创新信息关注是通过更充分地获取和解读盈利预测相关的有用信息,以及降低预测难度和不确定性,来达到盈利预测质量提升的效果。本文深入到分析师报告文本信息的层面,探究了分析师对公司创新相关信息的关注和利用在提高盈利预测质量中所发挥的重要作用,丰富了分析师盈利预测影响因素的研究;同时,本文也拓展了关于非财务信息价值的研究,从分析师信息使用和提供的角度,为创新这一非财务信息的价值进一步贡献了有力证据。
本文结论对于分析师、投资者、公司和监管部门也具有一定的启示意义。首先,从分析师角度,本文的结论证明分析师关注和利用创新相关信息是有价值的,提示分析师在获取和使用会计信息的同时,也应对创新等非财务信息给予足够的重视,进行综合分析和全面解读,以提高盈利预测的质量和研究报告的价值。其次,从投资者角度,本文的结论提示投资者要不断提高信息获取、甄别和吸收能力,结合相关信息对研究报告的内容和结论进行辩证、有效、合理的判断和利用。再次,对于公司来说,本文的结论启示公司需要与分析师保持良好的互动和交流,为分析师对公司信息的有效收集和解读提供便利,从而使其形成关于公司未来经营业绩和市场价值的合理预期,助力分析师充分发挥在缓解信息不对称方面的作用。最后,本文的结论也为政策制定和市场监管部门评价分析师研究报告的质量、规范分析师的信息使用和提供行为、提高其所传递信息的价值提供了一定的参考。相关监管部门应充分重视和合理引导分析师对于创新等非财务信息的关注和解读,从而促进分析师更有效地发挥其在传递信息、提高资本市场运行效率方面的重要作用。■