优秀论文也是精彩故事
2021-05-20姚力炜
姚力炜
故事梗概“四两拨千斤”
在交流论文写作难点时,同学们感到困惑的是没写作思路,写数万字的长篇大作,常常写着写着就难以为继了。
我发现,论文写作并非一气呵成,更多的是一个动笔之初率性而为、落笔之后细致推敲、反复增删的过程,即论文可以尝试不按照既定格式顺序来写。在初次撰写金融序列预测研究的一篇论文时,我按照论文的模板顺着写,先写金融序列分析意义,再写金融数据特点,又写时间序列分析缘起,最后写深度学习网络与注意力机制发展潮流及其体会。写着写着忽然发现虽洋洋洒洒一大段,却似花瓣闲落满地,内在联系不紧密。导师点评“写得很认真,但读起来却不能领会论文精要”。她指点我,写一篇好的论文,就像讲述一个有趣的故事,讲之前心中要有一个故事梗概,简明扼要地厘清故事的来龙去脉,概括核心观点,让读者第一时间知道论文想要表达的重点,不然就可能废话连篇、切不中要害。
我觉得老师说的很有道理,便将初稿推倒重来,斟酌论文脉络和核心观点是什么。论文提出了一种金融序列预测的新算法。金融序列预测即从股票或者股票指数的历史数据,如开盘价、闭盘价、成交量中挖掘信息,利用这些信息预测未来的股价。如果算法可以很好地依据历史预知未来,投资者就可以据此明智地在股票交易中理性投资,规避重大风险。
为了实现这个目的,我引入新的研究思路:生成对抗网络,它包括生成器和判别器两部分。前者好比不法分子,负责生成伪造数据;后者好比警察,负责区分输入来自真实数据还是生成器伪造的数据。两者形成对抗博弈:判别器最开始不知道怎么区分,要在不断辨别真实数据和虚假生成数据之后,才能建立有效的判别标准。就相当于不法分子制造假钞,警察拿到了假钞才知道这些假钞和真钞的区别,就能更好地鉴别假钞。而不法分子随着警察辨别能力的增强,就会试图弥补容易被警察识别的缺陷,制造更逼真的假钞。最终警察的识别能力和不法分子造假钞的能力都变强,假钞就越来越逼真了。应用在金融序列预测中,这个生成器就是在学习未卜先知的股票价格预测技艺。然而传统的金融预测生成模型无法识别出什么样的输入因子是关键因素,生成效果很差,进而判别器也无法相辅相成提升自己的鉴别能力,导致生成对抗网络无法很好地解决金融预测问题。
我的最终解决办法是,将注意力机制引入生成器。这个机制源于人类视觉的研究,简要说就是人眼会在短暂一瞥后聚焦自己关注的信息,虚化或删除其他不感兴趣的信息。注意力机制可以让对于预测更重要的因素得到更好的表达,进而使得生成器与判别器易于达到强弱均衡,真正相得益彰,教学相长。
这段几百字的故事梗概,源于我的深入理解和巧妙构思,与上万字论文比,实在是很少一部分,但却是全文核心重点,让读者一目了然。写到这里,论文有了最诱人的部分,然后反复品读。这里写得意犹未尽,没有展现最精妙的部分,就补充几句;那里隐约感觉太过粗疏,读者可能不太明晰,就继续添加必要的补充说明。兴之所至,仔细雕琢。
上证指数与中美汇率波动相关性图示
上证指数与中美汇率呈相同变化交易日占比图示
写完了这些部分,就如描摹一匹骏马,眼前仿佛已然勾勒出了它的奇伟风骨,而综述,背景的写法也变得清晰了起来。综述部分要调研的内容,就是依托主线的相关技术发展沿革,在这篇论文中主要是对金融序列预测作纵向综述,对注意力机制等相关技术做横向简述。结果分析部分即是写上述的方法变革,相较之前方法的改进效果、实践中仍然未能克服的缺陷、暴露的问题,这样下来整篇文章就浑然一体,立体而生动了。
论文是一种有生命力的工具,是学者研究、思考的心血结晶,自然要围绕学者自身的思维主线来展开,所谓纲举而目张,纲不是论文精细严谨的格式,而是学者对科学研究本质的思考。总之,写论文可以先完整准确地把最核心的东西摆出来,写得粗一些也行,然后对这个粗糙胚子修修补补,再精雕细琢,最后开展格式调整等修饰工作。
实例开口胜于雄辩
论文写作中,用言語很难表达的、晦涩艰深的理论推导、辨析,往往可以用清晰了然的实验、实例诠释,诚所谓事实胜于雄辩,简单质朴的实例胜过万语千言。
刚入学撰写一篇专利文章时,我写道“显然,我们可以获知”“实验数据清晰地证明”。我的导师看后哭笑不得,指点我:这个结论对你是显然的,并不意味着对每个读者都是显然的。导师说,将并非显然的论断,转化为人人均可会意的结论时,最好让事实开口说话。
又比如,我在论文中写道:“可以明晰,汇率这一因素对于预测股票市场的波动有显著意义”。为了说明这一点,我曾考虑引用很多经济学理论来演绎佐证,但总感觉缺乏说服力。在文献检索中,我翻阅到一篇SCI文章,它统计了股票市场变化趋势,与汇率变化趋势相同的交易日,占所有交易日的比例。数据显示,两者的变化有着很强的相关性,背后的原理是汇率通过国际资本流动、国际贸易收支等途径作用于股票市场,在预测股价变化趋势以进行投资决策时,将汇率纳入考虑,可以更好地综合更长时间维度下,宏观经济变化趋势影响;同时有助于更好预测上证综指等综合宏观股指、预测对外贸易型企业股价、预测复杂国际局势譬如贸易战下股价的变化趋势。
论文中给出的图表如上:2017到2019年间,上海证券综合指数的波动与中美货币汇率的波动呈现很高的相关性,在汇率处于下行区间时,上证综指也有更大概率处于下降而非上涨态势。随着时间窗口的加长,汇率变化与上证综指的一致性甚至逼近80%,这有力说明了引入汇率对于金融序列预测的作用。
我受此启发,在接下来的科研中,广泛采用相关性分析方法、敏感性分析方法处理了很多这种难以说清道明的结论。
YOLACT算法原理结构图
不同实例分割算法实时性与分割精度对比图示
在人文社科的论文撰写中,社会调查等实例也有着非常大的说服力。“没有调查就没有发言权”,设计科学合理、开展落到实处的社会调查结论,可以胜过一切诡辩,往往是论文写作的压舱石,点睛笔。
学术论文的写作过程,也是翻译的过程:将科学实践抽象的、错综复杂的语言,翻译为具体浅显的、凝练有条理的语言。翻译讲究的信、达、雅,正对应学术论文臻于至善的不同层次。对应于翻译中准确传达内涵的“信”,恪守学术诚信,俯身倾耳,永葆对真理的敬畏与虔诚之心正是做好学术的基石所在。
即使是“雄辩”,每一句话也应仔细斟酌,宁缺毋滥。字字落到实处,句句藏在心间,才能真正妙笔生花。如何将科研诚信融入写作的一字一句中呢?应在用语上客观严谨,避免使用带有主观判断与情感色彩的夸张词、加强词,避免使用复杂的叠句与从句,这样可以减少冗余信息对读者理解论文的干扰,也能够让研究结果更自然、更令人信服地呈现。
学术论文应当在主体部分尽量阐述客观的、无可辩驳的事实,而不应当夹杂个人的价值判断与情绪色彩,应当将自己的心得与骄傲放在摘要与展望部分,真正做到让纯粹、准确的数据充盈于论文字里行间,让主题始终留在读者心中。
万千数据尽收图表之窗
工科生经常要和数据打交道,特别是在对海量的、错综复杂的数据进行梳理分析时,仅靠逻辑来构思论文写作,往往是艰难的。不妨透过图表之窗,尽收万千数据于眼底,让图表反客为主,从中窥见论文奥义。
图表具有直观醒目、涵盖信息密度高的特点。其一,将文章最核心的分析步骤转化成图表,可以达到主旨突出、层次清晰的目的;其二,把文章中的结果对比融入图表,可以实现对比鲜明,数据跃然纸上的效果;其三,用图表承载历史数据,可以直观看清发展脉络。同学们可以围绕这些图表展开论述,深入补充图表中呈现的规律、阐释反映的结论,并针对各个图表间的联系与差异进行讨论,以增强文章的逻辑性与层次性。
我曾经写过一篇《基于深度学习的图像实例分割研究》的论文,其中研究主题图像分割是计算机视觉的一个基本任务,应用场景广阔。比如说在自动驾驶中,图像实例分割技术是车辆的“火眼金睛”,对车辆摄像头捕捉到的整个图像不同像素进行语义标注,将车道的中心线、标志线、车辆、行人、树木划分出来,汽车就可以像人一样敏捷地躲避行人,沿路顺畅通行。这篇论文实验细节很琐碎,要说明网络结构的細微更改、网络的超参数设置、方法革新被迫做出的权衡取舍等内容,因此比较难以全面条理地阐述。而图表的加入则破解了这一难题,让整篇论文变得栩栩如生,宛如一幅层次分明的山水画。首先呈上一幅相关领域图像分割方法的对比图作开胃小菜,该图对比主流方法的图像分割速度与精度,鲜明地突出了本方法的快速与高效,以及不可避免的在分割精度上的妥协。在YOLACT算法论文中,即给出了这样的示例,横轴是不同算法的速度,纵轴是不同算法分割掩膜的精度,一目了然,新算法(如图:梅花部分)具有非常优越的快速性而仅牺牲了少量的分割精度。
进而承上述图表,论文给出了本方法的网络结构图,清晰地展示了算法做了什么样的结构改动,是如何对应实现上述效果的,可以称得上是定场诗。
在深度学习领域中,网络结构图往往就是整篇论文的灵魂,清晰优美的网络结构图可以让人瞬间心领神会、拍手称妙,而简易含糊的网络结构图,只会让读者摸不着头脑,只得细细品读揣摩。下图也是YOLACT中的一幅网络结构图,网络结构的关键节点与操作汇集其中,论文算法的流程步骤与结构创新一目了然。
深度学习的网络超参数繁多,不同的超参数组合会有着不同的算法效果,对于不同的分割目标,算法也存在优劣,比如有的网络更善于分割行人、车辆等大个子,而在宠物、盆栽等小物件分割上表现乏力。这些丰富的信息可以很好地封存在一个表格中,比如横向坐标是输入图像尺寸、训练优化方法,纵向坐标是不同组合的效率与精度,仿佛是一份解渴去乏的冰饮,如果可以辅以详尽的结果分析与细致的方法对比,那么读者“按图索骥”,粗略阅读就可以掌握论文核心创新点与革新效果,而有不通晓的地方再去细节处检索研析,研析起来就会十分顺畅。
图表在论文写作中大放异彩,不同图表也蒙着不同的面纱,具有鲜明的特点与独特的作用。一般来说,流程图总括全文,明晰思路;思维导图抽丝剥茧,鞭辟入里;而饼状图能够突出重点;散点图可以观察两个变量之间关联;折线图较好展示数据变化趋势;箱线图直观检验离群差异点讲故事的时候,讲者喜欢调动肢体语言,眉飞色舞的神态往往能让故事更加跌宕起伏,让听众兴致盎然,而直观清晰的图表,就如人有千姿百态,可以称得上是文字之外的第二种学术语言。
责任编辑:王新伟