APP下载

文献类图书编校难点及易错点初探
——以“文学大系”为例

2022-11-22魏翕然

传播力研究 2022年22期
关键词:别字大系繁体字

◎魏翕然

(黑龙江大学出版社,黑龙江 哈尔滨 150080)

文献是指有历史价值或参考价值的图书资料,将浩如烟海的文献分门别类整理成书,无疑具有极其重要的意义。从研究和考察的角度,文献类图书要求尽可能还原文献的真实面貌,特别是语料库语言学研究,对文字还原准确性的要求很高。但同时,文献类图书也属于当今的出版物,受到《图书质量管理规定》等出版规范的规约,编辑加工环节负有订正和规范的责任。究竟如何把握好“保留”与“修改”的尺度,是一个难题。此外,不同的文献产生于不同的年代、不同的作者之手,原版出版风格不同,每一篇资料都是共性与个性并存的个体,在体例上究竟是保留原貌,还是按照统一的格式规范处理,哪些地方需要保留,哪些地方需要统一,同样是难题。此外,繁体字、异体字的识别,原文献字迹模糊的处理方式等,都考验着编辑的眼力和脑力。类似的问题还有很多,因此,文献类图书出版看起来容易,不过是“照录”,但实际操作起来远不是“照录”那么简单,可谓困难重重。从整理素材、录入、校异同到编辑加工、校是非等等,每个环节都会碰到新问题。

黑龙江大学出版社曾推出过《1931—1945年东北抗日文学大系》和《1945—1949年东北解放区文学大系》两套丛书(以下合称为“文学大系”)。丛书的内容是将当年相关的报纸、杂志、图书等刊登的作品以拍照、扫描等方式提取出来的,经过录入、校异同后进入编辑加工和校对流程,文字处理工作较为繁杂,难度大,耗时长,在很多环节均出现过新的问题。下面结合笔者参加校异同、编辑校对以及质检等工作实践,分类谈一谈笔者在印前质检过程中发现的此类图书编校的难点及易错点。

一、形近别字

形近别字可以说是“文学大系”中出现最频繁也最难以辩驳的差错,质检中发现的“硬伤”绝大部分属于此类。究其来源,经过与原始文献核对,大部分属于录入错误,小部分是原始文献自带的错误。当时的写作环境下,各方面条件都相对艰苦,很难具备如今的出版环境,但即便如此,也未出现错字连篇的情况,实属难能可贵。

录入错误产生的形近别字,有的明显影响了语义,例如,“勘 丈作晌(垧)”“歇响(晌)”“年眼(限)”“若千(干)”“探间(问)”“年(庄)稼”“本(土)块”“莱(菜)蔬”“急邃(遽)”“这祥(样)”“香消玉陨(殒)”“士敏士(土)”“脑袭(袋)”“简真(直)”“保脸(险)柜”“脚(胸)步”“笞(答)应”“若(苦)笑”“偷(愉)快”“维杂(系)”“蜻蜒(蜓)”“耳杂(朵)”“扭拆(折)”“坑(炕)头”“哼(啍)!”等等(括号中为原始文献的正确字,下同),不胜枚举。有一些简化字字形并不相近,但繁体字字形相近,录入时易出现错误,例如,“虚(处)置”“富(当)然”“裹(里)边”“模(朴)素”等。遇到此类词语感到费解时,一定要勤于怀疑并查阅原始文献,原始文献不清晰的,还要联想或猜测一下,应当为什么字才既形似又合理,将字形(包括繁体字形)相近的字广泛联系做出判断。“文学大系”绝大部分都是汉字,外文字母极少,但外文录入错误也存在。例如,“‘KuIa’(‘Kula’)(吆喝意)”“‘Mu a ge?’(‘Mu s ge?’)(怎么了?)”。偶尔出现的外文大多附有解释,且有的根据前后文不一致就能判断出差错,再到原始文献中查找即可印证。此外,一字线“—”和汉字“一”互相错用的情况也很普遍,且稍一疏忽就容易遗漏。

还有的形近别字,即使错了也能跟前后文连起来,表面读起来还算勉强通顺,这就给发现错误带来了困难。例如,“嗔(愤)怒”“他的脸颊(颇)显得凶狠”“都线(织)描出自己的老婆的姿态”“一张狍(豹)子皮”“贼眼迷迷(汹汹)”“所要说的语(话)”“倒闭(关)在屋内”“他通身感到了抖不掉的泥滴(泞)纠缠的困难”“脸上飘动(展)着天真的微笑”“刺刃(刀)划开”“国标(际)”“骗(驱)使他开了口”“亲(衬)和着爆发的山洪的吼声”“另一个尖锐的噪(嗓)音”“往腹(复)地奔驰着”“坦(袒)露着胸脯”等等。这些错误如果遗留下来,勉强还算读得通,但毕竟与原文语义有差别,本着忠实原貌的角度,还是应当尽量找出并改正。

还有一种隐蔽的错误——录错字后读起来也还算通顺,可是根据前后文会发现语义或逻辑上的矛盾。这样的错误,只孤立阅读局部文字不太容易发现,但一旦遗留下来就是隐患.因此,需联系上下文深入理解,合理怀疑。例如,“傻货!有钱准(谁)干运输队……”“这年头买(卖)房子谁要”“我愤(怕)极了”“他也难(杂)在别的宣抚队中间”“一条条地从窗橱(棂)跌进来”“来不及分辨(辩)”“手执铁杵驱魔杖(障)”“牛羊(样)的眼珠子”“我不吃,你替我拔(泼)了吧”“怯(祛)寒”“下腭(颚)”“提着两只老母亲(鸡)”等等,误字意思与正字大相径庭,甚至荒唐可笑。此外,“她”“他”是一对既形近又音近的字,也会出现高频错误,一旦录入错误,需要结合上下文判断指代的究竟是谁,用得对不对。可见,文献类图书的编辑校对仍需要勤动脑分析,仅靠校异同,很难完全消灭其中的隐性差错。

除了录入错误以外,原始文献也难免有错别字,特别是在铅印时代,拣字很容易出现拣错或者旋转、倒置的情况。例如,“拉拉红(江)”,显然意思不通顺,前后文一对照便可判断出来。从准确传播知识的角度,建议通过注释的方式加以订正。

当然,对错误的准确判断很重要,切忌把现如今不常用或编辑自己不知道,但在作品写作年代是规范的、合理的用字当成错别字改掉。

二、音近别字

文字识别录入和人工录入时字形识别错误占主导,录入产生的音近别字不如形近别字多,大多为人工录入时的输入错误。例如,“发现有些小伙伴的笔记(迹)。”

除此而外,音近别字有很多是原始文献中一些不规范的用法,比原始文献中形近别字多。受那个时代作者知识水平以及规范完善程度、查证便利性等因素所限,写作很难完全做到准确规范,有的字词当时根本就没有确定的写法。例如,“粘(鲇)鱼”“那座(撮)毛发”“帽沿(檐)”“碎沫(末)”“土播(拨)鼠”“蹶(撅)起屁股”“和(霭)蔼”“撑槁(篙)”“门坎(槛)”“菜樽(墩)”“殒(陨)石”“苍苍惶惶(仓仓皇皇)”“磨(蘑)菇”“糟塌(蹋)”“擒(噙)着一汪泪水”“草茎蔓(漫)过他的腰”“叩(扣)着门”“变(辩)解”“大姆(拇)指”“驼(驮)回来”“佶倔(屈)敖(聱)牙”“烦燥(躁)”“小鸟……在她的手尖上琢(啄)”“带(戴)着一副包金镯子”“驼(陀)螺”“石滚(磙)”“从蹬(镫)上解脱下来”“你擎(䞍)等着吧”“兵慌(荒)马乱”“嘻(嬉)皮笑脸”“眼急(疾)手快”“毛骨耸(悚)然”“红樱(缨)子枪”“煊(暄)耀”。这里拟声词用一般意义词语代替的情形比较多,如“拍叉(啪嚓)”“呼呼吃吃(哧哧)”“擦擦(嚓嚓)地响在纸上”“格登(咯噔)”“碰(砰)”,还有的用拟声词做动词,如“一咕噜(骨碌)爬起来”。这些词语当中,有很多意思上也并不影响理解,但按照现代汉语的规范,正字和别字之间没有明确的通用关系。

三、繁体字、异体字、旧字形

目前繁体字、异体字、旧字形已经不属于规范汉字,因此应当改正。因为字形相近,有的还错用了其他汉字的繁体字、异体字或旧字形,这就由不规范汉字变成了错别字。例如,“嚇(吓)”“濛濛(蒙蒙)”“迷矇(蒙)”“袴(裤)裆”“小夥(伙)计”“覷(觑)”“滾(滚)”“苦捱(挨)”“冰(氷)”“水(氷)”“板発(凳)”“髙(高)等”“审査(查)”“劝吿(告)”“鬂(鬓)角”“冋(回)答”“特別(别)”“高垅(垄)台”“恋桟(栈)”“独呑(吞)”“毎(每)个人”“淸(清)晰”“道徳(德)”“吶(呐)喊”“亊(事)情”“狂飙(飚)”“拋(抛)下”“剎(刹)那”。但是没有对应简化字形的,不提倡类推简化,例如,“鴜鹭湖”的“鴜”。编校过程中,除了因字形十分相近而忽视以外,对繁体字、异体字、旧字形不熟悉,未意识到这些不是规范简化字,都容易忽视此类问题。

四、旧时通用字

有一些汉字目前没有通用关系,已经不再混用,但曾经是通用的,例如,“响澈(彻)了山谷”“碗的周遭圈围着磁(瓷)盘”“手帐(账)”“不懂人情么(吗)”“去罢(吧)”“他底(的)作品”“去那(哪)里”等等。这样的汉字,如果为了理解方便做出修改,那么标准需要统一,此处改而彼处未改反而造成错误。

五、多字、少字、颠倒字

多字、少字、颠倒字的情况基本上都是录入时疏忽且编校时漏掉而发生的。如果阅读过快,不够细致,就很容易遗漏此类问题。例如,“老的话(老人的话)”“向是没有温情的(一向是没有温情的)”“枪全是双着的(枪全是双的)”“我们绕着山去脚去(我们绕着山脚去)”“季伟刚刚慢吞吞地说(季伟刚慢吞吞地说)”“吃了三碗大粥(吃了三大碗粥)”等等。除了录入的疏忽以外,还有类似“鹭湖的忧郁(鴜鹭湖的忧郁)”这种文件转换时字符丢失的情况,因为很多发生在成稿之后,所以十分容易忽视。此外,还有成段的重复录入或缺失情况,重复比较容易发现,但缺失内容如果上下文连接没有明显突兀的话,就容易忽视。

六、前后不一致或知识性错误

这类错误通常也是录入错误导致的,但是引起的后果更严重。要避免前后不一致的情况,需要在编校过程中,留意上下文,例如,“沈(郑)泽亨”“唐老疙/唐老疙地(唐老疙瘩)”“腰别了(腰别子)”“赵宁义(赵守义)”“飞机厂(场)都让人家占领去了”“苏式瓦(苏多瓦)”“水芥子(水芹子)”“李宝贵(李志贵)”“老彰太太(老彭太太)”“老佣(用)人”。如果孤立地看局部,类似的问题就不太容易发现。

不同于文学作品中虚构的人物、名称,做到前后统一即可,真实著名的人名、地名一旦录入错误,则构成了知识性差错,例如,“金钊啸(金剑啸)”“傅作仪(傅作义)”“袁金鳢(袁金铠)”“会稽山(全稽山)”“秦(奉)天”等。对作品中真实的人名、地名有所了解有助于发现错误。

七、标点符号差错

“文学大系”中标点符号错误无非也分两种:有的是原始文献标点符号使用错误或不规范,因为当时还没有现在这样系统而明确的标点符号使用规范;有的则同汉字差错一样是录入的问题。多段引用仅在每段前使用上引号的情况,一旦里面再套用单引号,层级就很容易混乱。此外,形似的标点符号错录也时有发生,如““”错写为“””,“,”错写为“.”,“!”错写为“?”,或者将原始文献纸面的污渍识别为标点符号,等等。标点符号的处理在尽可能保留原貌的情况下,可能做不到完全符合当前的规范和习惯,尽量不影响理解。

八、体例格式错误

由于录入稿件中有时会输入回车命令,排版后易造成不当转行(如句子未完即分段)或者不当接排。涉及人物对话的文学作品中,转行正确显得尤为重要。例如:

“我们是老朋友了!……”王四麻子回味起过去的生活。“他是个‘种粮大户’吧!黑顶子山有很多地皮吧?”

“就是为这地皮死的咯……”

转行有误,应为:

“我们是老朋友了!……”王四麻子回味起过去的生活。

“他是个‘种粮大户’吧!黑顶子山有很多地皮吧?”

“就是为这地皮死的咯……”

“他是个‘种粮大户’吧!黑顶子山有很多地皮吧?”这句话如果连排就也变成了“王四麻子”所说,影响阅读时对内容的理解。

此外,如果命令出现问题,排版稿中正文汉字的长宽比就会发生变化,扁字变成正常字;正文行距、标题字距有时会发生变化;作品较短,页眉需不断转换,一旦疏漏,就容易和正文标题不对应;各篇作品落款的行文方式、体例格式是否统一,统一到何种程度……一系列体例格式方面细微而复杂的问题,稍有疏忽就容易忽略,尤其体量极大的情况下,做到全部统一实属不易。

九、辅文问题

与“文学大系”的正文不同,辅文是编者等后期为出版而创作的,因而其本身不存在校对原始文献的问题,但要紧紧围绕正文内容,以免出现不一致的情况。例如,丛书的“总序”和各分卷的“导言”出自不同编者笔下,篇幅均较长,且为了说明问题,都引用了各分卷中正文很多篇目的部分内容,极易造成引文内容的出入和作品介绍及归类的错误等。第一,辅文中引文通常引自原始文献,照录过程中可能存在疏忽,产生出入;第二,正文经过编辑校对,或多或少已经做了局部修改,与原始文献存在细微差别;第三,总序和导言诞生时间不一样,总序产生于前几卷出版之时,却引用了尚未出版的后几卷的内容,编辑无从核实,待后几卷出版时新的导言同样引用了这几卷正文中的部分内容,如果总序和导言引用了相同的内容,合在一起后引用的如果不一致就很可能暴露出问题。此外,一旦篇目所在分册或类别发生调整,目录甚至总序、导言中相应的说明文字也都要相应调整。这些十分考验编辑的统稿能力和全局观念,也是类似丛书出版面临的共性问题。如果考虑不周,出版后就很难挽回。

除了文前和文后辅文以外,注释、页眉等的设置也要保证准确,避免出现矛盾或知识性差错和体例不统一,影响丛书整体感。

以上九类问题,是笔者质检中发现的文献类图书的典型编校难点和易错点,既有与其他书稿的共性问题,也有个性问题。遇到的问题越多,日后解决问题的思路就越多,对问题的敏感度越高。经过总结,既希望与广大同人交流分享,也意在鞭策自己,避免在同一个地方摔倒,进一步提高图书质量。

猜你喜欢

别字大系繁体字
“人生到处知何似?应似飞鸿踏雪泥”
——《西泠印社社藏名家大系·李叔同卷:印藏》评介
“盛世修典
——中国历代绘画大系”先秦汉唐、宋、元画特展
哈哈镜
汉字繁简再引热议
《兰亭集序》中的“错别字”
《兰亭集序》里别字多
50枚纯银《中国百年银元珍藏大系》1折限时领取
台网友鼓动“繁体字申遗”
不孕不育等2则
初恋