关于量词的日中机器翻译规则的研究
2016-01-04欧慧娟
欧慧娟
(上海第二工业大学,中国 上海201209)
1 序论
量词是表示人、事物或动作的量的词。如“一个人、一瓶酒”中的“个、瓶”等。日语里称之为“助数词”。为了更好地分析,本文中统一称之为量词。日中量词有很多共同之处,也有很多不同之处。因此,量词的日中翻译过程中很容易产生误译。但是,目前对日中量词的翻译研究仍然很少,从机器翻译的角度考察的研究则更加匮乏。
因此,本文提出量词的日中机器翻译规则,并从语料库中抽取例句评价翻译规则。
2 量词的日中翻译规则
2.1 考察对象量词的限定
日语量词数量很多,笔者把 《数え方の辞典》的第一章中大约4600个物品名词以及使用的量词电子化,统计量词的数量及使用频率。结果为:量词共540个,使用频率100次以上14个,使用频率100次以下526个。本文只考察使用频率100次以上的14个量词。这14个量词如下:本、枚、個、つ、台、点、基、匹、株、粒、軒、丁、袋、回。
2.2 常用量词的翻译规则
以下是根据量词所修饰的名词的意味属性设置的翻译规则。名词前面的数字是《日本語語彙大系》中的意味属性序号。具体翻译规则如下:
一.本
(1)672植物(個体);687芽·苗⇒译语:棵
(2)421トンネル;417 交通路;1147 情報;815 糸;958 縄·鎖 783 繊維;2567 線;816 布;592 腕;599 足(下肢)⇒译语:条
(3)695 枝;877 柱·梁;923 楽器;955 棒;956 管·枠;957 針金;862タバコ;903 灯火;608 指;633 毛;794 固体燃料 ⇒译语:根
(4)1061映画·映像;1044小説 ⇒译语:部
(5)943刃物;836雨具 ⇒译语:把
(6)746液体;756気体;857飲み物 ⇒译语:瓶
(7)917文具;961武器 ⇒译语:支
(8)1552放送;1548電話;905瓶·壺·盆 ⇒译语:个
(9)763商品 ⇒译语:件
(10)1058演劇;1059歌劇 ⇒译语:场
(11)647牙;641歯·歯茎 ⇒译语:颗
(12)950作業具(接続)⇒译语:枚
(13)698花(本体)⇒译语:朵
(14)1048絵画 ⇒译语:卷
二.枚
(1)770 紙;696 葉;934 貨幣;1052 写真·画像;930 札券 ⇒译语:张
(2)818衣服(本体)(820衣服(本体(下半身))を除く)⇒译语:件
(3)820衣服(本体(下半身)826帯;827襟巻き829鉢巻 ⇒译语:条
(4)816 布;773 板;777ガラス;838 食料;624 筋肉 ⇒译语:块
(5)833履き物;911椀·杯·皿 ⇒译语:个
(6)837寝具 ⇒译语:床
(7)1048絵画 ⇒译语:幅
(8)891門;884建具 ⇒译语:扇
三.個
(1)539爬虫類·両生類;549昆虫 ⇒译语:只
(2)826帯;827襟巻き;828ネクタイ;829鉢巻 ⇒译语:条
(3)927記章;935印章; ⇒译语:枚
(4)773板;777ガラス;729石;725宝石 ⇒译语:块
(5)531星;飴 ⇒译语:颗
(6)上記以外のもの ⇒译语:个
四.つ
(2)特例:「Nの一つ」の場合 ⇒译语:之一
(3)上記以外のもの ⇒译语:个
五.台
(1)963機械一般;968電気機械;923楽器 ⇒译语:台
(2)988乗り物(本体(移動陸圏))⇒译语:辆
(3)990乗り物(本体(移動空圏))⇒译语:架
华法林相关的紫趾综合征发病机制尚未明确,一种理论认为[6]:华法林对毛细血管有直接毒性,导致血管扩张性、渗透性加强,血液渗透至毛细血管外,因而有网状青斑、紫癜、青紫色团块等症状出现。也有研究认为[7],华法林可以导致微循环的胆固醇微栓塞,引起动脉粥样硬化、斑块破溃,导致胆固醇微粒的释放,进一步阻塞小动脉,造成表皮的缺血性梗塞。上述理论均源自于组织活检的结果。
(4)975カメラ ⇒译语:部
(5)898台 ⇒译语:张
六.点
(1)2590値·額;1445評価;2596計算値 ⇒译语:分
(2)1099記号(符号)⇒译语:个
(3)761 物品;819衣服(本体(上半身));1050工芸 ⇒译语:件
(4)1048絵画 ⇒译语:幅
(5)1052写真·画像 ⇒译语:张
(6)2369雲;758水蒸気 ⇒译语:朵
(7)上記以外のもの ⇒译语:点
七.基
(1)963機械一般;968電気機械;923楽器 ⇒译语:台
(2)~銃、~砲、鉾 ⇒译语:支
(3)220神仏;938像·書画 ⇒译语:尊
(4)988乗り物(本体(移動陸圏));954車 ⇒译语:辆
(5)903灯火 ⇒译语:盏
(6)420橋;928碑;456墓地 ⇒译语:座
(7)990乗り物(本体(移動空圏))⇒译语:架
(8)ミサイル ⇒译语:颗
(9)上記以外のもの ⇒译语:个
八.匹
(1)550 虫(その他);543 魚;竜;犬;蛇 ⇒译语:条
(2)816布;⇒译语:匹
(3)539 爬虫類·両生類(蝮、蛇を除く);548虫(550虫(その他)を除く);
222魔物·化け物(竜を除く);537獣(犬、狼を除く)⇒译语:只
(4)85子·孫·子孫 ⇒译语:个
九.“株”,修饰任何名词都译为:棵
十.粒
(1)702 種子;730 砂;840 穀物;800 薬品;722 塩;2579 粒 ⇒译语:粒
(2)701実;854果物;844乾物·漬物等;670卵;85子·孫·子孫⇒译语:个
(3)746液体;652涙;651汗 ⇒译语:滴
(4)725宝石;729石;855菓子 ⇒译语:颗
十一.軒
(1)430店舗等⇒译语:家
(2)868部屋;387家庭;439工場 ⇒译语:个
(3)865家屋(本体)⇒译语:栋
十二.丁
(1)847料理 ⇒译语:份
(2)923楽器 ⇒译语:台
(3)943刃物;945農具 ⇒译语:把
(4)961武器;903灯火 ⇒译语:支
(5)942工具;917文具 ⇒译语:个
(6)820衣服(本体(下半身))⇒译语:条
十三.“袋”修饰任何名词都译为:袋
十四.“回”修饰任何名词都译为:回
3 翻译规则的评价和问题分析
3.1 翻译规则的评价
鉴于日语“袋、回”与汉语的“袋、回”用法几乎相同,所以本文只检验翻译规则1-12。笔者在语料库 《現代日本語書き言葉均衡コーパス》,抽取775句子,模拟日中机器翻译程序进行翻译。并把结果与“金山快译个人版1.0”进行比较。检验翻译规则时,只考考察量词的译语是否正确,其它部分假设全部翻译正确。
实验结果,本翻译规则翻译正确例句680句,正确翻译率达87.5%,“金山快译个人版1.0”翻译正确例句260句,正确率仅有28.0%,本文的翻译规则正确率比“金山快译个人版1.0”的正确率高出了了59.5%,显示了本翻译规则的有效性。
下面用例文说明实验的评价方法。例句:部屋の明かりは蝋燭一本しかない。
金山译:房间的光只有一支蜡烛。本稿译:房间的灯火只有一根蜡烛。
关于实验方法的说明:“金山快译个人版1.0”把此例文的“一本”正确地翻译为“一支”。另外,本翻译规则,根据被修饰语“蝋燭”是属于“灯火”,与“本”修饰的名词分类号(3)的翻译条件相符,得出正确译文“一根”。
3.2 实验评价的问题考察
关于误译例句的考察,可以归纳出下列3个主要的问题点。
(1)被修饰对象的意味属性的相关问题。有部分例句根据被修饰对象的意味属性所对应的翻译规则翻译,得出错误译语。例如:
A、テーマに関係ないものは木の葉一枚くわえることはできないんですね。
现译:与题目无关内容不能添加一张树叶。正译:与题目无关的内容不能够画蛇添足。
例A中根据修“木の葉”的意味属性,与“枚”修饰的名词分类号(1)相符,得出译语“张”。一般情况下“枚”的修饰对象为“木の葉”时译成“张”是正确的,但例A中译为“画蛇添足”则更好。这属于惯用语的翻译问题,应结合句子的表达意义进行翻译。因此,在机器翻译中把这类惯用语的译文录入规则库即可以解决此误译问题。
(2)名词的意味属性不足的问题。有些例文根据被修饰名词的意味属性未能搜索到对应的翻译规则,因此没能得到正确的译文。例如:B、一本のキーをつかんだ。
現訳:抓住了那一?钥匙 正訳:抓住了那一根钥匙。
例B中,根据 “キー”的属性,未能找到对应的翻译规则。因此需要解决这问题,必须补充名词属性分类。
(3)日中表达习惯的差异问题。有些名词在日语里使用量词修饰,但翻译成汉语时通常不用翻译量词。例如:C、実は私自身ではまだ何一つ成功してゐるとは思はない。現訳:实际上我也不认为我有取得一个成功。正訳:实际上我也不认为我取得了成功。
例C与本研究中“つ”的名词属性(3)符合,得出译文“个”,表达不自然。因为汉语中“成功”等名词习惯上不用量词修饰。因此,为了提高翻译正确率,需要设定这类的特殊翻译规则。
可见,本研究还有一些不足的地方,要提高翻译精度,还需要补充完善翻译规则。然而,对目前存在的误译问题的分析,可以得出一些启发。这也是今后的课题。
4 结论
本文先提出量词的日中翻译规则,并用例句对一部分的翻译规则进行评价。最后,对评价结果中存在的问题进行了分析。
本翻译规则的评价结果为整体的翻译正确率达到了87.5%,比“金山快译个人版1.0”的28.0%高出了59.5%,表明了本翻译规则的有效性。
本研究中的翻译规则不仅是对机器翻译,对人工翻译也可以提供帮助。
但是,因为时间和设备的限制,未能在机器上进行评价。这是今后的课题。
[1]曾岚.2001.日语量词的翻译问题[J].福建外语,(4):58-62.
[2]飯田朝子.2004.数え方の辞典[M].小学館.
[3]郭先珍.2002.现代汉语量词用法词典[M].语文出版社.
[4]池原悟、宮崎正弘(他).1997.日本語語彙大系[M].岩波書店.