您现在的位置: 范文先生网 >> 理工论文 >> 自动化论文 >> 正文

机器翻译中汉语动结式生成的过程和困难

时间:2007-1-20栏目:自动化论文

   1.引言
  当电子计算机1946年问世的时候,人们就提出了机器翻译的想法,并且在1954年进行了第一次机器翻译试验。然而与后来的各种语言信息处理研究和应用(语言信息检索、文本自动分类、自动文摘、信息提取等等)相比,机器翻译却是进展最慢的。学者们倾其大半生精力、商家投入为数可观的资金,经历五十多年不懈的研究和开发,得到的成果或者产品却常常不能令人满意。
  原因是什么呢?从语言研究的角度来说,机器翻译系统分析、理解和生成自然语言的能力都还不到位,处理不了的语言现象很多:有的是句子结构层次弄错了,有的是结构关系弄错了,有的是成分之间的语义关系弄错了,有的是词义辨识错了,还有的错误是源语和目标语之间的对比差异造成的。下面是机器翻译处理汉语动结式不成功的几个例子(来自三个机器翻译系统)。
  先看生成的情况,机器翻译目前还很难生成汉语的动结式,所以我们很少在汉语译文里见到含有动结式的句子。对于下面这个英译汉的例子,三个系统都不能翻译成“他把地扫干净了”:  
He  swept  the  floor  clean.   * 他干净地扫地了。
               * 他清扫清洁的地板。
               * 他清扫地板干净。

  
  再看汉语动结式翻译成英语的例子,它们可以说明目前机器翻译系统分析和理解汉语动结式的能力:  
他踢坏了三双鞋。 *He  plays  three  pairs  of  evil  shoes.
          *He  kicked  three  pairs  of  shoes  bad.
          *Him  kick  spoil  3  pairs  of  shoes.
这段路把妈妈走累了。*The  way  make  mother  tired  after  the  walk.
         *This  section  of  way  was  walked  mother  tired(ly).
            *This  road  mother  walk  tired.
大家吃腻了剩菜。*Everybody  has  fedded  up  with  the  leftovers.
         *That  everybody  ate  greasy(ly)surplus  vegetable.
        *All  eat,is  loathe  to  leave  vegetable.

  
  下面我们只讨论动结式的生成问题,其中不包括以下三种情况:1)补语用“得”字连接的;2)补语虚化的,如:“抓住”、“买着”、“看完”、“办成”等;3)补语和动结式的宾语有固定搭配关系的,如:“说走了板”、“看愣了神”、“苦出了头”等等。
    2.机器翻译中的动结式问题
  为了说明机器翻译如何处理动结式述语结构,我们需要先看看机器翻译的过程。下图说明了机器翻译的原理,也是机器翻译的整个过程。
  附图
    图1 机器翻译的过程
  显然,这是一个理想化的机器翻译过程。从S到I再到T的过程是中介语言的翻译策略,中介语言通常是某种独立于源语和目标语的逻辑表达式。如果是英译汉,对英语的分析和理解要从表层深入到底层,得到描述句子意义的中介语言逻辑表达式。同样地,汉语也要从底层到表层一步一步生成。分析时从表层到底层走得越深,生成时从底层回到表层的过程也就越复杂。因此,需要分别对这两种语言的句法和语义系统作深入的研究。实际上目前大部分机器翻译系统都作不到这个程度,常见的翻译策略是直接法或转换法,或直接和转换相结合的混合方法。我们可以通过一个英译汉的例子对直接法、转换法和中介语言法这三种翻译策略作一个比较:
  You  get  good  re

[1] [2] [3] [4] [5] [6] [7] 下一页

下页更精彩:1 2 3 4 下一页