模板選型翻譯 英漢翻譯模板的標(biāo)準(zhǔn)化方案及其應(yīng)用
日期:2023-03-11 12:39:36 / 人氣: 447 / 發(fā)布者:成都翻譯公司
在機(jī)器翻譯系統(tǒng)中,模板可以作為一種知識表示的方法,其規(guī)模的大小和組織的策略將極大地影響系統(tǒng)的整體性能。基礎(chǔ)上開發(fā)高質(zhì)量的英漢翻譯系統(tǒng)提供了可能性。譯模板庫的基礎(chǔ)上開發(fā)高質(zhì)量的英漢翻譯系統(tǒng)提供了可能性。然后再利用通用模板匹配替換算法進(jìn)行從源語言到目標(biāo)語言的翻譯[25]。下面將討論一個建立英漢翻譯模板的初步標(biāo)準(zhǔn)化方案。智能化英漢翻譯系統(tǒng)IMT/EC.基于通用模板匹配替換方法的英漢翻譯系統(tǒng).在機(jī)器翻譯系統(tǒng)中模板選型翻譯,模板可以作為知識表示的方法,其規(guī)模和組織策略將極大地影響系統(tǒng)的整體性能。本文討論了英漢翻譯模板的標(biāo)準(zhǔn)化,提出了初步方案,并將其應(yīng)用于英漢翻譯系統(tǒng)的設(shè)計和實現(xiàn)。已取得初步成功,并驗證了方案的可行性。它為基于大規(guī)模模板庫開發(fā)高質(zhì)量的英漢翻譯系統(tǒng)提供了可能。在2005年舉辦的863評測中,本文開發(fā)的英漢翻譯系統(tǒng)達(dá)到的水平:對話翻譯手冊評測的忠誠度和流暢度為73.62 68. 16章翻譯手冊評價忠誠度流暢度和流暢度分別為41.16和31.45。:機(jī)器翻譯;翻譯模板;標(biāo)準(zhǔn)化 標(biāo)準(zhǔn)化策略 英漢翻譯模板及其應(yīng)用 摘要:機(jī)器翻譯系統(tǒng),模板可以作為知識的表示方法,極大地影響整個系統(tǒng)的性能。paperstudies 標(biāo)準(zhǔn)化問題 英漢翻譯模板 初步策略 比較成功的英漢翻譯系統(tǒng),我們展示了開發(fā)基于大型模板庫的高質(zhì)量英漢翻譯系統(tǒng)的可能性?!?63》評測英漢翻譯系統(tǒng)論文達(dá)到7分 分別。:機(jī)器翻譯;翻譯模板;標(biāo)準(zhǔn)化 標(biāo)準(zhǔn)化策略 英漢翻譯模板及其應(yīng)用 摘要:機(jī)器翻譯系統(tǒng),模板可以作為知識的表示方法,極大地影響整個系統(tǒng)的性能。paperstudies 標(biāo)準(zhǔn)化問題 英漢翻譯模板 初步策略 比較成功的英漢翻譯系統(tǒng),我們展示了開發(fā)基于大型模板庫的高質(zhì)量英漢翻譯系統(tǒng)的可能性。《863》評測英漢翻譯系統(tǒng)論文達(dá)到7分 分別。:機(jī)器翻譯;翻譯模板;標(biāo)準(zhǔn)化 標(biāo)準(zhǔn)化策略 英漢翻譯模板及其應(yīng)用 摘要:機(jī)器翻譯系統(tǒng),模板可以作為知識的表示方法,極大地影響整個系統(tǒng)的性能。paperstudies 標(biāo)準(zhǔn)化問題 英漢翻譯模板 初步策略 比較成功的英漢翻譯系統(tǒng),我們展示了開發(fā)基于大型模板庫的高質(zhì)量英漢翻譯系統(tǒng)的可能性。《863》評測英漢翻譯系統(tǒng)論文達(dá)到7分 模板可以作為知識的表示方法,極大地影響整個系統(tǒng)的性能。paperstudies 標(biāo)準(zhǔn)化問題 英漢翻譯模板初始策略 比較成功的英漢翻譯系統(tǒng),我們展示了基于大型模板庫開發(fā)高質(zhì)量英漢翻譯系統(tǒng)的可能性?!?63》評測英漢翻譯系統(tǒng)論文達(dá)到7分 模板可以作為知識的表示方法,極大地影響整個系統(tǒng)的性能。paperstudies 標(biāo)準(zhǔn)化問題 英漢翻譯模板 初步策略 比較成功的英漢翻譯系統(tǒng),我們展示了開發(fā)基于大型模板庫的高質(zhì)量英漢翻譯系統(tǒng)的可能性?!?63》評測英漢翻譯系統(tǒng)論文達(dá)到7分
但是,由于自然語言的極端復(fù)雜性,目前還沒有一種分析策略可以完全解決機(jī)器翻譯系統(tǒng)中涉及的各種問題。為了綜合利用這三種方法的優(yōu)點,克服各自的問題,一種常用的方法是將多種翻譯策略有機(jī)地結(jié)合起來,實現(xiàn)各種策略之間的優(yōu)勢互補(bǔ),提高系統(tǒng)的性能[15-17]。在機(jī)器翻譯的研究中,除了多種策略的綜合集成,另一個重要的方法是增加處理粒度[18]。用中心詞標(biāo)注的目的是為了簡化處理句子結(jié)構(gòu),解決機(jī)器翻譯的歧義?;趬K的方法是近年來自然語言領(lǐng)域出現(xiàn)的一種新思想[19]。目前,對單語詞塊的研究已經(jīng)取得了很多成果[21-24]。可以代替 Chunk 進(jìn)行機(jī)器翻譯的一個概念是模板。簡單的說,一個模板可以看成是一個有變量的Chunk,一個Chunk可以看成是一個沒有變量的模板。使用模板而不是塊可以將許多塊合并為一個模板。因此,作為特例,語料庫中模板的頻率大于Chunk的頻率。因此,為了表征一個語料庫中的語言現(xiàn)象,所需的模板數(shù)量將遠(yuǎn)少于所需的Chunk數(shù)量。盡管模板可能比 Chunk 具有更多的歧義,但通常可以解析模板中的單個模板。
本文討論了模板的定義,討論了英漢翻譯模板的標(biāo)準(zhǔn)化,并提出了初步方案,結(jié)合句法分析技術(shù)和模板匹配替換通用算法,應(yīng)用于英漢翻譯系統(tǒng)的設(shè)計和實現(xiàn)。 . 已取得初步成功,并驗證了方案的可行性,從而為基于大型英漢翻譯模板庫開發(fā)高質(zhì)量的英漢翻譯系統(tǒng)提供了可能。有許多模板結(jié)構(gòu)在各種自然語言中被重復(fù)使用。抽象地講,模板可以看作是具有一定穩(wěn)定性的語言認(rèn)知結(jié)構(gòu)。每個模板結(jié)構(gòu)通常由幾個常量和變量組成。例如,英語短語“give sth. sb”。是一個模板結(jié)構(gòu),單詞“give”和“to”是常量,“sth”。和“某人” 是一個變量。當(dāng)一個模板中的所有變量都替換為它們能得到的常量值時,得到的詞序列稱為模板的一個實例。例如,“give me”是“givesth. sb”的一個實例。為了某概念,本文還引用了一些沒有變量的特殊短語或句子作為模板。來自北京市自然科學(xué)基金形式語言學(xué)項目(No.4052005),北京市教委科技發(fā)展項目(No.Km2))作者信息:李玉健,男,1968年出生,博士,副教授,主要研究方向為自然語言處理、模式識別、生物信息學(xué)。模板中的常量項為終結(jié)符,模板中的變量項為非終結(jié)符。
一個源語言模板(ST,Source Template)往往有對應(yīng)的另一種語言的目標(biāo)語言模板(TT,Target Template)。源語言模板和目標(biāo)語言模板形成的有序?qū)Α癝TTT”通常稱為翻譯模板。在傳統(tǒng)的翻譯模板概念中,通常要求一個源語言模板只能有一個目標(biāo)語言模板,并且源語言模板的非終結(jié)符和目標(biāo)語言模板的非終結(jié)符必須對應(yīng)一個-一,數(shù)相等??紤]模板類別標(biāo)注的問題。這里,翻譯模板被定義為源語言模板和目標(biāo)語言中所有可能的目標(biāo)模板的集合。所以,如果考慮模板的類別標(biāo)注模板選型翻譯,每個類別標(biāo)注下只允許一個譯文,從形式上看,一個翻譯模板可以參考以下標(biāo)準(zhǔn)結(jié)構(gòu)某描述: Source Template POS tag TargetTemplate POStag TargetTemplate POStag TargetTemplate 其中“POS tag”表示類別標(biāo)簽的代碼。如果使用形式語言的術(shù)語,那么每個源語言模板可以看成如下結(jié)構(gòu):(str1) 顯然,每個對應(yīng)的目標(biāo)語言模板也可以寫成:(str2) 其中在符號串(str1)和(str2))中,有如下約束:是任意r+1個整數(shù)從小到大排列,每個 A 終止符(可能是空字符),是源語言中的 r 個非終結(jié)符,它們可以相同也可以不同;它是任意m+1個從小到大排列的整數(shù),和一個終止符(可以是空字符),是目標(biāo)語言中的m個非終結(jié)符,它們可以相同也可以不同;出現(xiàn)的某個非終結(jié)符具有一定的確定性轉(zhuǎn)換關(guān)系,并且可能不相等。
根據(jù)上述模板的定義,以具有兩個類別注釋的英漢模板為例,描述如下:comment about NP vi。動詞類型,“n”表示名詞類型。如果沒有特別說明,下面使用的詞性標(biāo)簽與英語語法中使用的相同。由于之前定義的翻譯模板不僅允許一個源語言模板有多個不同的對應(yīng)的目標(biāo)語言模板,而且允許每個對應(yīng)的目標(biāo)語言模板中存在一個非終結(jié)符和源語言模板中存在一個非終結(jié)符. 多對多和多對一的關(guān)系比傳統(tǒng)的模板定義更能合理地反映實際的自然語言現(xiàn)象。此外,由于人類一生能夠?qū)W習(xí)和構(gòu)建的語言認(rèn)知結(jié)構(gòu)非常有限,可以想象,與語言認(rèn)知結(jié)構(gòu)相關(guān)的模板數(shù)量也非常有限,盡管這個數(shù)量可能達(dá)到數(shù)萬或數(shù)百數(shù)千。,即使是幾千萬,但對于建立大型翻譯模板庫來說應(yīng)該是一個有限合理的數(shù)字,不是一個遙不可及的天文數(shù)字。有了足夠的模板,給定的句子就可以作為源語言模板的組合進(jìn)行分析,然后可以使用通用的模板匹配替換算法將源語言翻譯成目標(biāo)語言[25]。但是,針對某些兩種語言構(gòu)建實際的大規(guī)模翻譯模板庫并不容易。
下面將討論建立英漢翻譯模板的初步標(biāo)準(zhǔn)化方案。首先,英漢翻譯模板根據(jù)源語言部分分為靜態(tài)模板和動態(tài)模板。靜態(tài)模板是完全由終止符組成的短語。它們總是作為一個整體使用。嚴(yán)格來說,在任何語境中,都只能有這樣一種固定的組合搭配,不會因為語境的變化而分開。不同的意義單位。例如:人工智能 n.人工智能; 機(jī)器翻譯 機(jī)器翻譯;動態(tài)模板是指除靜態(tài)模板之外的任何模板,也就是說除了所有帶有非終結(jié)符的模板外,還包括那些隨機(jī)使用的模板。根據(jù)上下文,有時可能會分離或重新組合總詞短語。一個完全由終止符組成的動態(tài)模板的例子如下:一點; 模板之所以是動態(tài)模板,是因為“一點”還可以組合成其他模板,比如:littleADJ adj。一點點ADJ;暫時的 一會兒; 顯然,從一個給定的英語句子中分析出一個靜態(tài)模板是非常容易的,因為靜態(tài)模板在任何上下文中都可以看作是一個固定的搭配短語,所以可以通過簡單的詞比較匹配技術(shù)來確定。但是,如果要確保一個英語句子使用某個動態(tài)模板,就不能簡單地使用詞匹配和詞性匹配方法。
目前好的句法分析算法一般都有較高的時間復(fù)雜度或空間復(fù)雜度要求。如果同時啟用所有模板進(jìn)行分析,很難得到滿意的結(jié)果,尤其是在動態(tài)模板規(guī)模比較大的情況下。高效的。因此,對動態(tài)模板進(jìn)行分類、排序和索引,以便根據(jù)需要調(diào)用它們是必不可少的步驟??紤]到句法分析的需要,本文就如何組織大型英漢翻譯模板提出如下初步標(biāo)準(zhǔn)化方案: 根據(jù)前兩項是終結(jié)符還是非終結(jié)符,動態(tài)模板進(jìn)行劃分分為以下五類,分別使用TT、TN、NT、NNT和NNN,其中“TT” 表示所有項都是終結(jié)符的模板(即英文單詞),“TN”表示第一項的所有項,第二項是非終結(jié)符模板,“NT”表示所有的第一項都是非終結(jié)符終端和非終端,第三個是終端。“NNN”表示所有其他模板。TT模板通過第一項排序并建立索引,TN模板通過第一項排序并建立索引,NT模板通過第二項排序并建立索引,NNT模板通過第三項排序并建立索引索引;NNN 不需要創(chuàng)建索引,因為這樣的模板總數(shù)并不多,即使全部用于句法分析,系統(tǒng)的整體效率也不顯著。
系統(tǒng)首先利用輸入句中的終止符從靜態(tài)模板庫和五種動態(tài)模板庫中檢索可能的模板。搜索的基礎(chǔ)是模板中的所有常量必須同時在輸入語句中依次(但可能不連續(xù))。出現(xiàn);然后使用標(biāo)準(zhǔn)的Earley算法分析句子的模板嵌套結(jié)構(gòu)[26];*后,通過模板匹配和替換實現(xiàn)英文句子到中文句子的翻譯。整個基于模板的英漢翻譯系統(tǒng)的框架如圖1所示。 在2005年舉辦的863評測中,目前系統(tǒng)在開發(fā)集和測試集上的性能指標(biāo)如表1所示。
雖然由于人力物力的限制,程序只取得了初步的成功,但是考慮到作者的翻譯引擎設(shè)計完全獨立于模板庫,如果能夠結(jié)合一些模板自動提取算法,也將加強(qiáng)大型模板庫建設(shè)的投入,屆時該方案有望對機(jī)器翻譯技術(shù)的發(fā)展產(chǎn)生重要影響,而基于大型模板庫的機(jī)器翻譯技術(shù)也將達(dá)到新的高度。智能英漢翻譯系統(tǒng)IMT/EC。中國科學(xué)[J], pp.187-194,1989. Sadler.Theoretical Basis MiMo.Machine Translation[J], Vol.5, No.3, pp.195-222, 1990. MRosetta . 作文翻譯[M].Kluwer Academic Publishers,荷蘭多德雷赫特,1994. KoichiTakeda?;谀J降纳舷挛臒o關(guān)語法 MachineTranslation。過程 第 34 屆ACL pp.144--151,199 年6 月6. Cocke、Stephen DellaPietra、Vincent DellaPietra、Jelinek、Robert PSRoossin。統(tǒng)計方法機(jī)器翻譯。計算語言學(xué) 1990,16(2): 79-85. Brown,Stephen DellaPietra, Vincent DellaPietra, Robert StatisticalMachine Translation: Parameter Estimation. Computational Linguistics 1993,19(< 79-85. Brown、Stephen DellaPietra、Vincent DellaPietra、Robert StatisticalMachine 翻譯:參數(shù)估計。計算語言學(xué) 1993,19(< 79-85. Brown、Stephen DellaPietra、Vincent DellaPietra、Robert StatisticalMachine 翻譯:參數(shù)估計。計算語言學(xué) 1993,19(<
- 上一條招聘翻譯模板下載 招聘簡章模板??免費版
- 下一條美國佛羅里達(dá)州駕照翻譯件模板 四川眉山的曹先生在我處翻譯了美國明尼蘇達(dá)州駕照,現(xiàn)已成功將國外駕照換成國內(nèi)駕照。
相關(guān)閱讀Relate
熱門文章 Recent
- 大專畢業(yè)翻譯模板 浙江科技學(xué)院成績單翻譯_學(xué)位證書翻譯_畢業(yè)證書翻譯服務(wù)2023-03-11
- 翻譯碩士復(fù)試聯(lián)系導(dǎo)師模板 2016MBA聯(lián)考復(fù)試聯(lián)系導(dǎo)師:4個郵件模板2023-03-11
- 高中學(xué)校畢業(yè)證翻譯模板 什么是自考本科畢業(yè)證,我是今年高中畢業(yè)生2023-03-11
- 護(hù)照里的注意事項翻譯模板 護(hù)照翻譯件去哪辦?2023-03-11
- 翻譯兼職個人簡歷模板 長沙英語翻譯大學(xué)生個人簡歷模板2023-03-11
- 軍官證翻譯模板 北京生育津貼領(lǐng)取流程2023-03-11
- 英語四級作文圖表模板翻譯 2012英語四級寫作驚現(xiàn)新題型 舊方法一樣能搞定2023-03-11
- 泰語翻譯簡歷模板 韓語專業(yè)個人簡歷模板2023-03-11
- 翻譯保密合同模板 2021年保密協(xié)議書范文七篇2023-03-11
- 藥品生產(chǎn)許可證翻譯模板 歐盟GMP認(rèn)證詳細(xì)介紹2023-03-11