基于模板的統(tǒng)計(jì)翻譯模型研究及漢英機(jī)器翻譯系統(tǒng)實(shí)現(xiàn)(劉群).ppt 104頁
日期:2023-03-11 12:39:36 / 人氣: 491 / 發(fā)布者:成都翻譯公司
也就是說,一個(gè)源語言結(jié)點(diǎn)的模板角色標(biāo)記只與產(chǎn)生該結(jié)點(diǎn)的源語言上下文無關(guān)規(guī)則有關(guān)。1990年代早期在IBM公司舉行的DARPA機(jī)器翻譯評(píng)價(jià)時(shí),我們曾經(jīng)預(yù)計(jì)只有很短(10個(gè)詞左右)的句子才可以用統(tǒng)計(jì)方法進(jìn)行解碼,即使那樣,每個(gè)句子的解碼時(shí)間也可能是幾個(gè)小時(shí)。詞典特征(MX):計(jì)算給定的輸入輸出句子中有多少詞典中存在的共現(xiàn)詞對(duì)。聯(lián)合使用兩個(gè)模型效果好于單獨(dú)使用翻譯模型,因?yàn)楹笳呷菀讓?dǎo)致一些不好的譯文。將對(duì)齊概率理解為標(biāo)注概率:語法樹的翻譯過程理解為對(duì)源語言句法樹的節(jié)點(diǎn)進(jìn)行標(biāo)注,建立句法樹標(biāo)注的概率模型,對(duì)轉(zhuǎn)換模板——圖進(jìn)行標(biāo)注的過程顯示源語言語法樹的每個(gè)節(jié)點(diǎn)的轉(zhuǎn)換模板標(biāo)簽: vbnun np ap np vp 比較其他工廠的做法 (a) (b) (c) (d) (e) (f) (g) (a) (b) 轉(zhuǎn)換模板問題的注解:一個(gè)轉(zhuǎn)換模板作用于多個(gè)源語言節(jié)點(diǎn)的情況下,無法區(qū)分不同源語言節(jié)點(diǎn)的標(biāo)簽。例如:在上面的例子中,模板(a)同時(shí)作用于兩個(gè)節(jié)點(diǎn) vp 和 v。在計(jì)算標(biāo)記概率時(shí),
與其他源語言節(jié)點(diǎn)的語法標(biāo)記和模板角色標(biāo)記無關(guān)。所以:這里,N是源語言語法樹上的任意節(jié)點(diǎn),Syn(N)是節(jié)點(diǎn)對(duì)應(yīng)的語法標(biāo)簽,Role(N)是節(jié)點(diǎn)對(duì)應(yīng)的模板角色標(biāo)簽。對(duì)應(yīng)的參數(shù)歸一化條件為:這里Syn是任意語法標(biāo)簽,Role是任意模板角色。Template Role Tagging-Probability Model 2 假設(shè)每個(gè)源語言節(jié)點(diǎn)的模板角色標(biāo)簽只與該節(jié)點(diǎn)及其子節(jié)點(diǎn)的句法標(biāo)簽相關(guān),與其他源語言的語法標(biāo)簽和模板角色標(biāo)簽無關(guān)語言節(jié)點(diǎn)。即,換句話說,源語言節(jié)點(diǎn)的模板角色標(biāo)簽僅與生成節(jié)點(diǎn)的源語言的上下文無關(guān)規(guī)則相關(guān)。其中,N為源語言語法樹上的任意節(jié)點(diǎn),Syn(N)為節(jié)點(diǎn)對(duì)應(yīng)的語法標(biāo)簽基于模板的統(tǒng)計(jì)翻譯,Role(N)為節(jié)點(diǎn)對(duì)應(yīng)的模板角色標(biāo)簽。對(duì)應(yīng)的參數(shù)歸一化條件為:這里Syn是任意語法標(biāo)簽,Role是任意模板角色。Template Role Tagging-Probability Model 2 假設(shè)每個(gè)源語言節(jié)點(diǎn)的模板角色標(biāo)簽只與該節(jié)點(diǎn)及其子節(jié)點(diǎn)的句法標(biāo)簽相關(guān),與其他源語言的語法標(biāo)簽和模板角色標(biāo)簽無關(guān)語言節(jié)點(diǎn)。即,換句話說,源語言節(jié)點(diǎn)的模板角色標(biāo)簽僅與生成節(jié)點(diǎn)的源語言的上下文無關(guān)規(guī)則相關(guān)。其中,N為源語言語法樹上的任意節(jié)點(diǎn),Syn(N)為節(jié)點(diǎn)對(duì)應(yīng)的語法標(biāo)簽,Role(N)為節(jié)點(diǎn)對(duì)應(yīng)的模板角色標(biāo)簽。對(duì)應(yīng)的參數(shù)歸一化條件為:這里Syn是任意語法標(biāo)簽,Role是任意模板角色。Template Role Tagging-Probability Model 2 假設(shè)每個(gè)源語言節(jié)點(diǎn)的模板角色標(biāo)簽只與該節(jié)點(diǎn)及其子節(jié)點(diǎn)的句法標(biāo)簽相關(guān),與其他源語言的語法標(biāo)簽和模板角色標(biāo)簽無關(guān)語言節(jié)點(diǎn)。即,換句話說,源語言節(jié)點(diǎn)的模板角色標(biāo)簽僅與生成節(jié)點(diǎn)的源語言的上下文無關(guān)規(guī)則相關(guān)。Role(N)為節(jié)點(diǎn)對(duì)應(yīng)的模板角色標(biāo)簽。對(duì)應(yīng)的參數(shù)歸一化條件為:這里Syn是任意語法標(biāo)簽,Role是任意模板角色。Template Role Tagging-Probability Model 2 假設(shè)每個(gè)源語言節(jié)點(diǎn)的模板角色標(biāo)簽只與該節(jié)點(diǎn)及其子節(jié)點(diǎn)的句法標(biāo)簽相關(guān),與其他源語言的語法標(biāo)簽和模板角色標(biāo)簽無關(guān)語言節(jié)點(diǎn)。即,換句話說,源語言節(jié)點(diǎn)的模板角色標(biāo)簽僅與生成節(jié)點(diǎn)的源語言的上下文無關(guān)規(guī)則相關(guān)。Role(N)為節(jié)點(diǎn)對(duì)應(yīng)的模板角色標(biāo)簽。對(duì)應(yīng)的參數(shù)歸一化條件為:這里Syn是任意語法標(biāo)簽,Role是任意模板角色。Template Role Tagging-Probability Model 2 假設(shè)每個(gè)源語言節(jié)點(diǎn)的模板角色標(biāo)簽只與該節(jié)點(diǎn)及其子節(jié)點(diǎn)的句法標(biāo)簽相關(guān),與其他源語言的語法標(biāo)簽和模板角色標(biāo)簽無關(guān)語言節(jié)點(diǎn)。即,換句話說,源語言節(jié)點(diǎn)的模板角色標(biāo)簽僅與生成節(jié)點(diǎn)的源語言的上下文無關(guān)規(guī)則相關(guān)。Template Role Tagging-Probability Model 2 假設(shè)每個(gè)源語言節(jié)點(diǎn)的模板角色標(biāo)簽只與該節(jié)點(diǎn)及其子節(jié)點(diǎn)的句法標(biāo)簽相關(guān),與其他源語言的語法標(biāo)簽和模板角色標(biāo)簽無關(guān)語言節(jié)點(diǎn)。即,換句話說,源語言節(jié)點(diǎn)的模板角色標(biāo)簽僅與生成節(jié)點(diǎn)的源語言的上下文無關(guān)規(guī)則相關(guān)。Template Role Tagging-Probability Model 2 假設(shè)每個(gè)源語言節(jié)點(diǎn)的模板角色標(biāo)簽只與該節(jié)點(diǎn)及其子節(jié)點(diǎn)的句法標(biāo)簽相關(guān),與其他源語言的語法標(biāo)簽和模板角色標(biāo)簽無關(guān)語言節(jié)點(diǎn)。即,換句話說,源語言節(jié)點(diǎn)的模板角色標(biāo)簽僅與生成節(jié)點(diǎn)的源語言的上下文無關(guān)規(guī)則相關(guān)。
因此: 這里,N 是源語言句法樹上的任意節(jié)點(diǎn),Syn(N) 是該節(jié)點(diǎn)對(duì)應(yīng)的句法標(biāo)記,Rule(N) 是生成該節(jié)點(diǎn)的上下文無關(guān)規(guī)則。對(duì)應(yīng)的參數(shù)歸一化條件為: 模板角色標(biāo)簽-概率模型 3 假設(shè)每個(gè)源語言節(jié)點(diǎn)的模板角色標(biāo)簽不僅與節(jié)點(diǎn)及其子節(jié)點(diǎn)的句法標(biāo)簽有關(guān),還與父節(jié)點(diǎn)的模板有關(guān)角色標(biāo)簽是相關(guān)的,與其他源語言節(jié)點(diǎn)的語法標(biāo)簽和模板角色標(biāo)簽無關(guān)。所以:這里,N 是源語言語法樹上的任意節(jié)點(diǎn)基于模板的統(tǒng)計(jì)翻譯,Syn(N) 是節(jié)點(diǎn)對(duì)應(yīng)的語法標(biāo)記,Rule(N) 是生成節(jié)點(diǎn)的上下文無關(guān)規(guī)則,Parent(N) 是node 點(diǎn)的父節(jié)點(diǎn)。對(duì)應(yīng)的參數(shù)歸一化條件為: 訓(xùn)練方法算法 維特比算法:每次只考慮*大可能的對(duì)齊 EM算法:考慮所有可能的對(duì)齊 基本過程:迭代,直到收斂短語對(duì)齊模板提取參數(shù)估計(jì)參數(shù)訓(xùn)練算法目前可用 初步思路,但考慮尚不成熟。您需要嘗試多種方法并通過實(shí)驗(yàn)來驗(yàn)證它們。下面通過一個(gè)例子簡單說明EGYPT工具包EGYPT的模塊GIZA:該模塊用于從雙語語料庫中提取統(tǒng)計(jì)知識(shí)(參數(shù)訓(xùn)練) Decoder:Decoder,用于執(zhí)行具體的翻譯過程(在源通道模型中, “翻譯”是“解碼”)開羅:整個(gè)翻譯系統(tǒng)的可視化界面,用于管理所有參數(shù)和查看雙語語料的對(duì)齊過程和翻譯模型的解碼過程 Whittle:語料預(yù)處理工具EGYPT可以在網(wǎng)上免費(fèi)下載,它有成為SMT的標(biāo)桿。和性能。
在 1990 年代初在 IBM 舉行的 DARPA 機(jī)器翻譯評(píng)估中,我們曾經(jīng)預(yù)測只有非常短的句子(大約 10 個(gè)單詞)可以通過統(tǒng)計(jì)方法進(jìn)行解碼。即便如此,每個(gè)句子的解碼時(shí)間也可能是幾個(gè)小時(shí)。在 IBM 早期工作近 10 年后,摩爾定律、更好的編譯器、更充足的內(nèi)存和硬盤空間幫助我們構(gòu)建了一個(gè)可以在幾秒鐘內(nèi)解碼 25 個(gè)單詞的句子的系統(tǒng)。為確保成功,我們在搜索中使用了相當(dāng)嚴(yán)格的閾值和約束,如下所述。但是,解碼器相當(dāng)有效的事實(shí)預(yù)示著未來該方向的工作前景良好,也肯定了IBM工作的初衷,即強(qiáng)調(diào)概率模型比效率更重要。——引自JHU統(tǒng)計(jì)機(jī)器翻譯研討會(huì)關(guān)于改進(jìn)IBM方法的技術(shù)報(bào)告。IBM方法的問題不考慮結(jié)構(gòu):能否適用于句法結(jié)構(gòu)差異較大的語言?數(shù)據(jù)稀疏問題嚴(yán)重。后續(xù)改進(jìn)工作 王業(yè)怡的改進(jìn) 山田和奈特的改進(jìn)。Och 等人的改進(jìn)。王野義的改進(jìn)(1) 背景:德英口語翻譯系統(tǒng)的語法結(jié)構(gòu)差異較大。數(shù)據(jù)稀疏(訓(xùn)練數(shù)據(jù)有限)。改進(jìn):兩級(jí)對(duì)齊模型粗對(duì)齊:短語之間的對(duì)齊精細(xì)對(duì)齊:詞組中詞的對(duì)齊方式王野義的改進(jìn)(2)詞聚類的語法推導(dǎo):基于互信息法的詞組合并規(guī)則學(xué)習(xí)優(yōu)勢 提高機(jī)器翻譯準(zhǔn)確率:錯(cuò)誤率降低11% 提高整個(gè)系統(tǒng)效率:搜索空間更小,數(shù)據(jù)稀疏問題口語數(shù)據(jù)的缺乏得到緩解。Yamada 和 Knight 的改進(jìn)(1) Syntax-based TM):輸入是源語言句法樹輸出是目標(biāo)語言句子翻譯的過程:每個(gè)內(nèi)部節(jié)點(diǎn)的子節(jié)點(diǎn)隨機(jī)重新排列:置換概率在每個(gè)節(jié)點(diǎn)的左邊或右邊隨機(jī)插入一個(gè)詞。左右插入和不插入的概率取決于父節(jié)點(diǎn)和當(dāng)前節(jié)點(diǎn)標(biāo)簽插入哪個(gè)詞只與插入詞相關(guān)的概率,不是位置?翻譯每個(gè)葉節(jié)點(diǎn):詞到詞的翻譯概率輸出Yamada和Knight的目標(biāo)句改進(jìn)(2) Yamada and Knight改進(jìn)(3)
*大熵方法大大擴(kuò)展了統(tǒng)計(jì)機(jī)器翻譯的思路;特征的選擇更加靈活。統(tǒng)計(jì)機(jī)器翻譯的應(yīng)用 傳統(tǒng)機(jī)器翻譯的應(yīng)用是跨語言檢索 聶建云 使用IBM Model 1 快速開發(fā)CLIR 機(jī)器翻譯系統(tǒng)。未知語言統(tǒng)計(jì)機(jī)器翻譯方法的快速發(fā)展總結(jié)。IBM 當(dāng)年的工作有些先進(jìn)。雖然很多人懷疑統(tǒng)計(jì)方法能否在機(jī)器翻譯中取得成功,但這現(xiàn)在已經(jīng)不是問題了。在 NIST MT Eval 2002 中,得分*高的系統(tǒng)都采用了統(tǒng)計(jì)機(jī)器翻譯方法。基于平行語法的機(jī)器翻譯方法普遍不成功?;?大熵的方法為統(tǒng)計(jì)機(jī)器翻譯方法開辟了新天地。研究思路總結(jié)。基于模板的統(tǒng)計(jì)翻譯模型轉(zhuǎn)換算法的基本假設(shè)。概率模型訓(xùn)練算法(對(duì)齊)。實(shí)驗(yàn)方案與其他統(tǒng)計(jì)機(jī)器翻譯方法的比較?;炯僭O(shè)總結(jié)。使用基于*大熵的統(tǒng)計(jì)機(jī)器翻譯模型;提出基于模板的統(tǒng)計(jì)翻譯模型: 基于模板翻譯模型的句法樹對(duì)齊提取翻譯模板其他特征中文詞法分析中文句法分析基于模板的統(tǒng)計(jì)翻譯模型轉(zhuǎn)換模型P(T|S)轉(zhuǎn)換模型的輸入輸出P (T|S) 是句法樹。引入轉(zhuǎn)換模板是為了引入模板角色的概念。模板角色標(biāo)注的思想建立了三個(gè)不同層次的統(tǒng)計(jì)翻譯模型。基于模板的統(tǒng)計(jì)翻譯模型的參數(shù)訓(xùn)練算法轉(zhuǎn)換 template-illustration vp(v:1 n:2)? Vp(vp:1 np( t(one's) n:2)) v vp n vp vp np vn 轉(zhuǎn)換模板-定義轉(zhuǎn)換模板的形式化定義:轉(zhuǎn)換模板由兩棵具有對(duì)齊關(guān)系的句法子樹組成;兩棵句法子樹的根節(jié)點(diǎn)相互對(duì)齊;句子全部非根非根-子樹的葉節(jié)點(diǎn)對(duì)齊為空;語法子樹的葉節(jié)點(diǎn)要么與相應(yīng)語法子樹的葉節(jié)點(diǎn)對(duì)齊,要么與空對(duì)齊;
轉(zhuǎn)換模板反映了兩個(gè)句法子樹的節(jié)點(diǎn)之間的對(duì)應(yīng)關(guān)系?;谀0宓霓D(zhuǎn)換算法以自頂向下轉(zhuǎn)換算法為例。該圖顯示可以使用其他搜索策略。練習(xí)規(guī)劃。Chinese: 我們可以參考其他工廠的經(jīng)驗(yàn)來制定我們的計(jì)劃?;谀0宓霓D(zhuǎn)換 (1) (a) vp(v(cf.) np:1)? Pp( p(in ) np(np(t(the) n(light)) pp(p) (of) np:1))) vbnun np ap np vp 基于模板轉(zhuǎn)換比較其他工廠的做法 (2) ( b) np(ap:1 n(practice))? np(np( t(the) n(experiences)) pp:1) pbnun np ap np:
基于并行概率文法的統(tǒng)計(jì)機(jī)器翻譯模型的基本思想。兩種語言建立了一套平行的語法規(guī)則。規(guī)則對(duì)應(yīng)兩套規(guī)則,服從相同的概率分布。句法分析的過程決定了生成的過程。主要模型基于 Alshawi 的 Head Transducer。MT模型吳德凱的Inverse Transduction Grammar(ITG)武田的Pattern-based CFG for MT Head Transducer MT(1) Head Transducer)是Definite State Automata(有限狀態(tài)自動(dòng)機(jī))和一般有限狀態(tài)識(shí)別器的區(qū)別:端不僅有輸入,還有輸出;不是從左到右輸入,而是從中心詞輸入到兩邊 Head Transducer MT(2) a:a 0:0 0:0 b:ba:a -1:+1 b:b -1 :+1 示例:
對(duì)于上下文無關(guān)語法規(guī)則的每個(gè)右側(cè)部分(子節(jié)點(diǎn))對(duì)于非終結(jié)符,可以指定其中心詞;對(duì)于規(guī)則左邊的非終結(jié)符(父節(jié)點(diǎn)),可以直接指定它的中心字,也可以使用相同的序號(hào)來指定它的中心字等于某個(gè)右邊的中心字非終結(jié)符;鏈接約束:源語言骨架和目標(biāo)語言骨架的非終結(jié)符子節(jié)點(diǎn)使用相同的序號(hào)建立對(duì)應(yīng)關(guān)系,具有對(duì)應(yīng)關(guān)系的非終結(jié)符為相互翻譯?;蛘呖梢允褂孟嗤男蛱?hào)來指定其中心字等于某個(gè)對(duì)非終結(jié)符的中心字;鏈接約束:源語言骨架和目標(biāo)語言骨架的非終結(jié)符子節(jié)點(diǎn)使用相同的序號(hào)建立對(duì)應(yīng)關(guān)系,具有對(duì)應(yīng)關(guān)系的非終結(jié)符為相互翻譯?;蛘呖梢允褂孟嗤男蛱?hào)來指定其中心字等于某個(gè)對(duì)非終結(jié)符的中心字;鏈接約束:源語言骨架和目標(biāo)語言骨架的非終結(jié)符子節(jié)點(diǎn)使用相同的序號(hào)建立對(duì)應(yīng)關(guān)系,具有對(duì)應(yīng)關(guān)系的非終結(jié)符為相互翻譯。
源通道模型假設(shè)目標(biāo)語言文本T是從一段源語言文本S中通過某種奇怪的編碼得到的,那么翻譯的目標(biāo)是將T還原為S,這是一個(gè)解碼過程。注意,源語言S是噪聲通道的輸入語言,目標(biāo)語言T是噪聲通道的輸出語言,正好與整個(gè)機(jī)器翻譯系統(tǒng)的源語言和目標(biāo)語言相反。SP(S) P(T|S) T 統(tǒng)計(jì)機(jī)器翻譯的基本方程 P. Brown 將上述方程稱為統(tǒng)計(jì)機(jī)器翻譯的基本方程。語言模型:P(S) 翻譯模型:P(T|S) 語言模型反映“S”“Like a sentence”的程度:翻譯模型反映“T is like S”的流暢程度:兩種模型的結(jié)合對(duì)于保真度來說比單獨(dú)使用翻譯模型要好,因?yàn)楹笳吆芸赡軙?huì)導(dǎo)致一些不好的翻譯。語言模型和翻譯模型考慮漢語動(dòng)詞“打”的翻譯:對(duì)應(yīng)的英文單詞翻譯有幾十種:打人、玩飯、玩魚、玩毛衣、打獵、玩草稿等,如果直接用翻譯模型,只需使用翻譯模型。需要基于上下文建立復(fù)雜的上下文條件概率模型。如果采用source-channel思想,只要建立一個(gè)簡單的翻譯模型,就可以達(dá)到目標(biāo)詞選擇的效果: 翻譯模型:不考慮上下文,只考慮詞之間的翻譯概率。模型:根據(jù)詞之間的共現(xiàn)選擇*佳目標(biāo)詞。統(tǒng)計(jì)機(jī)器翻譯的三個(gè)問題。三個(gè)問題: 語言模型 P(S) 的參數(shù)估計(jì) 翻譯模型 P(T|S) 的參數(shù)估計(jì)和解碼(搜索) 算法語言模型將語言理解為產(chǎn)生句子的隨機(jī)事件。語言模型反映了一個(gè)句子在一種語言中出現(xiàn)的概率。語言模型N-gram P(S)=p(s0)* p(s1|s0)*…*p(Sn|Sn-1…Sn-N) 鏈?zhǔn)秸Z法:可以處理長距離相關(guān)PCFG(需要語法符號(hào)) 引入隱藏變量: Align 一個(gè)翻譯模型,將對(duì)齊P(T|S)的計(jì)算轉(zhuǎn)化為P(T,A|S)的估計(jì)對(duì)齊:建立源語言句子和目標(biāo)語言句子的詞之間的對(duì)應(yīng)關(guān)系。IBM 模型比較 P(T,
設(shè)m為當(dāng)前總詞數(shù):m-prime+φ0;根據(jù)概率表t(f|e),用外來詞f替換每個(gè)詞e;對(duì)于每個(gè)不是由空詞NULL產(chǎn)生的外來詞,根據(jù)概率表d(j|i,l,m)分配一個(gè)位置。這里j是法語單詞在法語字符串中的位置,i是產(chǎn)生當(dāng)前法語單詞的對(duì)應(yīng)英語單詞在英語句子中的位置,l是英語字符串的長度,m是法語字符串;如果任一目標(biāo)語言位置多次登錄(包含多個(gè)單詞)將返回失??;由空詞 NULL 生成的詞被分配一個(gè)目標(biāo)語言位置。這些位置必須是空的(未被占用)。任何分配都被認(rèn)為是等概率的,概率值為 1/φ0。*后,讀取法語字符串,其概率是上述每個(gè)步驟的概率的乘積。翻譯模型參數(shù)訓(xùn)練 Viterbi Training(對(duì)比:EM Training) 給定初始參數(shù);使用現(xiàn)有參數(shù)尋找*佳(維特比)比對(duì);使用得到的alignment重新計(jì)算參數(shù);返回第二步直到收斂。IBM 模型 1:存在全局*優(yōu)。IBM Model 2~5:沒有全局*優(yōu)。初始值是之前模型訓(xùn)練的結(jié)果。統(tǒng)計(jì)機(jī)器翻譯的解碼參考了語音識(shí)別的搜索算法:棧搜索參數(shù)空間很大,搜索不能總是保證*好。從錯(cuò)誤類型來看,只有兩種類型: 模型錯(cuò)誤:概率*高的句子不是正確的句子。搜索錯(cuò)誤:沒有找到概率*高的句子。第二類錯(cuò)誤僅占錯(cuò)誤總數(shù)的 5% (IBM) Search 問題不是瓶頸。IBM 的 Candide 系統(tǒng) 1 基于統(tǒng)計(jì)的機(jī)器翻譯方法 analysis-transformation-generation 中間表示是線性分析,生成都是可逆分析(預(yù)處理):1.詞組切分2.專有名詞和數(shù)字檢測3.大小寫和拼寫糾正4.形態(tài)分析5.語言歸一化IBM Candide系統(tǒng)2轉(zhuǎn)換(解碼):基于統(tǒng)計(jì)的機(jī)器翻譯解碼分為兩個(gè)階段: 階段1:Stack search使用粗糙模型輸出140個(gè)得分*高的翻某言模型: 三元語法翻譯模型:EM算法第二階段:使用精細(xì)模型的擾動(dòng)搜索擴(kuò)展第一階段的輸出結(jié)果,然后重新-分?jǐn)?shù)。語言模型:鏈?zhǔn)秸Z法翻譯模型:*大熵法IBM的Candide系統(tǒng)3 ARPA測試結(jié)果:?流暢度充足時(shí)間比 1992 1993 1992 1993 1992 1993 Systran .466 .540 .686 .743?? 老實(shí)人 .511 .580 .575 .670?? Transman .819 .838 .837 .850 .688 .625 手冊?。833?.840?? JHU 1999 年夏季研討會(huì)起源于引起廣泛興趣的IBM 實(shí)驗(yàn)。IBM 的實(shí)驗(yàn)很難重復(fù):工作量太大。目的是構(gòu)建一個(gè)統(tǒng)計(jì)機(jī)器翻譯工具(EGYPT)并使其對(duì)研究人員有用。說它是可用的(免費(fèi)傳播);在研討會(huì)中使用此工具集構(gòu)建捷克-英語機(jī)器翻譯系統(tǒng);進(jìn)行基準(zhǔn)評(píng)估:主觀和客觀;通過使用形態(tài)和句法轉(zhuǎn)錄機(jī)改進(jìn)基準(zhǔn)結(jié)果;在研討會(huì)結(jié)束時(shí),一天之內(nèi)為新語言對(duì)構(gòu)建了一個(gè)翻譯器。JHU Summer Seminar極大地推動(dòng)了統(tǒng)計(jì)機(jī)器翻譯的研究。北京大學(xué)博士論文公開報(bào)告 2002-12-30 北京大學(xué)博士論文公開報(bào)告 2002-12-30 580 .575 .670?? Transman .819 .838 .837 .850 .688 .625 手冊?.833?.840?? 重復(fù):工作量太大。目的是構(gòu)建一個(gè)統(tǒng)計(jì)機(jī)器翻譯工具(EGYPT)并提供給研究人員(免費(fèi)傳播);在研討會(huì)中使用該工具集構(gòu)建捷克-英語機(jī)器翻譯系統(tǒng);進(jìn)行基準(zhǔn)評(píng)估:主觀和客觀;通過使用形態(tài)和句法轉(zhuǎn)錄機(jī)改進(jìn)基準(zhǔn)結(jié)果;在研討會(huì)結(jié)束時(shí),在一天內(nèi)構(gòu)建一個(gè)新的語言對(duì)翻譯器。JHU Summer Seminar極大地推動(dòng)了統(tǒng)計(jì)機(jī)器翻譯的研究。北京大學(xué)博士論文公開報(bào)告 2002-12-30 北京大學(xué)博士論文公開報(bào)告 2002-12-30 580 .575 .670?? Transman .819 .838 .837 .850 .688 .625 手冊?.833?.840?? 重復(fù):工作量太大。目的是構(gòu)建一個(gè)統(tǒng)計(jì)機(jī)器翻譯工具(EGYPT)并提供給研究人員(免費(fèi)傳播);在研討會(huì)中使用該工具集構(gòu)建捷克-英語機(jī)器翻譯系統(tǒng);進(jìn)行基準(zhǔn)評(píng)估:主觀和客觀;通過使用形態(tài)和句法轉(zhuǎn)錄機(jī)改進(jìn)基準(zhǔn)結(jié)果;在研討會(huì)結(jié)束時(shí),在一天內(nèi)構(gòu)建一個(gè)新的語言對(duì)翻譯器。JHU Summer Seminar極大地推動(dòng)了統(tǒng)計(jì)機(jī)器翻譯的研究。北京大學(xué)博士論文開題報(bào)告 2002-12-30 北京大學(xué)博士論文開題報(bào)告 2002-12-30
- 上一條審協(xié)筆試翻譯模板 專利審查協(xié)作廣東中心2020年度公開招聘專利審查員筆面試公告(第一批)
- 下一條英國使館簽證出生證翻譯模板 英國留學(xué):2018簽證新政規(guī)定tier4學(xué)生簽需提交的資料清單
相關(guān)閱讀Relate
熱門文章 Recent
- bvi股東名冊翻譯模板 英屬維爾京BVI公司如何在深圳前海注冊基金公司公證認(rèn)證2023-03-11
- 身份證信息翻譯模板 身份證標(biāo)注的正確寫法 身份證標(biāo)注僅限使用范圍2023-03-11
- 德國萊比錫大學(xué)學(xué)位證翻譯模板2023-03-11
- 護(hù)照翻譯模板英國簽證 (收藏)英國簽證出入境怎么辦?攻略在這兒2023-03-11
- 審協(xié)筆試翻譯模板 外審員考試報(bào)名 香港注冊會(huì)計(jì)師報(bào)名條件2023-03-11
- 班尼迪克大學(xué)學(xué)位證書翻譯模板 老師你好 研究生畢業(yè)證和學(xué)士學(xué)位證書 英語怎么翻譯呢2023-03-11
- 英語道歉信萬能模板帶翻譯 英文道歉信2023-03-11
- 皇家藝術(shù)學(xué)院學(xué)位證書翻譯模板 皇家藝術(shù)學(xué)院申請(qǐng)條件及流程解讀!2023-03-11
- 江西省大學(xué)錄取花名冊翻譯模板 2020年江西財(cái)經(jīng)大學(xué)現(xiàn)代經(jīng)濟(jì)管理學(xué)院招生簡章2023-03-11
- 簽證材料戶口本翻譯模板 英國簽證材料都需要翻譯嗎2023-03-11