
一、術語庫建設
1. 初始構建
收集各領域的專業術語。例如從行業標準文檔、專業教材、權威學術論文等來源獲取術語。對于醫學領域,像“心肌梗死(myocardial infarction)”這樣的術語,要確保準確收錄其對應的中英文表達。
組織專業的語言學家和相關領域專家參與術語庫的創建。比如在法律翻譯方面,讓法律專業人士和翻譯專家共同確定像“管轄權(jurisdiction)”等術語的準確翻譯。
2. 持續更新
隨著行業發展,不斷添加新出現的術語。如在科技領域,“量子計算(quantum computing)”這個術語出現后,要及時更新到術語庫。
對已有的術語進行修正,如果發現某些術語的翻譯在特定語境下不準確,要及時調整。
二、人工智能算法優化
1. 預訓練
在大規模語料上進行預訓練時,對包含專業術語的語料給予特殊關注。例如在預訓練自然語言處理模型時,將包含大量金融術語的財經新聞語料進行特殊標記和加權,使模型更好地學習專業術語的語義。
采用多語言預訓練,以便在不同語言的術語之間建立更準確的映射關系。比如在漢英翻譯中,通過同時預訓練中文和英文的語料,更好地理解像“針灸(acupuncture)”這樣具有文化特色的術語在兩種語言中的表達。
2. 微調
針對特定領域的專業術語,對預訓練模型進行微調。如果是翻譯航空航天領域的內容,就用航空航天相關的語料對模型進行微調,提高對諸如“航空發動機(aero
engine)”等術語的翻譯準確性。
三、人工校對與審核
1. 專業人員審核
雇傭相關領域的專家對翻譯結果進行審核。在翻譯化學領域的文獻時,讓化學專家檢查像“化學元素周期表(periodic table of chemical elements)”等術語的翻譯是否準確。
建立多輪審核機制,確保復雜術語和概念的翻譯經過多個人的檢查,減少錯誤。
2. 反饋機制
從客戶或用戶那里收集關于術語翻譯準確性的反饋。如果客戶在工程翻譯中發現“土木工程(civil engineering)”的翻譯存在問題,及時根據反饋進行調整。