語料庫和術語管理專案實踐

專案背景:

大眾汽車是一家世界知名的汽車製造商,旗下擁有眾多車型。其市場需求主要集中在德語、英語和中文這三種主要語言地區。


客戶要求:

我們需要找到長期合作的翻譯服務供應商,並希望翻譯品質穩定可靠。

項目分析:

唐能翻譯根據客戶需求進行了內部分析,為了確保翻譯品質的穩定可靠,語料庫和術語庫至關重要。雖然該客戶已經非常重視文件(包括原文和譯文)的歸檔工作,具備了補充語料庫工作的先決條件,但目前存在的問題是:
1)大多數客戶自稱的“語料庫”並非真正的“語料庫”,而只是無法真正用於翻譯工作的雙語對應文件。所謂的「參考價值」只是一個模糊、無法實現的願望;
2)一小部分客戶累積了語言材料,但客戶沒有專門人員進行管理。由於翻譯供應商頻繁更換,各公司提供的語料庫格式各不相同,經常出現一個句子有多個譯文、一個詞有多個譯文、源內容與目標譯文不匹配等問題,大大降低了語料庫的實際應用價值;
3)如果沒有統一的術語庫,公司各部門可能會根據自己的版本翻譯術語,導致混亂,影響公司內容輸出的品質。
因此,唐能翻譯向客戶提供建議,並提供語料庫和術語管理服務。

專案要點:
根據不同情況處理歷史語料庫和非語料庫的雙語文檔,評估語料庫資產的質量,根據質量增加或減少處理量,並填補以前的漏洞;

新的增量項目必須嚴格使用 CAT,累積和管理語言材料和術語,避免產生新的漏洞。

項目思維與效果評估:
影響:

1.在不到4個月的時間裡,唐先生利用對齊工具和人工校對,處理了雙語歷史文獻,同時整理了之前雜亂無章的語料庫部分。他完成了一個包含200多萬個詞的語料庫和一個包含數百個條目的術語資料庫,為基礎設施建設奠定了堅實的基礎;

2. 在新的翻譯專案中,這些語料庫和術語立即被利用,提高了品質和效率,並獲得了價值;
3. 新的翻譯專案嚴格使用 CAT 工具,新的語料庫和術語管理工作在原有基礎上繼續進行,以實現長期發展。

思維:

1. 意識的缺乏與建立:
很少公司意識到語言資料也是一項資產,因為缺乏統一的文件和語言資料管理部門。每個部門都有各自的翻譯需求,選擇翻譯服務提供者的標準也不統一,導致公司不僅缺乏語言資料和術語,而且雙語文檔的歸檔也存在問題,文檔分散在各處,版本混亂。
大眾汽車公司具備一定的意識,因此雙語文件的保存工作相對完善,並專注於及時歸檔和妥善保管。然而,由於對翻譯行業的生產和技術工具缺乏了解,以及對「語料庫」具體含義理解不足,他們想當然地認為雙語文件可以作為參考資料,而沒有術語管理的概念。
在現代翻譯生產中,使用電腦輔助翻譯(CAT)工具已成為必需,翻譯記憶庫則用於處理文字。在未來的翻譯生產中,CAT工具可以隨時自動比對重複部分,並且可以向​​CAT系統中添加術語庫,以自動檢測術語不一致之處。由此可見,對於翻譯生產而言,技術工具、語言材料和術語庫都至關重要,二者缺一不可。只有三者相輔相成,才能產出最高品質的翻譯成果。
因此,語言材料和術語管理的首要問題是意識和概念的轉變。只有充分認識到它們的必要性和重要性,我們才能有動力投入其中,填補企業在這一領域的空白,將語言資產轉化為寶貴的財富。投入雖小,回報卻龐大且持久。

2. 方法和執行

有了意識,接下來我們該做什麼?許多客戶缺乏完成這項任務所需的精力和專業技能。專業人士做專業的事情,唐能翻譯在長期的翻譯服務實踐中捕捉到了客戶的這一潛在需求,因此推出了“翻譯技術服務”產品,其中包括“語料庫和術語管理”,為客戶提供語料庫和術語庫的組織和維護外包服務,幫助客戶高效管理這些資源。

語料庫和術語庫建設工作越早開展,收益越大。對企業而言,這項工作亟需提上日程,尤其對於技術和產品相關文件而言,這類文件更新頻率高、重用價值高,且對術語的統一發布要求也高。


發佈時間:2025年8月9日