官术网_书友最值得收藏!

第三節(jié) 法律翻譯的智能實現(xiàn)

在大力統(tǒng)籌推進國內(nèi)法治和涉外法治的大背景下,從立法領(lǐng)域到司法領(lǐng)域,從法律實踐到法學理論都離不開法律翻譯活動。無論是學界專家或譯界實踐先鋒都對中外法律交涉/法律翻譯有著較為一致的認識,即法律翻譯并非詞語對等,而是從語義、功能對等到法律概念的等價。法律翻譯也不僅是詞語的鏖戰(zhàn),更是一場宏大的跨語際旅行。文本之外不同國家的民族意志、歷史積淀、國家主義等因素都以獨特的姿態(tài)進入了世界舞臺。同時,當下興旺的互聯(lián)網(wǎng)、數(shù)字化催生了“虛擬-現(xiàn)實”的雙重世界,使得數(shù)字生產(chǎn)的方方面面都受到了前所未有的沖擊與變革。

基于此,本書圍繞著法律概念、法律翻譯、新技術(shù)方法三個核心主題展開,試圖在數(shù)字時代找到法律概念由原文中的“意義單位”外化為“翻譯單位”后,進入不同法系再次內(nèi)化為“意義單位”的過程。全書以筆者主持的上海市哲學社科規(guī)劃項目(青年項目)“語料庫驅(qū)動下的漢英立法文本翻譯單位研究”的相關(guān)研究為基礎寫作完成,該項目的核心內(nèi)容即通過數(shù)據(jù)采集,創(chuàng)建高質(zhì)量法律翻譯語料庫:項目通過網(wǎng)絡采集香港律政司所頒布的權(quán)威雙語立法文本(共計22萬句對,約600萬詞頻),另收集整理全國人大法工委組織開展的《中華人民共和國民法典》英譯、上海市司法局行政法制研究所漢英《上海城市法規(guī)全書》(《上海城市法典》)、上海市高級人民法院委托的漢英“金融商事審判白皮書”(包括《2020年度上海法院金融商事審判情況通報》《2016—2020年上海法院涉地方金融組織糾紛案件審判情況通報》以及《2020年度上海法院金融商事審判十大案例》)等高質(zhì)量雙語文本作為入庫數(shù)據(jù)。在此基礎上,筆者所在上述項目團隊采用術(shù)語提取技術(shù),整理出《重要漢英民法術(shù)語及擴展翻譯單位列表》(見附錄),可作為后續(xù)翻譯實踐的重要參考,并形成術(shù)語庫。

值得注意的是,項目創(chuàng)建的語料庫中所包含的大量雙語句對,絕大部分沒有被標注具體類別(如司法、立法、法學或具體部門法),剩下的一些句對雖然被標注了類別,但不精確,被準確標注的句對只占相當少的一部分。考慮到任何數(shù)據(jù)平臺上的語料檢索、內(nèi)容分發(fā)與路由都依賴于準確的語料類別標注,因而對于這樣大量的(千萬量級)雙語句對語料,項目主要基于Tmxmall平臺架構(gòu),采用卷積神經(jīng)網(wǎng)絡(CNN)訓練分類器模型,實現(xiàn)對所有現(xiàn)有的語料數(shù)據(jù)進行分類,并把分類器模型包裝成web服務,對新增語料數(shù)據(jù)進行實時的分類。項目團隊創(chuàng)新使用“四步”語料庫建設方法,分別為:1.文件解析過濾器。2.調(diào)整段落對齊。3.對齊算法自動完成句句對齊。4.微調(diào)句-句對齊結(jié)果。其中,需要設計技術(shù)操作層面包括對齊算法的調(diào)整及檢索功能的實現(xiàn)。以英語對齊為例:(1)?以段落為單位進行對齊,將中文和英文通過斷句規(guī)則進行斷句。斷句后可以得到中文和英文的句子個數(shù)。(2)?計算中文句子的排列組合情況,根據(jù)中文句子的每種排列,使用插空法求解每種排列對應的英文句子排列組合,再計算每種中英文排列組合的對應句子相似度,從而挑選出相似度最大的中文和英文的排列組合,即為最終的對齊結(jié)果。項目中涉及的語料庫建設原理、方法與成果構(gòu)成了本書的基干部分,在第二章、第三章中都有具體論述,包括以下三個方面:

其一,是關(guān)于法律翻譯對應單位研究的成果,包括:1.實現(xiàn)了漢英法律術(shù)語識別與提取。為最大程度保證術(shù)語庫建設的質(zhì)量和效率,項目組采取了基于多語種平行語料庫的自動化術(shù)語抽取方法,通過與專業(yè)詞典(如《元照英美法詞典》)的詞條進行匹配完成提取,并結(jié)合規(guī)則及統(tǒng)計模型以多種方法互補的模式進行操作。2.實現(xiàn)術(shù)語分類、聚類與相關(guān)性分析。首先采用三個步驟實現(xiàn)文本分類/聚類:(1)?文本表示;(2)?分類/聚類算法選擇或設計;(3)?分類/聚類評估。在此基礎上,項目組采取計算詞語相似度的方法進行術(shù)語相關(guān)度分析,測算詞與詞的屬性向量間的距離;使用詞語空間和關(guān)系空間結(jié)構(gòu)化存儲詞語與其上下文之間的統(tǒng)計信息,為詞語相似度的計算提供數(shù)據(jù)支持。3.設計術(shù)語庫的數(shù)據(jù)庫結(jié)構(gòu),并搭建相應的檢索系統(tǒng),提供應用接口(API)以便計算機輔助翻譯軟件或其他機器翻譯系統(tǒng)調(diào)用。

其二,提出“共選理論視角下的漢英法律翻譯研究及擴展意義單位”這一語料庫驅(qū)動的短語學工作模型。根據(jù)辛克萊(J.?Sinclair)的觀點,擴展意義單位共有5個構(gòu)成成分,分別是節(jié)點詞、語義韻、搭配、語義趨向和類聯(lián)接。其中,類聯(lián)接是節(jié)點詞語法關(guān)系的抽象,是其共現(xiàn)于的語法或結(jié)構(gòu)類型,而語義趨向是對搭配詞語義特征的抽象,在分析比較研究對象及其英文對應語時應考慮這兩個因素。基于此,本書分析了中國特色社會主義表達在擴展語義單位框架下的英譯實現(xiàn),引入阿爾滕貝格(B.?Altenberg)提出的相互對應率概念及算法來處理出數(shù)據(jù),通過分析意義單位與翻譯單位(均基于短語型式)的相互對應率確定最終譯文。此項研究可為機器翻譯提供重要參考。

其三,是法律詞匯化句干聚類分析及漢英翻譯對應研究,并形成基于句對齊算法的研究成果。句對齊是翻譯語料庫建設的重點和難點,通常先以段落為單位進行對齊,將中文和英文通過斷句規(guī)則進行斷句,得到中文和英文的句子個數(shù),在此基礎上根據(jù)中文句子的每種排列,使用插空法求解每種排列對應的英文句子排列組合,再計算每種中英文排列組合的對應句子相似度,從而挑選出相似度最大的中文和英文的排列組合,即為最終的對齊結(jié)果。本書在回顧現(xiàn)有語料對齊技術(shù)的基礎上,對最新的在線語料對齊方案進行介紹和探討。

第四章是關(guān)于語料庫驅(qū)動下民法術(shù)語變遷及其英譯的研究(1978—2020),是在上述語料庫建設研究基礎上的具體應用成果,亦為項目最終成果的重要組成。無論我們的法律思想、制度如何變化,表達法律的方式始終不變。語言作為法律的載體,是法治精神的具體體現(xiàn)。故此,在以上研究內(nèi)容之外,筆者從民法語言的歷時變化入手,回望社會變革和制度變遷,并從語言層面躍至跨語言層面,以“要求—請求”“社會公共利益—公序良俗”“其他組織—非法人組織”等法律語言的變遷為例,在話語變化中梳理歷史演進的線索,并從以上表達的翻譯形式中發(fā)現(xiàn)問題、找尋對策。

第五章主要探討了智能時代法律與語言的學理交融推進,通過引介法律與語言交叉學科的新研究方向——法律和語料庫語言學(LCL)的誕生與發(fā)展,進而分析了語料庫語言學作為法律意義測量工具的可能性。在論述過程中,筆者梳理了在美國司法領(lǐng)域應用語料庫語言學分析的經(jīng)典案例,探尋了利用語料庫語言學方法可以打破基于詞典、法官常識判斷的弊端,更加適用于法律解釋領(lǐng)域。同時,本書還探討了法律與語言結(jié)合的未來方案,并以法律知識圖譜構(gòu)建為例釋,為法律解釋學發(fā)展提供了一條新路徑。

主站蜘蛛池模板: 余干县| 勐海县| 甘德县| 永济市| 凌海市| 上蔡县| 平湖市| 玛纳斯县| 阿拉善盟| 新建县| 五寨县| 富宁县| 凌云县| 沅陵县| 马边| 寿光市| 江达县| 荆门市| 宜春市| 义乌市| 安庆市| 顺昌县| 天镇县| 桂林市| 从化市| 澄城县| 文水县| 榆林市| 宣威市| 巴中市| 昌江| 澎湖县| 射洪县| 平安县| 曲松县| 商南县| 威海市| 台东市| 玉树县| 宜良县| 花莲县|