本發明專利技術提供了一種多策略譯員稿件自動匹配的方法,包括:讀取待譯稿件的各個屬性,篩選出滿足全部屬性要求的譯員;讀取所述篩選出的譯員ID,對每個譯員的譯后稿件與標準譯稿進行相似性分析,確定每個譯員的翻譯能力的量化值;確定為每個譯員設定的合適度值;將每個譯員的量化值、合適度值的和進行排序,選擇出分值最高的譯員。本發明專利技術能客觀的選擇譯員,效率較高,且經過各種屬性判斷,找出最適合的多個譯員供用戶選擇。
【技術實現步驟摘要】
本專利技術涉及計算機領域,具體而言,涉及一種。
技術介紹
信息時代和網絡化使翻譯工作方式發生了很大的變化。利用翻譯流程管理平臺,根據不同對象儲存人才資料。有翻譯任務時,可以根據翻譯項目的語種、文章類型、專業領域以及客戶對翻譯質量和時限的要求,調用最合適的翻譯和審校人員,組成項目組進行翻譯,從而提高翻譯效率、節省翻譯費用、確保譯文質量、優化項目管理。目前的輔助翻譯及管理平臺對譯員和譯稿的匹配,一般還是通過人工或半人工的方式來完成,往往需通過更高級別的譯員(比如審校)來判別譯員的翻譯能力和對譯稿的合適度。這樣不但主觀性強,且采用人工選擇譯員,效率低下。
技術實現思路
本專利技術旨在提供一種,以解決的問題。在本專利技術的實施例中,提供了一種,包括:讀取待譯稿件的各個屬性,篩選出滿足全部屬性要求的譯員;讀取所述篩選出的譯員ID,對每個譯員的譯后稿件與標準譯稿進行相似性分析,確定每個譯員的翻譯能力的量化值;確定為每個譯員設定的合適度值;將每個譯員的量化值、合適度值的和進行排序,選擇出分值最高的譯員。本專利技術的實施例,能客觀的選擇譯員,效率較高,且經過各種屬性判斷,找出最適合的多個譯員供用戶選擇。附圖說明此處所說明的附圖用來提供對本專利技術的進一步理解,構成本申請的一部分,本專利技術的示意性實施例及其說明用于解釋本專利技術,并不構成對本專利技術的不當限定。在附圖中:圖1示出了實施例的流程圖;圖2示出了實施例中進行相似度分析的模塊架構;圖3示出了實施例中關鍵詞的樹形結構圖。具體實施例方式下面將參考附圖并結合實施例,來詳細說明本專利技術。參見圖1所示的實施例的流程圖,包括:Sll:讀取待譯稿件的各個屬性,篩選出滿足全部屬性要求的譯員;S12:讀取所述篩選出的譯員ID,對每個譯員的譯后稿件與標準譯稿進行相似性分析,確定每個譯員的翻譯能力的量化值;S13:確定每個譯員設定的合適度值;S14:將每個譯員的量化值、合適度值的和進行排序,選擇出分值最高的譯員。本專利技術的實施例,能客觀的選擇譯員,效率較高,且經過各種屬性判斷,找出最適合的多個譯員供用戶選擇。優選地,實施例中,每個譯員對應該譯員基因屬性,包含了語種、行業、學科、領域等的翻譯能力,以及信用度、完成任務及時度、質量波動情況、對某種稿件類型的熟悉度、對某類(個)客戶的熟悉度等其他因素;而待譯稿件的稿件碎片的基因屬性則包括語種、行業、學科、難度、翻譯要求等。通過將這些基因屬性量化并帶入到一個合適的匹配模型中進行匹配,從而得出某個稿件碎片適合哪些譯員翻譯并且給出適合度的排序。可按照三層匹配模型找到譯員,第一層為過濾項,該層首先確定一些基本的開關項,不符合這些項的譯員被濾掉,符合的譯員進入下一層匹配;第二層為翻譯能力項,該層通過譯稿的基因屬性來計算譯員相應語種、行業、學科、領域的翻譯能力,其值為一個O 100的數值;第三層合適度計算項,系統根據譯員的基因屬性及屬性的權重計算出譯員翻譯該譯稿的合適度。第一層的匹配過程包括:讀取待譯稿件的各個屬性,篩選出滿足全部屬性要求的譯員;確定該譯員的狀態為接案狀態后,讀取該譯員的與所述待譯稿件相同的屬性;屬性至少包括之一:包括翻譯價格、是否接任務、退稿率、是否翻譯需求方、專項稿件能力。至少執行以下之一的屬性篩選:如果所述譯員的翻譯價格屬性的值在所述待譯稿件的翻譯價格屬性的上下限閥值之間,則認為符合屬性要求;如果所述譯員的退稿率屬性的值小于所述待譯稿件的退稿率屬性的值,則認為符合屬性要求;如果所述譯員的翻譯需求屬性的內容包含所述待譯稿件的翻譯需求屬性的內容,則認為符合屬性要求;如果所述譯員的專項稿件能力屬性符合所述待譯稿件的專項稿件屬性的內容,則認為符合屬性要求。例如:判別該譯員翻譯價格是否超過給定譯稿的翻譯價格閥值,不超過為1,否則為O該譯員被過濾掉。是否接任務:判斷若該譯員是否處于暫不接任務狀態,接任務為1,不接任務為O該譯員被過濾掉。退稿率:若譯員退稿率不大于50%,按其值的大小歸入到合適度項目計算,否則其值為O直接過濾掉。是否翻譯需求方:若翻譯甲方有指定的翻譯要求,按其要求判斷譯員是否符合要求,符合為1,否則為O該譯員被過濾掉。專項稿件能力:若待譯稿件為某類專門稿件,如簡歷、公證書、法律文書或其他有專門格式和體裁文書,則要求譯員具備相關的文書翻譯能力,具備為1,否則為O該譯員被過濾掉。在第一層匹配之后,通過第二層的譯稿的基因屬性來計算譯員相應語種、行業、學科、領域的翻譯能力,其值為一個O 100的數值。按照圖2所示的模塊結構量化,該方法的流程過程如下:提取測試稿件一篇中到英的有關汽車發動機制造的測試稿件,其語種信息、行業信息和學科領域信息為:語種信息:中一英行業信息:37交通運輸設備制造業372汽車制造3721汽車整車制造學科領域信息:470動力與電氣工程470.30動力機械工程470.3020內燃機工程(包括汽油機、柴油機、氣體燃料發動機等)對譯員能力進行判斷,如果已經經過判定,則進入譯員能力選擇/比較模塊,如果沒有經過判定,則進行翻譯能力測試系統登陸模塊。譯員登錄平臺申請領取測試稿件。系統讀取測試稿件的語種、行業、學科、領域等屬性信息,若譯員具備該屬性能力,則進入譯員能力比較/選擇模塊;否則分配測試許可號給該譯員進行該專業屬性能力的翻譯測試;申領譯員憑測試許可號登錄翻譯能力測試系統,進行該語種、行業、學科、領域的翻譯能力測試;系統根據測試許可號,從標準測試文檔庫中提取7篇相關測試文檔給待測譯員,包括語種類文檔I篇,行業類文檔3篇(37、372、3721),學科領域類文檔3篇(470、470.30、470.3020),其難度系數分別為:9、6、8、8、7、8、7,排列順序為語種、行業-交通運輸設備制造業(37)、行業-交通運輸設備制造業-汽車制造(372)、行業-交通運輸設備制造業-汽車制造-汽車整車制造(3721)、學科領域信息-動力與電氣工程(470)、學科領域信息-動力與電氣工程-動力機械工程(470.30)、學科領域信息-動力與電氣工程-動力機械工程-內燃機工程(470.3020),后面的數字順序與此相同;譯員翻譯完成后,根據翻譯時間得到7篇譯文的翻譯速度檔位值分別為:6、8、7、6、6、7、7,然后調用相似性比較模塊計算譯員的譯文和標準譯文的相似度,得到7篇譯文和標準譯文的相似度值,分別為:0.6,0.65,0.79,0.83,0.77,0.82,0.85 ;優選地,稿件相似性比較模塊進行分析的過程包括:S21:提取每篇譯后稿件和與其對應的標準譯稿所歸屬的屬于一個專業的多篇標準譯稿的全部關鍵詞,得到關鍵詞集合C= {k1;k2,-,kj ;S22:計算C中每個關鍵詞k在稿件集合中出現的概率,即出現關鍵詞k的稿件數和稿件總數之比,記為P (k)。將關鍵詞按P (k)進行降序排序,并將每一個關鍵詞作為一個集合,這樣得到初始的m個待合并集合,記為Ik1),{k2),..., {km);在這m個關鍵詞中 ,計算在關鍵詞Ici出現的稿件中,關鍵詞kj也出現的概率,記為P(IijIki),共計P 2m個條件概率,(l〈i, j彡m ;i關j);p (kj │ ki)的計算方法:p (kj │ki) =p (kjki) /P(kjki)為 kj、ki 同時出現本文檔來自技高網...
【技術保護點】
一種多策略譯員稿件自動匹配的方法,其特征在于,包括:讀取待譯稿件的各個屬性,篩選出滿足全部屬性要求的譯員;讀取所述篩選出的譯員ID,對每個譯員的譯后稿件與標準譯稿進行相似性分析,確定每個譯員的翻譯能力的量化值;確定為每個譯員設定的合適度值;將每個譯員的量化值、合適度值的和進行排序,選擇出分值最高的譯員。
【技術特征摘要】
1.一種多策略譯員稿件自動匹配的方法,其特征在于,包括: 讀取待譯稿件的各個屬性,篩選出滿足全部屬性要求的譯員; 讀取所述篩選出的譯員ID,對每個譯員的譯后稿件與標準譯稿進行相似性分析,確定每個譯員的翻譯能力的量化值; 確定為每個譯員設定的合適度值; 將每個譯員的量化值、合適度值的和進行排序,選擇出分值最高的譯員。2.根據權利要求1所述的 方法,其特征在于,所述待譯稿件的各個屬性至少包括之一: 翻譯價格、退稿率、翻譯需求、專項稿件。3.根據權利要求1所述的方法,其特征在于,所述篩選的過程包括: 確定該譯員的狀態為接案狀態后,讀取該譯員的與所述待譯稿件相同的屬性; 至少執行以下之一的屬性篩選: 如果所述譯員的翻譯價格屬性的值在所述待譯稿件的翻譯價格屬性的的上下限閥值之間,則認為符合屬性要求; 如果所述譯員的退稿率屬性的值小于所述待譯稿件的退稿率屬性的值,則認為符合屬性要求; 如果所述譯員的翻譯需求屬性的內容包含所述待譯稿件的翻譯需求屬性的內容,則認為符合屬性要求; 如果所述譯員的專項稿件的能力屬性符合所述待譯稿件的專項稿件屬性的內容,則認為符合屬性要求。4.根據權利要求1所述的方法,其特征在于,所述合適度的計算項至少包括以下之一: 退稿率、及時交稿率、稿件可用率、翻譯性價比、合作次數、低級失誤;其中,每一項對應一個介于(TlOO之間的數值。所述確定合適度值的過程包括: 設定多個合適度計算項的權重; 將每個合適度計算項與其對應的權重相乘,將所述多個合適度計算項的乘積的和作為所述和適度值。5.根據權利要求1所述的方法,其特征在于,所述相似性分析的過程包括: 提取每篇譯后稿件和與其對應的測試文檔庫中的標準譯稿集合的關鍵詞;該關鍵詞的集合為 C={k1; k2,..., kj ; 計算C中每個關鍵詞k在稿件中出現的概率,即出現關鍵詞k的稿件數和稿件總數之比,記為P (k); 將C中關鍵詞按P (k)進行降序排序,并將每...
【專利技術屬性】
技術研發人員:江潮,
申請(專利權)人:武漢傳神信息技術有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。