【技術實現步驟摘要】
本專利技術涉及司法鑒定,尤其涉及一種基于llama模型的電子數據司法鑒定意見書質量評估方法及系統。
技術介紹
1、電子數據司法鑒定是指運用計算機科學理論和技術,以及其他相關專門知識和經驗,對涉及訴訟的電子數據有關內容進行判斷、鑒別并出具鑒定意見的活動。司法鑒定結果關系到司法公正的實現和人民群眾合法權益的保護,因此,需要對司法鑒定的過程和結果進行嚴格的評估與控制,確保司法鑒定意見書的可靠性。其中,鑒定程序是否符合相應的法律法規,以及鑒定過程和鑒定意見是否符合國家標準、行業標準、技術規范是司法鑒定意見書質量評估的關鍵步驟。
2、傳統的司法鑒定意見書質量評估方法主要依賴于人工操作。隨著通訊技術、互聯網等科技技術的迅猛發展,電子數據司法鑒定的需求日益增長,案件的數量呈現出逐年遞增的趨勢。這種傳統的人工評估方法效率低下,已無法適應質量評估需求的日益增長。
3、近年來,鑒于大模型在各行業內的深度應用并取得了矚目的成果,已有一些現有技術將大模型應用于對話、實驗報告、翻譯等文本的質量評估中。例如,將每個實驗要求自動解析和轉化為評估決策樹,根據實驗任務檢索對應的評估決策樹,并利用評估決策樹對每個實驗主題進行評級,結合設計的提示詞模板和每個主題的評分結果,調用大模型生成最終實驗評語。以及,將待評估的對話問答數據分為客觀問答數據組和主觀問答數據組,分別構建評估指令得到待評估模型的第一應答質量評估值和第二應答質量評估值,進行綜合判斷后得到基于大模型的評估等級結果。
4、然而,這些現有技術在應用于電子數據司法鑒定意見書
技術實現思路
1、為了解決以上技術問題,本專利技術提供了一種基于llama模型的電子數據司法鑒定意見書質量評估方法;另一方面,還提供了一種基于llama模型的電子數據司法鑒定意見書質量評估系統。
2、本專利技術所解決的技術問題可以采用以下技術方案實現:
3、本專利技術的第一方面是提供一種基于llama模型的電子數據司法鑒定意見書質量評估方法,包括:
4、步驟s1,根據電子數據司法鑒定意見書的質量評估數據,構建訓練數據;
5、步驟s2,根據所述訓練數據,采用低階自適應算法對大型語言模型進行監督微調訓練,得到應用于司法鑒定意見書質量評估垂直領域的質量評估模型;
6、步驟s3,針對待評估司法鑒定意見書,判斷所述待評估司法鑒定意見書中所使用的鑒定標準是否適用正確;
7、若是,則進入步驟s4;
8、若否,則判定所述待評估司法鑒定意見書不合格,并輸出理由;
9、步驟s4,基于檢索增強生成模型和提示工程,使所述質量評估模型輸出針對所述待評估司法鑒定意見書的質量評估結果。
10、作為優選的實施方式,其中,所述步驟s1包括:
11、步驟s11,對所述質量評估數據進行數據過濾,得到第一篩選數據;
12、步驟s12,對所述第一篩選數據進行數據脫敏,得到第二篩選數據,并將所述第二篩選數據作為所述訓練數據。
13、作為優選的實施方式,其中,所述步驟s11中,基于預設過濾規則對所述質量評估數據進行提取,得到所述第一篩選數據,所述第一篩選數據至少包括鑒定文本內容、專家評估分數以及專家評估意見中的任意一種或多種組合。
14、作為優選的實施方式,其中,所述步驟s12中,以預設字符替換鑒定文本中的敏感信息,以得到數據脫敏后的第二篩選數據。
15、作為優選的實施方式,其中,所述大型語言模型為llama模型。
16、作為優選的實施方式,其中,所述步驟s2包括:
17、步驟s21,對所述訓練數據進行分詞和編碼,得到鑒定意見向量;
18、步驟s22,對所述大型語言模型的第一權重參數進行凍結;
19、步驟s23,對所述大型語言模型的交叉注意力層添加可訓練的第二權重參數;
20、步驟s24,根據所述鑒定意見向量對所述第二權重參數進行訓練或更新,得到訓練或更新后的第二權重參數;
21、步驟s25,對所述訓練或更新后的第二權重參數與凍結的所述第一權重參數進行合并,得到合并后的權重參數,并基于所述合并后的權重參數構建得到所述質量評估模型。
22、作為優選的實施方式,其中,所述步驟s3包括:
23、步驟s31,基于所述質量評估模型提取待評估司法鑒定意見書中的委托事項以及所使用的鑒定標準;
24、步驟s32,基于預先構建的電子數據司法鑒定標準適用規則庫,確定所述待評估司法鑒定意見書中所使用的鑒定標準是否適用正確以及是否滿足所述委托事項的要求。
25、作為優選的實施方式,其中,所述步驟s4包括:
26、步驟s41,根據所述待評估司法鑒定意見書中所使用的鑒定標準名詞,調用檢索增強生成模型獲取鑒定標準相關知識內容,利用所述質量評估模型根據所述鑒定標準相關知識內容和第一提示詞總結鑒定步驟;
27、步驟s42,將所述待評估司法鑒定意見書與總結的所述鑒定步驟輸入提示詞模板中,利用所述質量評估模型進行判斷,并輸出完整性、順序性和邏輯性判斷結果;
28、步驟s43,根據所述完整性、順序性和邏輯性判斷結果中的扣分理由與相應的扣分分數,計算評估分數,隨后,將扣分理由輸入至所述質量評估模型中,以生成所述質量評估結果。
29、作為優選的實施方式,其中,所述步驟s42包括:
30、步驟s421,利用所述質量評估模型,依據第二提示詞輸出完整性判斷結果,所述第二提示詞的任務描述包括所述待評估司法鑒定意見書的全文、總結的所述鑒定步驟以及判斷鑒定過程是否遵循鑒定標準要求的檢驗步驟的指令,輸出格式包含步驟序號、回答、理由及對應的鑒定意見書原文內容;
31、步驟s422,根據相鄰兩個步驟序號對應的鑒定意見書原文內容在所述待評估司法鑒定意見書中的位置與鑒定標準的操作順序進行比較,輸出順序性判斷結果;
32、步驟s423,利用所述質量評估模型,依據第三提示詞輸出邏輯性判斷結果,所述第三提示詞的任務描述包括所述待評估司法鑒定意見書的全文以及判斷鑒定過程與鑒定意見是否一致本文檔來自技高網...
【技術保護點】
1.一種基于Llama模型的電子數據司法鑒定意見書質量評估方法,其特征在于,包括:
2.根據權利要求1所述的方法,其特征在于,所述步驟S1包括:
3.根據權利要求2所述的方法,其特征在于,所述步驟S11中,基于預設過濾規則對所述質量評估數據進行提取,得到所述第一篩選數據,所述第一篩選數據至少包括鑒定文本內容、專家評估分數以及專家評估意見中的任意一種或多種組合。
4.根據權利要求2所述的方法,其特征在于,所述步驟S12中,以預設字符替換鑒定文本中的敏感信息,以得到數據脫敏后的第二篩選數據。
5.根據權利要求1所述的方法,其特征在于,所述大型語言模型為Llama模型。
6.根據權利要求1所述的方法,其特征在于,所述步驟S2包括:
7.根據權利要求1所述的方法,其特征在于,所述步驟S3包括:
8.根據權利要求1所述的方法,其特征在于,所述步驟S4包括:
9.根據權利要求1所述的方法,其特征在于,所述步驟S42包括:
10.一種基于Llama模型的電子數據司法鑒定意見書質量評估系統
...【技術特征摘要】
1.一種基于llama模型的電子數據司法鑒定意見書質量評估方法,其特征在于,包括:
2.根據權利要求1所述的方法,其特征在于,所述步驟s1包括:
3.根據權利要求2所述的方法,其特征在于,所述步驟s11中,基于預設過濾規則對所述質量評估數據進行提取,得到所述第一篩選數據,所述第一篩選數據至少包括鑒定文本內容、專家評估分數以及專家評估意見中的任意一種或多種組合。
4.根據權利要求2所述的方法,其特征在于,所述步驟s12中,以預設字符替換鑒定文本中的敏感信息,以得到數據脫敏后的第二篩選數據。
5.根據權利...
【專利技術屬性】
技術研發人員:劉琪,張云集,孫楊,管林玉,
申請(專利權)人:公安部第三研究所,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。