【技術(shù)實現(xiàn)步驟摘要】
本專利技術(shù)涉及人工智能,具體涉及一種基于大模型的命題考題難度評估方法及系統(tǒng)。
技術(shù)介紹
1、在人才考試測評體系中,基于大模型的命題考題難度評估方法引起了廣泛關(guān)注。通過應(yīng)用先進的機器學(xué)習(xí)技術(shù),尤其是大規(guī)模預(yù)訓(xùn)練模型(如gpt等),自動評估考題難度成為可能。這種方法的核心在于利用大量已標(biāo)記的試題數(shù)據(jù)進行模型訓(xùn)練,使其能夠識別并學(xué)習(xí)與考題難度相關(guān)的特征,從而對新試題進行預(yù)測。
2、然而,該方法在實際應(yīng)用中面臨以下幾個關(guān)鍵問題:多因素難度影響:試題難度不僅取決于知識點的復(fù)雜性,還與解題技巧的要求、試題的邏輯結(jié)構(gòu)、語言表述的清晰度等多種因素密切相關(guān),這些因素往往在大模型的訓(xùn)練數(shù)據(jù)中并未充分量化和表達,導(dǎo)致模型在評估復(fù)雜性較高的考題時,可能無法準(zhǔn)確捕捉這些細微差異;數(shù)據(jù)標(biāo)注的一致性和代表性:模型訓(xùn)練依賴于大量已標(biāo)記的試題數(shù)據(jù),這些數(shù)據(jù)的質(zhì)量和一致性對模型的評估能力至關(guān)重要。
3、現(xiàn)實中標(biāo)記難度等級的過程往往存在主觀性和不一致性,特別是在不同文化背景下,難度的定義可能存在差異,這可能導(dǎo)致模型評估結(jié)果的不穩(wěn)定性和代表性不足;雖然大模型在處理常見試題類型時表現(xiàn)優(yōu)異,但面對具有創(chuàng)新性或非常規(guī)結(jié)構(gòu)的考題時,其評估能力可能受到限制。模型能否在不同領(lǐng)域或?qū)W科的試題中保持一致的評估效果,是當(dāng)前研究的一大挑戰(zhàn);大規(guī)模預(yù)訓(xùn)練模型通常需要高昂的計算資源來進行訓(xùn)練和推理。對于大規(guī)模試題庫的實時難度評估,這可能會帶來性能和成本方面的瓶頸。
技術(shù)實現(xiàn)思路
1、本專利技術(shù)的目的在于提供一種基于大模型
2、為實現(xiàn)上述目的,本專利技術(shù)提供如下技術(shù)方案:一種基于大模型的命題考題難度評估方法,所述方法包括如下步驟:
3、s1:獲取命題考題及其對應(yīng)的參考答案;
4、s2:基于預(yù)訓(xùn)練的大語言模型對命題考題進行解析并生成解析結(jié)果;
5、s3:比較解析結(jié)果與參考答案的一致性程度,確定命題考題的難度等級;
6、其中,所述步驟s3包括:
7、解析結(jié)果和參考答案進行分詞處理,并分別將解析結(jié)果和參考答案轉(zhuǎn)化為序列;
8、通過對比兩個序列中的元素,計算兩個序列的距離矩陣,距離矩陣的計算公式為:
9、,
10、其中,表示從解析結(jié)果序列中的第i個詞匯到參考答案序列中第j個詞匯的累計最小對齊距離,表示解析結(jié)果序列中的第i個詞匯和參考答案序列中第j個詞匯之間的距離,i,j分別表示解析結(jié)果序列和參考答案序列的索引;
11、通過上述計算,可以獲得從矩陣左上角d(1,1)到右下角d(m,n)的最小對齊路徑,其中,m和n分別表示解析結(jié)果序列和參考答案序列的長度;
12、根據(jù)距離d(m,n)的大小,劃分命題考題難度。
13、優(yōu)選的,所述步驟s1中獲取命題考題及其對應(yīng)的參考答案具體包括:
14、s11:從數(shù)據(jù)庫中檢索命題考題;
15、s12:基于命題考題的標(biāo)識符提取對應(yīng)的參考答案;
16、s13:對命題考題進行格式化處理以確保其符合大語言模型輸入的要求;
17、s14:將格式化后的命題考題及其對應(yīng)的參考答案存儲至臨時緩存區(qū)。
18、優(yōu)選的,所述步驟s12基于命題考題的標(biāo)識符提取對應(yīng)的參考答案具體包括:
19、構(gòu)建命題考題標(biāo)識符與參考答案之間的映射關(guān)系表;
20、基于命題考題的標(biāo)識符查詢映射關(guān)系表以獲得對應(yīng)的參考答案;
21、如果查詢結(jié)果為空,則認為該命題考題沒有對應(yīng)的參考答案;
22、如果查詢結(jié)果不為空,則將查詢到的參考答案作為后續(xù)處理的對象;
23、其中,所述構(gòu)建命題考題標(biāo)識符與參考答案之間的映射關(guān)系表包括:
24、收集命題考題及其對應(yīng)的參考答案,并為每個命題考題分配唯一的標(biāo)識符;
25、基于命題考題的唯一標(biāo)識符建立與參考答案的關(guān)聯(lián);
26、判斷命題考題的唯一標(biāo)識符是否已經(jīng)存在于映射關(guān)系表中,如果不存在,則添加該映射關(guān)系;
27、如果存在,則更新該映射關(guān)系表中的參考答案。
28、優(yōu)選的,所述判斷命題考題的唯一標(biāo)識符是否已經(jīng)存在于映射關(guān)系表中具體包括:
29、遍歷映射關(guān)系表中的所有記錄;
30、如果發(fā)現(xiàn)與當(dāng)前命題考題的唯一標(biāo)識符相同的記錄,則認為該標(biāo)識符已存在;
31、如果遍歷結(jié)束后未發(fā)現(xiàn)相同的記錄,則認為該標(biāo)識符不存在;
32、如果標(biāo)識符不存在,則執(zhí)行添加操作;如果標(biāo)識符存在,則執(zhí)行更新操作;
33、其中,所述執(zhí)行添加操作具體包括:
34、創(chuàng)建一個新的記錄,包含命題考題的唯一標(biāo)識符和對應(yīng)的參考答案;
35、將新創(chuàng)建的記錄添加到映射關(guān)系表中;
36、更新映射關(guān)系表的版本號以反映最新的更改;
37、執(zhí)行一致性檢查以確保添加操作成功。
38、優(yōu)選的,所述s2中基于預(yù)訓(xùn)練的大語言模型對所述命題考題進行解析并生成解析結(jié)果的具體步驟包括:
39、s21:將所述命題考題輸入至預(yù)訓(xùn)練的大語言模型中;
40、s22:基于所述大語言模型的內(nèi)部語言結(jié)構(gòu)分析機制,提取命題考題的關(guān)鍵信息;
41、s23:利用公式化的方法計算關(guān)鍵信息的相關(guān)性得分,其中相關(guān)性得分r由命題考題中關(guān)鍵詞出現(xiàn)的頻率f和位置權(quán)重w決定,即r=f×w;
42、s24:根據(jù)所述關(guān)鍵信息生成初步解析結(jié)果。
43、優(yōu)選的,所述基于所述大語言模型的內(nèi)部語言結(jié)構(gòu)分析機制,提取命題考題的關(guān)鍵信息的步驟包括:
44、對命題考題進行分詞處理,得到命題考題的基本詞匯單元;
45、基于所述大語言模型的語義理解能力,識別命題考題中的實體和概念;
46、利用公式化的方法判斷實體或概念的重要性,其中重要性i由實體或概念在領(lǐng)域知識庫中的出現(xiàn)頻率f和命題考題中的位置p決定,即i=f+p;
47、篩選出命題考題中的關(guān)鍵實體和概念。
48、優(yōu)選的,所述利用公式化的方法判斷實體或概念的重要性,其中重要性i由實體或概念在領(lǐng)域知識庫中的出現(xiàn)頻率f和命題考題中的位置p決定,即i?=f+p具體包括:
49、查詢領(lǐng)域知識庫以獲取實體或概念的出現(xiàn)頻率f;
50、根據(jù)命題考題中實體或概念的位置,賦予不同的位置權(quán)重p;
51、基于所述出現(xiàn)頻率f和位置權(quán)重p計算重要性i;
52、如果重要性i大于預(yù)定閾值t,則認為該實體或概念是關(guān)鍵信息。
53、優(yōu)選的,所述如果重要性i大于預(yù)定閾值t,則認為該實體或概念是關(guān)鍵信息具體包括:
本文檔來自技高網(wǎng)...【技術(shù)保護點】
1.一種基于大模型的命題考題難度評估方法,其特征在于,所述方法包括如下步驟:
2.根據(jù)權(quán)利要求1所述的一種基于大模型的命題考題難度評估方法,其特征在于:所述步驟S1中獲取命題考題及其對應(yīng)的參考答案具體包括:
3.根據(jù)權(quán)利要求2所述的一種基于大模型的命題考題難度評估方法,其特征在于,所述步驟S12基于命題考題的標(biāo)識符提取對應(yīng)的參考答案具體包括:
4.根據(jù)權(quán)利要求3所述的一種基于大模型的命題考題難度評估方法,其特征在于,所述判斷命題考題的唯一標(biāo)識符是否已經(jīng)存在于映射關(guān)系表中具體包括:
5.根據(jù)權(quán)利要求1所述的一種基于大模型的命題考題難度評估方法,其特征在于,所述S2中基于預(yù)訓(xùn)練的大語言模型對所述命題考題進行解析并生成解析結(jié)果的具體步驟包括:
6.根據(jù)權(quán)利要求5所述的一種基于大模型的命題考題難度評估方法,其特征在于,所述基于所述大語言模型的內(nèi)部語言結(jié)構(gòu)分析機制,提取命題考題的關(guān)鍵信息的步驟包括:
7.根據(jù)權(quán)利要求6所述的一種基于大模型的命題考題難度評估方法,其特征在于,所述利用公式化的方法判斷實體或概念的重要性,其
8.根據(jù)權(quán)利要求7所述的一種基于大模型的命題考題難度評估方法,其特征在于,所述如果重要性I大于預(yù)定閾值T,則認為該實體或概念是關(guān)鍵信息具體包括:
9.根據(jù)權(quán)利要求1所述的一種基于大模型的命題考題難度評估方法,其特征在于,所述步驟S3具體包括:
10.一種基于大模型的命題考題難度評估系統(tǒng),其特征在于,采用權(quán)利要求1-9任一項所述的基于大模型的命題考題難度評估方法,所述系統(tǒng)包括:
...【技術(shù)特征摘要】
1.一種基于大模型的命題考題難度評估方法,其特征在于,所述方法包括如下步驟:
2.根據(jù)權(quán)利要求1所述的一種基于大模型的命題考題難度評估方法,其特征在于:所述步驟s1中獲取命題考題及其對應(yīng)的參考答案具體包括:
3.根據(jù)權(quán)利要求2所述的一種基于大模型的命題考題難度評估方法,其特征在于,所述步驟s12基于命題考題的標(biāo)識符提取對應(yīng)的參考答案具體包括:
4.根據(jù)權(quán)利要求3所述的一種基于大模型的命題考題難度評估方法,其特征在于,所述判斷命題考題的唯一標(biāo)識符是否已經(jīng)存在于映射關(guān)系表中具體包括:
5.根據(jù)權(quán)利要求1所述的一種基于大模型的命題考題難度評估方法,其特征在于,所述s2中基于預(yù)訓(xùn)練的大語言模型對所述命題考題進行解析并生成解析結(jié)果的具體步驟包括:
6.根據(jù)權(quán)利要求5所述的一種基于大模型的命題考題...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:馬赫,倪小明,郭南明,杜育林,洪潛凱,劉佳榮,李劍,崔浩松,蔣亦萱,
申請(專利權(quán))人:網(wǎng)才科技廣州集團股份有限公司,
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。