System.ArgumentOutOfRangeException: 索引和長(zhǎng)度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 免费a级毛片无码a∨免费软件,国产激情无码视频在线播放性色,久久久无码精品亚洲日韩京东传媒
  • 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種大模型適配方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)制造方法及圖紙

    技術(shù)編號(hào):44529365 閱讀:1 留言:0更新日期:2025-03-07 13:19
    本發(fā)明專利技術(shù)公開了一種大模型適配方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)。第大模型適配方法,包括:基于歷史主網(wǎng)操作指令數(shù)據(jù),對(duì)預(yù)訓(xùn)練大模型進(jìn)行參數(shù)微調(diào),得到微調(diào)主網(wǎng)大模型;采用微調(diào)主網(wǎng)大模型執(zhí)行主網(wǎng)操作任務(wù),得到微調(diào)主網(wǎng)大模型的輸出結(jié)果和基于輸出結(jié)果的反饋數(shù)據(jù);基于輸出結(jié)果和反饋數(shù)據(jù),對(duì)微調(diào)主網(wǎng)大模型進(jìn)行強(qiáng)化學(xué)習(xí),得到主網(wǎng)操作任務(wù)大模型。本發(fā)明專利技術(shù)實(shí)施例的技術(shù)方案,可以提高大模型對(duì)電網(wǎng)指令的理解能力。

    【技術(shù)實(shí)現(xiàn)步驟摘要】

    本專利技術(shù)涉及機(jī)器學(xué)習(xí),尤其涉及一種大模型適配方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)


    技術(shù)介紹

    1、大語言模型(large?languagemodel,簡(jiǎn)稱llm),后續(xù)簡(jiǎn)稱為“大模型”,是指在自然語言處理和機(jī)器學(xué)習(xí)領(lǐng)域中使用的具有龐大參數(shù)量和復(fù)雜結(jié)構(gòu)的深度學(xué)習(xí)模型,大模型目前在各領(lǐng)域得到廣泛應(yīng)用。

    2、大模型擅長(zhǎng)于文本處理,但在直接解決具體任務(wù)時(shí)容易出現(xiàn)偏差。例如,大模型在電網(wǎng)主網(wǎng)操作任務(wù)執(zhí)行過程中,可能會(huì)出現(xiàn)理解或執(zhí)行錯(cuò)誤的情況。因此,如何提高大語言模型理解和執(zhí)行主網(wǎng)的操作任務(wù)指令,對(duì)于提高電網(wǎng)主網(wǎng)調(diào)度任務(wù)執(zhí)行的準(zhǔn)確性和執(zhí)行效率十分重要。


    技術(shù)實(shí)現(xiàn)思路

    1、本專利技術(shù)提供了一種大模型適配方法、裝置、設(shè)備及存儲(chǔ)介質(zhì),以解決大模型在電網(wǎng)主網(wǎng)調(diào)度任務(wù)執(zhí)行準(zhǔn)確性低的問題。

    2、根據(jù)本專利技術(shù)的一方面,提供了一種大模型適配方法,包括:

    3、基于歷史主網(wǎng)操作指令數(shù)據(jù),對(duì)預(yù)訓(xùn)練大模型進(jìn)行參數(shù)微調(diào),得到微調(diào)主網(wǎng)大模型;

    4、采用所述微調(diào)主網(wǎng)大模型執(zhí)行主網(wǎng)操作任務(wù),得到微調(diào)主網(wǎng)大模型的輸出結(jié)果和基于所述輸出結(jié)果的反饋數(shù)據(jù);

    5、基于所述輸出結(jié)果和所述反饋數(shù)據(jù),對(duì)所述微調(diào)主網(wǎng)大模型進(jìn)行強(qiáng)化學(xué)習(xí),得到主網(wǎng)操作任務(wù)大模型。

    6、根據(jù)本專利技術(shù)的另一方面,提供了一種大模型適配裝置,包括:

    7、參數(shù)微調(diào)模塊,用于基于歷史主網(wǎng)操作指令數(shù)據(jù),對(duì)預(yù)訓(xùn)練大模型進(jìn)行參數(shù)微調(diào),得到微調(diào)主網(wǎng)大模型;

    8、反饋獲取模塊,用于采用所述微調(diào)主網(wǎng)大模型執(zhí)行主網(wǎng)操作任務(wù),得到微調(diào)主網(wǎng)大模型的輸出結(jié)果和基于所述輸出結(jié)果的反饋數(shù)據(jù);

    9、強(qiáng)化學(xué)習(xí)模塊,用于基于所述輸出結(jié)果和所述反饋數(shù)據(jù),對(duì)所述微調(diào)主網(wǎng)大模型進(jìn)行強(qiáng)化學(xué)習(xí),得到主網(wǎng)操作任務(wù)大模型。

    10、根據(jù)本專利技術(shù)的另一方面,提供了一種電子設(shè)備,所述電子設(shè)備包括:

    11、至少一個(gè)處理器;以及

    12、與所述至少一個(gè)處理器通信連接的存儲(chǔ)器;其中,

    13、所述存儲(chǔ)器存儲(chǔ)有可被所述至少一個(gè)處理器執(zhí)行的計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被所述至少一個(gè)處理器執(zhí)行,以使所述至少一個(gè)處理器能夠執(zhí)行本專利技術(shù)任一實(shí)施例所述的大模型適配方法。

    14、根據(jù)本專利技術(shù)的另一方面,提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)指令,所述計(jì)算機(jī)指令用于使處理器執(zhí)行時(shí)實(shí)現(xiàn)本專利技術(shù)任一實(shí)施例所述的大模型適配方法。

    15、根據(jù)本專利技術(shù)的另一方面,提供了一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,計(jì)算機(jī)程序在被處理器執(zhí)行時(shí)實(shí)現(xiàn)本公開任一實(shí)施例的大模型適配方法。

    16、本專利技術(shù)實(shí)施例的技術(shù)方案,基于歷史主網(wǎng)操作指令數(shù)據(jù),對(duì)預(yù)訓(xùn)練大模型進(jìn)行參數(shù)微調(diào),得到微調(diào)主網(wǎng)大模型,進(jìn)而采用微調(diào)主網(wǎng)大模型執(zhí)行主網(wǎng)操作任務(wù),得到微調(diào)主網(wǎng)大模型的輸出結(jié)果和基于輸出結(jié)果的反饋數(shù)據(jù),最終基于輸出結(jié)果和反饋數(shù)據(jù),對(duì)微調(diào)主網(wǎng)大模型進(jìn)行強(qiáng)化學(xué)習(xí),得到主網(wǎng)操作任務(wù)大模型,通過歷史主網(wǎng)操作指令數(shù)據(jù)對(duì)預(yù)訓(xùn)練大模型進(jìn)行參數(shù)微調(diào),可以提高大模型對(duì)電網(wǎng)指令的理解能力,并且基于反饋數(shù)據(jù)進(jìn)一步強(qiáng)化學(xué)習(xí),可以是的大模型輸出更符合實(shí)際業(yè)務(wù)需求。

    17、應(yīng)當(dāng)理解,本部分所描述的內(nèi)容并非旨在標(biāo)識(shí)本專利技術(shù)的實(shí)施例的關(guān)鍵或重要特征,也不用于限制本專利技術(shù)的范圍。本專利技術(shù)的其它特征將通過以下的說明書而變得容易理解。

    本文檔來自技高網(wǎng)...

    【技術(shù)保護(hù)點(diǎn)】

    1.一種大模型適配方法,其特征在于,包括:

    2.根據(jù)權(quán)利要求1所述的方法,其特征在于,基于歷史主網(wǎng)操作指令數(shù)據(jù),對(duì)預(yù)訓(xùn)練大模型進(jìn)行參數(shù)微調(diào),得到微調(diào)主網(wǎng)大模型,包括:

    3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述損失函數(shù)具體如下:

    4.根據(jù)權(quán)利要求1所述的方法,其特征在于,基于所述輸出結(jié)果和所述反饋數(shù)據(jù),對(duì)所述微調(diào)主網(wǎng)大模型進(jìn)行強(qiáng)化學(xué)習(xí),得到主網(wǎng)操作任務(wù)大模型,包括:

    5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述獎(jiǎng)勵(lì)函數(shù)具體如下:

    6.根據(jù)權(quán)利要求2所述的方法,其特征在于,基于損失函數(shù),對(duì)預(yù)訓(xùn)練大模型進(jìn)行參數(shù)微調(diào),得到微調(diào)主網(wǎng)大模型,包括:

    7.根據(jù)權(quán)利要求1所述的方法,其特征在于,在對(duì)預(yù)訓(xùn)練大模型進(jìn)行參數(shù)微調(diào),得到微調(diào)主網(wǎng)大模型之后,還包括:

    8.一種大模型適配裝置,其特征在于,包括:

    9.一種電子設(shè)備,其特征在于,所述電子設(shè)備包括:

    10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)指令,所述計(jì)算機(jī)指令用于使處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1-7中任一項(xiàng)所述的大模型適配方法。

    ...

    【技術(shù)特征摘要】

    1.一種大模型適配方法,其特征在于,包括:

    2.根據(jù)權(quán)利要求1所述的方法,其特征在于,基于歷史主網(wǎng)操作指令數(shù)據(jù),對(duì)預(yù)訓(xùn)練大模型進(jìn)行參數(shù)微調(diào),得到微調(diào)主網(wǎng)大模型,包括:

    3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述損失函數(shù)具體如下:

    4.根據(jù)權(quán)利要求1所述的方法,其特征在于,基于所述輸出結(jié)果和所述反饋數(shù)據(jù),對(duì)所述微調(diào)主網(wǎng)大模型進(jìn)行強(qiáng)化學(xué)習(xí),得到主網(wǎng)操作任務(wù)大模型,包括:

    5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述獎(jiǎng)勵(lì)函數(shù)具體如下:

    6.根據(jù)權(quán)利...

    【專利技術(shù)屬性】
    技術(shù)研發(fā)人員:賴偉堅(jiān)邱澤堅(jiān)司徒友羅松林蔡新雷劉樹安李敬光汪杰李敬航郝乾嘯
    申請(qǐng)(專利權(quán))人:廣東電網(wǎng)有限責(zé)任公司
    類型:發(fā)明
    國(guó)別省市:

    網(wǎng)友詢問留言 已有0條評(píng)論
    • 還沒有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。

    1
    主站蜘蛛池模板: 国产丰满乱子伦无码专区| 亚洲中文字幕久久精品无码VA| 精品无码AV一区二区三区不卡| 人妻aⅴ无码一区二区三区| 亚洲精品无码一区二区| 国产精品无码v在线观看| 中文字幕乱偷无码av先锋蜜桃| yy111111少妇影院里无码| 在线看片无码永久免费视频| 熟妇人妻系列av无码一区二区| 丰满爆乳无码一区二区三区| 精品无码一区在线观看| 亚洲日韩av无码| 国精品无码一区二区三区在线蜜臀 | 中文字幕无码乱人伦| 免费无码又爽又刺激高潮 | 久久99精品久久久久久hb无码| 中文无码AV一区二区三区 | 无码国产精成人午夜视频一区二区 | 人妻无码αv中文字幕久久琪琪布| 精品一区二区三区无码视频| 性虎精品无码AV导航| 精品无码一区在线观看| 日韩精品无码免费一区二区三区| 国产成人无码一区二区在线观看| 日韩aⅴ人妻无码一区二区| 色综合无码AV网站| 免费看国产成年无码AV片| 无码专区永久免费AV网站| 18禁免费无码无遮挡不卡网站 | 国产无码一区二区在线| 日韩毛片无码永久免费看| 人妻精品无码一区二区三区| 亚洲久热无码av中文字幕| 亚洲av无码偷拍在线观看| 亚洲国产精品无码久久久秋霞1| 无码精品黑人一区二区三区| 亚洲AV无码国产在丝袜线观看| 寂寞少妇做spa按摩无码| 亚洲中文字幕无码久久2017| 亚洲AV无码乱码在线观看富二代 |