System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 永久免费无码网站在线观看个,亚洲中文字幕无码中文,人妻无码一区二区三区四区
  • 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    視覺編碼器訓(xùn)練、描述方法、裝置、設(shè)備及介質(zhì)制造方法及圖紙

    技術(shù)編號:40790266 閱讀:19 留言:0更新日期:2024-03-28 19:20
    本申請?zhí)峁┝艘环N視覺編碼器訓(xùn)練、描述方法、裝置、設(shè)備及介質(zhì)。在該視覺編碼器訓(xùn)練方法中,獲取包括隱患圖像及其對應(yīng)的隱患描述文本的樣本數(shù)據(jù)對;并將隱患圖像輸入到待訓(xùn)練的視覺編碼器中,視覺編碼器將隱患圖像轉(zhuǎn)換為第一文本序列;將隱患描述文本和第一文本序列輸入到語言大模型中,獲取語言大模型輸出的預(yù)測描述文本;根據(jù)預(yù)測描述文本和隱患描述文本之間的相似度,視覺編碼器及語言大模型中的參數(shù)進(jìn)行調(diào)整,從而基于訓(xùn)練完成的視覺編碼器和語言大模型能夠得到隱患圖像對應(yīng)的、更準(zhǔn)確的隱患描述文本。

    【技術(shù)實(shí)現(xiàn)步驟摘要】

    本申請涉及模型,尤其涉及一種視覺編碼器訓(xùn)練、描述方法、裝置、設(shè)備及介質(zhì)


    技術(shù)介紹

    1、在安全項(xiàng)目中,需要根據(jù)用戶采集的隱患圖像即存在安全隱患的圖像,給出對應(yīng)的隱患描述文本。相關(guān)技術(shù)中還沒有根據(jù)隱患圖像得到隱患描述文本的方案。

    2、因此,如何訓(xùn)練視覺編碼器,從而基于訓(xùn)練完成的視覺編碼器得到隱患圖像對應(yīng)的、更準(zhǔn)確的隱患描述文本是亟待解決的技術(shù)問題。


    技術(shù)實(shí)現(xiàn)思路

    1、本申請?zhí)峁┝艘环N的視覺編碼器訓(xùn)練、描述方法、裝置、設(shè)備及介質(zhì),用于得到隱患圖像對應(yīng)的、更準(zhǔn)確的隱患描述文本。

    2、第一方面,本申請?zhí)峁┝艘环N視覺編碼器訓(xùn)練方法,所述方法包括:

    3、獲取樣本數(shù)據(jù)對;其中,所述樣本數(shù)據(jù)對包括隱患圖像及其對應(yīng)的隱患描述文本;

    4、將所述隱患圖像輸入到待訓(xùn)練的視覺編碼器中,所述視覺編碼器將所述隱患圖像轉(zhuǎn)換為第一文本序列;

    5、將所述隱患描述文本及其對應(yīng)的第一文本序列輸入到語言大模型中,所述語言大模型輸出所述第一文本序列對應(yīng)的預(yù)測描述文本;

    6、根據(jù)所述預(yù)測描述文本和所述隱患描述文本之間的相似度,對所述視覺編碼器及語言大模型中的參數(shù)進(jìn)行調(diào)整。

    7、在一種可能的實(shí)施方式中,所述方法還包括:

    8、將所述隱患描述文本輸入到訓(xùn)練完成的文本編碼器中,獲取所述文本編碼器輸出的所述隱患描述文本對應(yīng)的第二文本序列;

    9、根據(jù)所述第一文本序列和所述第二文本序列之間的相似度,對所述視覺編碼器中的參數(shù)進(jìn)行調(diào)整。</p>

    10、在一種可能的實(shí)施方式中,所述根據(jù)所述第一文本序列和所述第二文本序列之間的相似度,對所述視覺編碼器中的參數(shù)進(jìn)行調(diào)整包括:

    11、根據(jù)所述第一文本序列和所述第二文本序列以及最大化似然函數(shù),確定所述第一文本序列和所述第二文本序列之間的損失值;

    12、根據(jù)所述損失值,對所述視覺編碼器中的參數(shù)進(jìn)行調(diào)整。

    13、第二方面,本申請實(shí)施例提供了一種視覺描述方法,所述方法包括:

    14、將隱患圖像輸入到訓(xùn)練完成的視覺編碼器中,所述視覺編碼器將所述隱患圖像轉(zhuǎn)換為第一文本序列;

    15、將所述第一文本序列輸入到訓(xùn)練完成的語言大模型中,獲取所述語言大模型輸出的所述第一文本序列對應(yīng)的預(yù)測描述文本。

    16、第三方面,本申請實(shí)施例提供了一種視覺編碼器訓(xùn)練裝置,所述裝置包括:

    17、獲取模塊,用于獲取樣本數(shù)據(jù)對;其中,所述樣本數(shù)據(jù)對包括隱患圖像及其對應(yīng)的隱患描述文本;

    18、訓(xùn)練模塊,用于將所述隱患圖像輸入到待訓(xùn)練的視覺編碼器中,所述視覺編碼器將所述隱患圖像轉(zhuǎn)換為第一文本序列;將所述隱患描述文本及其對應(yīng)的第一文本序列輸入到語言大模型中,所述語言大模型輸出所述第一文本序列對應(yīng)的預(yù)測描述文本;

    19、調(diào)整模塊,用于根據(jù)所述預(yù)測描述文本和所述隱患描述文本之間的相似度,對所述視覺編碼器及語言大模型中的參數(shù)進(jìn)行調(diào)整。

    20、在一種可能的實(shí)施方式中,所述訓(xùn)練模塊,還用于將所述隱患描述文本輸入到訓(xùn)練完成的文本編碼器中,獲取所述文本編碼器輸出的所述隱患描述文本對應(yīng)的第二文本序列;

    21、所述調(diào)整模塊,還用于根據(jù)所述第一文本序列和所述第二文本序列之間的相似度,對所述視覺編碼器中的參數(shù)進(jìn)行調(diào)整。

    22、在一種可能的實(shí)施方式中,所述調(diào)整模塊,具體用于根據(jù)所述第一文本序列和所述第二文本序列以及最大化似然函數(shù),確定所述第一文本序列和所述第二文本序列之間的損失值;根據(jù)所述損失值,對所述視覺編碼器中的參數(shù)進(jìn)行調(diào)整。

    23、第四方面,本申請實(shí)施例提供了一種視覺描述裝置,所述裝置包括:

    24、轉(zhuǎn)換模塊,用于將隱患圖像輸入到訓(xùn)練完成的視覺編碼器中,所述視覺編碼器將所述隱患圖像轉(zhuǎn)換為第一文本序列;

    25、輸出模塊,用于將所述第一文本序列輸入到訓(xùn)練完成的語言大模型中,獲取所述語言大模型輸出的所述第一文本序列對應(yīng)的預(yù)測描述文本。

    26、第五方面,本申請?zhí)峁┝艘环N電子設(shè)備,所述電子設(shè)備至少包括處理器和存儲器,所述處理器用于執(zhí)行存儲器中存儲的計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)如上述任一所述方法的步驟。

    27、第六方面,本申請?zhí)峁┝艘环N計(jì)算機(jī)可讀存儲介質(zhì),所述計(jì)算機(jī)可讀存儲介質(zhì)內(nèi)存儲有可由電子設(shè)備執(zhí)行的計(jì)算機(jī)程序,當(dāng)所述程序在所述電子設(shè)備上運(yùn)行時(shí),使得所述電子設(shè)備執(zhí)行如上述任一所述方法的步驟。

    28、在本申請實(shí)施例中,獲取包括隱患圖像及其對應(yīng)的隱患描述文本的樣本數(shù)據(jù)對;并將隱患圖像輸入到待訓(xùn)練的視覺編碼器中,視覺編碼器將隱患圖像轉(zhuǎn)換為第一文本序列;將隱患描述文本和第一文本序列輸入到語言大模型中,獲取語言大模型輸出的預(yù)測描述文本;根據(jù)預(yù)測描述文本和隱患描述文本之間的相似度,視覺編碼器及語言大模型中的參數(shù)進(jìn)行調(diào)整,從而基于訓(xùn)練完成的視覺編碼器和語言大模型能夠得到隱患圖像對應(yīng)的、更準(zhǔn)確的隱患描述文本。

    本文檔來自技高網(wǎng)...

    【技術(shù)保護(hù)點(diǎn)】

    1.一種視覺編碼器訓(xùn)練方法,其特征在于,所述方法包括:

    2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:

    3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述根據(jù)所述第一文本序列和所述第二文本序列之間的相似度,對所述視覺編碼器中的參數(shù)進(jìn)行調(diào)整包括:

    4.一種視覺描述方法,其特征在于,所述方法包括:

    5.一種視覺編碼器訓(xùn)練裝置,其特征在于,所述裝置包括:

    6.根據(jù)權(quán)利要求5所述的裝置,其特征在于,所述訓(xùn)練模塊,還用于將所述隱患描述文本輸入到訓(xùn)練完成的文本編碼器中,獲取所述文本編碼器輸出的所述隱患描述文本對應(yīng)的第二文本序列;

    7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述調(diào)整模塊,具體用于根據(jù)所述第一文本序列和所述第二文本序列以及最大化似然函數(shù),確定所述第一文本序列和所述第二文本序列之間的損失值;根據(jù)所述損失值,對所述視覺編碼器中的參數(shù)進(jìn)行調(diào)整。

    8.一種視覺描述裝置,其特征在于,所述裝置包括:

    9.一種電子設(shè)備,其特征在于,所述電子設(shè)備至少包括處理器和存儲器,所述處理器用于執(zhí)行存儲器中存儲的計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)如權(quán)利要求1-4中任一所述方法的步驟。

    10.一種計(jì)算機(jī)可讀存儲介質(zhì),其特征在于,所述計(jì)算機(jī)可讀存儲介質(zhì)內(nèi)存儲有可由電子設(shè)備執(zhí)行的計(jì)算機(jī)程序,當(dāng)所述程序在所述電子設(shè)備上運(yùn)行時(shí),使得所述電子設(shè)備執(zhí)行如權(quán)利要求1-4中任一所述方法的步驟。

    ...

    【技術(shù)特征摘要】

    1.一種視覺編碼器訓(xùn)練方法,其特征在于,所述方法包括:

    2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:

    3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述根據(jù)所述第一文本序列和所述第二文本序列之間的相似度,對所述視覺編碼器中的參數(shù)進(jìn)行調(diào)整包括:

    4.一種視覺描述方法,其特征在于,所述方法包括:

    5.一種視覺編碼器訓(xùn)練裝置,其特征在于,所述裝置包括:

    6.根據(jù)權(quán)利要求5所述的裝置,其特征在于,所述訓(xùn)練模塊,還用于將所述隱患描述文本輸入到訓(xùn)練完成的文本編碼器中,獲取所述文本編碼器輸出的所述隱患描述文本對應(yīng)的第二文本序列;

    7.根據(jù)權(quán)利要求6所述的裝置...

    【專利技術(shù)屬性】
    技術(shù)研發(fā)人員:趙蕾
    申請(專利權(quán))人:新奧新智科技有限公司
    類型:發(fā)明
    國別省市:

    網(wǎng)友詢問留言 已有0條評論
    • 還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 亚洲乱亚洲乱妇无码| 99国产精品无码| 西西人体444www大胆无码视频| 久久青青草原亚洲av无码app| 亚洲日韩乱码中文无码蜜桃| 无码视频免费一区二三区| 国产成人无码免费看片软件 | 亚洲日韩精品无码一区二区三区 | 精品人体无码一区二区三区| 久久久久久AV无码免费网站| 国产精品无码DVD在线观看| 久久精品国产亚洲AV无码偷窥| 国产精品午夜无码体验区| 色综合久久无码五十路人妻| 无码免费又爽又高潮喷水的视频 | 亚洲精品无码久久久久久久| 亚洲精品无码久久久久久| 亚洲av无码一区二区三区四区| 惠民福利中文字幕人妻无码乱精品| 免费精品无码AV片在线观看| 日韩精品无码人成视频手机| 无码人妻一区二区三区兔费| 无码国内精品人妻少妇蜜桃视频| 无码av不卡一区二区三区| 亚洲AV无码国产一区二区三区| 无码国产精品一区二区免费模式| 一区二区三区无码视频免费福利| 国产精品午夜无码av体验区| 国产精品午夜无码体验区| 中字无码av电影在线观看网站| 91精品久久久久久无码| 久久久久无码精品国产不卡| 无码av免费网站| 免费看又黄又无码的网站| 色窝窝无码一区二区三区| 亚洲AV无码专区在线播放中文| 亚洲日韩精品一区二区三区无码| 亚洲国产无套无码av电影| 国模GOGO无码人体啪啪| 无码人妻AV一二区二区三区| 日韩人妻无码精品久久久不卡|