• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種化學分子性質預測的方法、系統及介質技術方案

    技術編號:36708874 閱讀:36 留言:0更新日期:2023-03-01 09:34
    本發明專利技術為一種化學分子性質預測的方法、系統及介質,通過圖卷積神經網絡學習化學分子的表示,建立分子圖與分子性質之間的關系模型預測分子的性質,構建多任務遷移學習框架,通過樣本量較多的訓練任務,訓練通用參數θ,然后基于參數θ來應用到數據量較小的預測任務,該方法包括:數據集的獲取以及實驗數據預處理;利用圖卷積神經網絡學習化學分子表示,并得到分子圖的圖嵌入向量;搭建圖卷積神經網絡模型結構,利用不同預測任務目標數據集中的樣本進行多任務訓練得到參數θ;基于參數θ訓練小樣本數據預測目標,得到最終的參數θ,最后應用圖卷積神經網絡模型及參數θ對候選分子進行預測,從而幫助研究人員從候選分子中篩選出具有相似性質的分子。有相似性質的分子。有相似性質的分子。

    【技術實現步驟摘要】
    一種化學分子性質預測的方法、系統及介質


    [0001]本專利技術涉及化學分子的性質預測和深度學習
    ,具體是一種化學分子性質預測的方法、系統及介質。

    技術介紹

    [0002]無論是在藥物還是在材料研發的過程中,不可避免的是大量測試分子的活性、毒性等分子的相關特性,通過測試來篩選出符合預期的分子作為候選分子。但是這需要研發人員經過大量實驗進行驗證。這就導致了大量的人力物力的成本付出。除此之外,查閱相關文獻,相似反應的經驗積累、以及對反應物的化學機理的理解都可以在分子性質預測中發揮重要作用,但是這也對相關實驗人員提出了非常高的專業素養。
    [0003]隨著深度學習技術的快速發展,以及相關方向的數據不斷地積累,通過數據挖掘的方式來對未知分子的性質進行預測變為可能。很多化學專家都選擇借助深度學習技術作為輔助技術,其效果在化工領域都得到驗證。但分子的性質預測對數據集樣本量具有非常高的要求,故而本專利技術基于圖卷積神經網絡構建了一個小樣本分子性質預測的框架,提高分子性質預測的準確性,以輔助研發人員快速找到合適性質的分子。

    技術實現思路

    [0004]本專利技術的目的在于提供一種化學分子性質預測的方法、系統及介質,用以幫助研發人員快速明確候選分子的性質,解決
    技術介紹
    中所提及的技術問題。
    [0005]本專利技術的第一方面提出來一種技術方案是:一種化學分子性質預測的方法,該方法包括以下步驟:
    [0006]S100.獲取終端收集實驗數據集并對數據預處理;
    [0007]S200.提取分子特征信息
    [0008]S300.獲取化學分子圖的圖嵌入向量;
    [0009]S400.搭建圖卷積神經網絡模型結構,利用實驗數據集中的目標數據進行訓練;
    [0010]S500.利用目標圖卷積神經網絡模型對預測分子進行分子性質預測。
    [0011]作為本專利技術的優選技術方案,獲取實驗數據集的具體步驟包括:
    [0012]獲取終端發送指令至數據集,并讀取目標數據至獲取終端。
    [0013]作為本專利技術的優選技術方案,數據預處理的具體步驟包括:
    [0014]標識單元對獲取終端讀取的目標數據進行標識,并輸出表達式標識;
    [0015]轉化單元依據所述目標數據的表達式標識輸出分子圖標識。
    [0016]作為本專利技術的優選技術方案,提取分子特征信息的具體步驟包括:
    [0017]依據分子圖標識中的鄰居節點及信息采用鄰居聚合算法進行連接,并輸出節點向量信息;
    [0018]將節點向量信息進行組合,用以表示分子圖。
    [0019]作為本專利技術的優選技術方案,獲取化學分子圖的圖嵌入向量的步驟包括:
    [0020]依據節點向量信息輸出圖嵌入向量。
    [0021]作為本專利技術的優選技術方案,搭建圖卷積神經網絡模型結構,利用實驗數據集中的目標數據進行訓練的具體操作包括:
    [0022]搭建模型框架,依據該模型框架對多個目標數據進行訓練任務,通過不同的目標數據訓練任務的樣本數據多次迭代更新參數,并輸出模型參數θ,該參數將被用來對小樣本任務進行遷移訓練,實現在該性質上的預測;
    [0023]對模型參數θ進行初始化設置;
    [0024]更新模型參數θ,對所有目標數據執行訓練任務;
    [0025]該模型框架采用的是損失函數為分子性質預測損失函數,并且采用交叉熵公式進行具體計算。公式如下:
    [0026][0027]其中,k代表的是數據集中的任務數量,y
    i
    ,分別代表的是真實值與模型的預測值。
    [0028]作為本專利技術的優選技術方案,所述訓練任務包括訓練training和測試testing。
    [0029]作為本專利技術的優選技術方案所述訓練training的操作步驟包括:
    [0030]對目標數據進行隨機抽樣,并輸出n個support集,以及m個query測試集;且n與m的和為目標數據的總數。
    [0031]第二方面,本專利技術提供一種化學分子性質預測的系統,用于執行如上述第一方面所述的預測方法;該系統包括:
    [0032]至少一個存在一個中央處理器,以及一個與中央處理器進行通信連接的存儲器,
    [0033]所述存儲器,可以存儲被中央處理器調用執行的程序指令,以及相關參數模型。
    [0034]第三方面,本專利技術提供一種非暫態計算機可讀存儲介質,用于存儲計算機指令,所述計算機指令使所述計算機執行上述第一方面所述的預測方法。
    [0035]本專利技術通過改進在此提供一種化學分子性質預測的方法、系統及介質,與現有技術相比,具有如下改進及優點:
    [0036]本專利技術通過圖卷積神經網絡的遷移學習模型框架,通過多個不同的任務來優化模型參數,以彌補單一任務的訓練數據量不足問題,同時該模型能在上述的多個任務中都有不俗的表現,從而能夠解決小數據量的問題,由此,能更方便地幫助研究人員從大量的候選的分子中篩選出具有相似性質的分子。
    附圖說明
    [0037]下面結合附圖和實施例對本專利技術作進一步解釋:
    [0038]圖1為本專利技術具體實施分子性質預測的流程圖;
    [0039]圖2為本專利技術具體模型參數訓練及應用示意圖;
    具體實施方式
    [0040]本專利技術的核心是提供一種化學分子性質預測的方法、系統及介質,以解決背景技
    術中所提及的問題。
    [0041]下面將結合附圖1至圖2對本專利技術進行詳細說明,對本專利技術實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本專利技術一部分實施例,而不是全部的實施例。基于本專利技術中的實施例,本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施例,都屬于本專利技術保護的范圍。
    [0042]需要說明的是,本專利技術實施例中所使用的“第一”“第二”等描述僅用于描述目的,不應當理解為其指示或隱含指示所限定的技術特征的數量,由此,本說明書各實施例中限定有“第一”“第二”的特征可以表明包括至少一個該被限定的技術特征。
    [0043]本說明書中所記載的本專利技術的各個實施例之間的技術方案可以相互結合,但是必須是以本領域普通技術人員能夠實現為基礎,當技術方案的結合出現相互矛盾或無法實現時,應當認為該技術方案的結合不存在。
    [0044]第一方面,如圖1
    ?
    2所示,本專利技術為一種化學分子性質預測的方法,該方法包括以下步驟:
    [0045]S100.獲取終端獲取實驗數據集并對數據預處理;
    [0046]S200.提取分子特征信息;
    [0047]S300.獲取化學分子圖的圖嵌入向量;
    [0048]S400.搭建圖卷積神經網絡模型結構,利用實驗數據集中的目標數據進行訓練;
    [0049]S500.利用目標圖卷積神經網絡模型對待預測分子進行分子性質預測。
    [0050]在本專利技術的一個實施例中,獲取化學分子數據構建數據集,該化學分子數據為分子的SMILES表達式;通過Rdkit工具將分子的SMILES表達式轉換成分子圖本文檔來自技高網
    ...

    【技術保護點】

    【技術特征摘要】
    1.一種化學分子性質預測的方法,其特征在于,該方法包括以下步驟:獲取終端收集實驗數據集并對數據預處理;提取分子特征信息;獲取化學分子圖的圖嵌入向量;搭建圖卷積神經網絡模型結構,利用實驗數據集中的目標數據進行訓練;利用目標圖卷積神經網絡模型對預測分子進行分子性質預測。2.根據權利要求1所述的一種化學分子性質預測的方法,其特征在于:獲取實驗數據集的具體步驟包括:獲取終端發送指令至數據集,并讀取目標數據至獲取終端。3.根據權利要求2所述的一種化學分子性質預測的方法,其特征在于:數據預處理的具體步驟包括:標識單元對獲取終端讀取的目標數據進行標識,并輸出表達式標識;轉化單元依據所述目標數據的表達式標識輸出分子圖標識。4.根據權利要求1所述的一種化學分子性質預測的方法,其特征在于:提取分子特征信息的具體步驟包括:依據分子圖標識中的鄰居節點及信息采用鄰居聚合算法進行連接,并輸出節點向量信息;將節點向量信息進行組合,用以表示分子圖。5.根據權利要求4所述的一種化學分子性質預測的方法,其特征在于:獲取化學分子圖的圖嵌入向量的步驟包括:依據節點向量信息輸出圖嵌入向量。6.根據權利要求1所述的一種化學分子性質預測的方法,其特征在于,搭建圖卷積神經網絡模型結構,利用實驗數據集中的目標數據進行訓練的具體操作包括:搭建模型框架,依據該模型框架對多個目標數據進行訓練任務,通過不同的目標...

    【專利技術屬性】
    技術研發人員:柳彥宏戴開洋宋召青張浩
    申請(專利權)人:煙臺國工智能科技有限公司
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 中文字幕无码久久人妻| 亚洲AV无码成人专区| av区无码字幕中文色| 国产精品无码一区二区在线观| 亚洲?V无码成人精品区日韩| 国产亚洲精品a在线无码| 亚洲成a人无码亚洲成www牛牛| 无码人妻一区二区三区精品视频| 少妇伦子伦精品无码STYLES | 韩国精品一区二区三区无码视频 | 国产精品毛片无码| 无码一区二区三区视频| 亚洲国产精品无码久久九九 | 国产精品无码免费视频二三区| 伊人久久无码中文字幕| 免费a级毛片无码a∨性按摩| 久久久久久久亚洲Av无码| 夜夜添无码一区二区三区| 精品无码黑人又粗又大又长 | 人妻少妇伦在线无码专区视频| 日产无码1区2区在线观看| 亚洲av日韩aⅴ无码色老头| 无码免费一区二区三区免费播放| 无码一区二区三区在线| 无码熟妇人妻av| 亚洲av无码日韩av无码网站冲| 无码无套少妇毛多18p | 亚洲成a人片在线观看天堂无码| 国产aⅴ无码专区亚洲av麻豆| 午夜精品久久久久久久无码| 18禁超污无遮挡无码免费网站国产| 亚洲性无码av在线| 99精品一区二区三区无码吞精 | 日韩乱码人妻无码中文字幕视频| 噜噜综合亚洲AV中文无码| 亚洲AV无码资源在线观看| 无码av专区丝袜专区| 国产精品无码免费播放| 精品无码国产AV一区二区三区 | 精品久久久无码人妻中文字幕豆芽| 亚洲熟妇无码AV|