• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    藥物篩選中基于深度哈希的配體分子指紋生成方法技術

    技術編號:15501009 閱讀:939 留言:0更新日期:2017-06-03 22:34
    本發明專利技術公開了一種藥物篩選中基于深度哈希的配體分子指紋生成方法,首先生成分子結構式圖像文件,然后定義配體分子對的配對標記,訓練DPSH深度哈希學習模型,最后預測新配體分子的分子指紋。本發明專利技術將配體分子結構式轉換成圖像文件,利用深度哈希算法,優化目標損失函數,自動生成分子指紋。本發明專利技術將實現第一個“端到端”的分子指紋生成框架,無需手工提取特征,解決了分子指紋生成方法需要開發者對領域知識有較深了解的難題。本發明專利技術從全新的角度提供分子指紋生成的通用框架,為現有分子指紋生成方法的重要補充,將會推動分子指紋在藥物篩選中更廣泛的應用。

    Method for generating ligand molecular fingerprints based on depth hashing in drug screening

    The invention discloses a drug ligand molecular fingerprint generation method based on Hash depth screening, first generation molecular structure of the image file, and then define the paired labeled ligand molecules on the training, the depth of DPSH hash learning model, finally forecast the new molecular fingerprint ligands. The invention converts the ligand molecular structure formula into an image file, and uses the depth hashing algorithm to optimize the target loss function, and automatically generates the molecular fingerprint. The invention realizes the first \end to end\ molecular fingerprint generation framework, and does not need to manually extract features, and solves the problem that the molecular fingerprint generation method needs developers to have a deeper understanding of the domain knowledge. The present invention provides a general framework for the generation of molecular fingerprints from a completely new angle, and is an important supplement to the existing molecular fingerprint generation methods, and will further promote the application of molecular fingerprints in drug screening.

    【技術實現步驟摘要】
    藥物篩選中基于深度哈希的配體分子指紋生成方法
    本專利技術涉及一種藥物篩選中基于深度哈希的配體分子指紋生成設計方法,屬于計算機輔助藥物設計的

    技術介紹
    分子指紋(MolecularFingerprint)將化學分子表示成“位串”(bitstring),用于刻畫化學分子的結構或功能相似性,由于其使用的簡便性以及在子結構和相似性搜索中的高效性,在藥物發現和虛擬篩選中得到了廣泛應用。目前,已經提出了很多的分子指紋生成方法,不同的方法反映了分子不同方面的信息。分子指紋生成方法主要包括:基于關鍵子結構的分子指紋生成方法、基于路徑的分子指紋生成方法、環形指紋生成方法、藥效團指紋生成方法和混合指紋生成方法等。基于關鍵子結構的分子指紋生成方法根據是否存在給定列表中的子結構將化學分子表示成位串,如MACCS、PubChem等。基于路徑的分子指紋生成方法根據分子的拓撲結構,順著分子化學鍵的不同路徑產生子結構,并哈希產生分子位串,其長度可變,可用于快速子結構搜索,如Daylight指紋和OpenEye樹形指紋。環形指紋生成方法利用分子的拓撲結構,考慮每個原子的周邊原子和鍵的信息生成位串,已為廣泛應用于分子的整體結構相似性搜索,如Molprint2D、ECFP、FCFP等。藥效團指紋生成方法,它與基于關鍵子結構的指紋相似,但它除了考慮與藥效相關的關鍵子結構,還考慮了這些子結構間的距離因素。混合指紋生成方法同時結合上述多種分子指紋信息,如UNITY2G同時考慮了關鍵子結構和子結構連接路徑信息。除了上述分子指紋生成方法,最近還有不少全新的方法涌現。例如,LINGO為基于文本的分子指紋工具,PLIF分子指紋生成方法主要考慮蛋白質-配體相互作用信息,包括氫鍵、離子鍵等,SIFt分子指紋生成方法主要考慮分子結構間的相互作用信息。現有的分子指紋生成方法依賴于開發者的手工特征提取,這對開發者提出了很高的要求,開發者需要對領域知識有很深的了解。同時發現分子結構式的可視化顯示是了解分子性質最直觀的方式,可以將其結構圖轉化成圖像格式,使用成熟的圖像處理技術來生成分子指紋。深度哈希將特征自動生成和哈希編碼學習通過深度學習框架結合到一起,憑借其強大的特征學習能力和標記監督信息,迅速超越了基于手工設計特征的傳統哈希方法。
    技術實現思路
    本專利技術的目的在于解決傳統分子指紋技術需要開發者對領域知識有較深了解,技術門檻較高的難題。本專利技術將分子結構式轉換成圖像文件,采用DPSH深度哈希算法自動學習分子指紋。本專利技術從全新的角度設計第一個“端到端”的分子指紋生成框架,開發者無需手工設計特征,模型將自動生成分子指紋。為達到上述目的,本專利技術的技術方案為一種藥物篩選中基于深度哈希的配體分子指紋生成設計方法,包括如下步驟:步驟1:生成分子結構式圖像文件;步驟2:定義配體分子對的配對標記;步驟3:訓練DPSH深度哈希學習模型;步驟4:預測新配體分子的分子指紋。進一步,步驟1通過現有分子軟件讀取配體分子SMILES,并調用軟件中的構圖函數,生成固定尺寸為300*300像素的配體分子結構式圖像文件,用于表示配體分子的結構特征。如果兩配體分子與共同的藥物靶標作用,則兩分子之間的配對標記為1;若兩分子分別與不同的藥物靶標作用,則兩分子之間的配對標記為0,DPSH深度哈希分子指紋生成模型的目的在于:配對標記為1的兩個配體分子,通過模型生成的分子指紋盡可能相似;配對標記為0的兩分子,其分子指紋之間差距較大。步驟3將步驟1得到的配體分子結構式圖像進行預處理,轉換成像素大小為224*224的圖像形式,并結合步驟2生成的配對標記,一同輸入DPSH深度哈希學習模型,提取配體分子結構深層次的特征,進行配體分子指紋自動編碼,更新網絡參數。步驟4中當要預測新的配體分子的哈希指紋時,只需將配體分子的結構式圖像輸入DPSH深度哈希學習模型處理,就能在輸出端得到指定長度的指紋向量。本專利技術的有益效果:1、本專利技術提出的方法將實現第一個“端到端”、自動的分子指紋生成框架,開發者無需手工設計特征,解決了“開發者需要對領域知識有較深的了解”的難題。2、本專利技術從一個全新的角度來生成分子指紋,將捕獲不同的分子信息,可作為現有分子指紋生成方法的重要補充,也將推動分子指紋在藥物發現和虛擬篩選中更廣泛的應用。附圖說明圖1為本專利技術基于深度哈希的分子指紋生成系統的架構圖。圖2為本專利技術基于深度哈希的分子指紋生成方法流程圖。具體實施方式下面結合附圖和實例對本專利技術做進一步的說明。本專利技術提出的方法只需要輸入分子結構式文件,它將被轉換成圖像文件,利用DPSH深度哈希算法,通過優化目標損失函數來自動生成最優的分子指紋。本專利技術提出的方法將實現第一個“端到端”的分子指紋生成框架,開發者無需手工設計特征,解決了“開發者需要對領域知識有較深的了解”的難題。本專利技術從一個全新的角度來提供分子指紋生成的通用框架,可以作為現有的分子指紋生成方法重要的補充,也將推動分子指紋在藥物發現和虛擬篩選中更廣泛的應用。本專利技術主要包含兩部分內容:分子的圖像文件生成和分子指紋自動生成。分子的圖像文件生成:結構式是用元素符號和短線表示化合物(或單質)分子中原子的排列和結合方式的式子,是一簡單描述分子式的方法。本專利技術通過現有的軟件,例如RDkit,將分子結構式轉換成圖像格式的文件。分子指紋自動生成:上面得到的圖像作為DPSH深度哈希模型的輸入,通過優化目標損失函數來生成最優的分子指紋。方法流程:步驟1:將配體化學分子式(SMILES格式)輸入RDkit工具,轉換為300*300像素的圖像;步驟2:定義配體分子對的配對標記(pairwiselabel)。如果兩個配體分子與同一個藥物靶標作用,則這兩個配體分子的配對標記為1,否則為0;步驟3:訓練DPSH深度哈希學習模型。將配體分子對的兩個配體分子的圖像文件(由步驟1產生)和配對標記作為DPSH深度哈希模型的輸入,訓練DPSH深度哈希學習模型,使得相似的配體分子的哈希碼(配體標記為1)盡量相似,不同的配體分子的哈希碼(配體標記為0)盡量不同;步驟4:應用訓練好的DPSH深度哈希模型,預測新的配體分子的分子指紋。本專利技術的具體實施步驟,如圖2所示,包括:1、配體分子圖像文件生成已知與疾病相關、具有特定藥效功能的藥物靶標和與之作用的配體分子(SMILES格式)。SMILES(Simplifiedmolecularinputlineentryspecification),簡化分子線性輸入規范,是一種用字符串明確描述分子結構的規范。SMILES用一串字符來描述一個三維化學結構,SMILES字符串可以被大多數分子編輯軟件導入并轉換成二維圖形或分子的三維模型。調用RDkit中的Draw.MolToFile函數,可根據配體分子SMILES產生結構式圖像,大小為300*300像素。2、基于DPSH深度學習模型的配體分子指紋自動生成2.1、定義屬性如果兩配體分子與共同的藥物靶標作用,則兩配體分子之間的配對標記為1;若兩配體分子分別與不同的藥物靶標作用,則兩配體分子之間的配對標記為0。指紋生成模型的目的在于:配對標記為1的兩個配體分子,生成的分子指紋盡可能相似;配對標記為0的兩配體分子,其分子指紋之間差距較大。2.2、建模與訓練在這個步驟本文檔來自技高網
    ...
    藥物篩選中基于深度哈希的配體分子指紋生成方法

    【技術保護點】
    一種藥物篩選中基于深度哈希的配體分子指紋生成設計方法,其特征在于,所述方法包括如下步驟:步驟1:生成分子結構式圖像文件;步驟2:定義配體分子對的配對標記;步驟3:訓練DPSH深度哈希學習模型;步驟4:預測新配體分子的分子指紋。

    【技術特征摘要】
    1.一種藥物篩選中基于深度哈希的配體分子指紋生成設計方法,其特征在于,所述方法包括如下步驟:步驟1:生成分子結構式圖像文件;步驟2:定義配體分子對的配對標記;步驟3:訓練DPSH深度哈希學習模型;步驟4:預測新配體分子的分子指紋。2.根據權利要求1所述的一種藥物篩選中基于深度哈希的配體分子指紋生成設計方法,其特征在于,步驟1通過現有分子軟件讀取配體分子SMILES,并調用軟件中的構圖函數,生成固定尺寸為300*300像素的配體分子結構式圖像文件,用于表示配體分子的結構特征。3.根據權利要求1所述的一種藥物篩選中基于深度哈希的配體分子指紋生成設計方法,其特征在于,如果兩配體分子與共同的藥物靶標作用,則兩分子之間的配對標記為1;若兩分子分別與不同的藥物靶標作用,則兩分子之間的配對標記為0,...

    【專利技術屬性】
    技術研發人員:吳建盛尹新宇胡海峰
    申請(專利權)人:南京郵電大學
    類型:發明
    國別省市:江蘇,32

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 亚洲AV无码国产一区二区三区| 久久久久久亚洲av无码蜜芽| 亚洲精品无码99在线观看| 无码人妻H动漫中文字幕| 性色AV蜜臀AV人妻无码| 国产亚洲精品无码拍拍拍色欲 | 黑人无码精品又粗又大又长| 亚洲av无码国产精品夜色午夜| 无码国模国产在线观看| 亚洲爆乳无码一区二区三区| 亚洲AV无码成人精品区狼人影院 | 日韩放荡少妇无码视频| 亚洲AV无码精品无码麻豆| 精品无码国产AV一区二区三区| 亚洲午夜福利AV一区二区无码| 午夜无码熟熟妇丰满人妻| 人妻丝袜中文无码av影音先锋专区 | 国产裸模视频免费区无码| 日韩av无码中文字幕| 亚洲精品无码久久久久去q| 精品少妇人妻av无码专区| 亚洲AV无码一区二区三区网址| 无码超乳爆乳中文字幕久久| 亚洲热妇无码AV在线播放| 中文字幕乱妇无码AV在线| 国产色无码精品视频国产| 97在线视频人妻无码| 国产成年无码久久久久下载| 国产成人无码网站| 在人线av无码免费高潮喷水| 狼人无码精华AV午夜精品| 亚洲日韩看片无码电影| 无码专区中文字幕无码| 日韩国产精品无码一区二区三区 | 18禁超污无遮挡无码免费网站| 无码A级毛片日韩精品| 日韩精品人妻系列无码av东京| 亚洲AV无码一区二区三区鸳鸯影院 | 亚洲中文字幕无码久久综合网| 精品无码久久久久久久动漫| 国产午夜激无码av毛片|