• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>
    當前位置: 首頁 > 專利查詢>湖南大學專利>正文

    一種基于線性模型的基因共調控網絡中關鍵調控子識別方法技術

    技術編號:15691297 閱讀:106 留言:0更新日期:2017-06-24 04:23
    本發(fā)明專利技術公開了一種基于線性模型的基因共調控網絡中關鍵調控子識別方法,利用基因表達譜數據和基因調控關系數據,通過構建線性模型預測已知疾病基因的表達來完成基因共調控網絡中關鍵調控子的識別。本發(fā)明專利技術實現簡單,只需根據基因表達譜數據和基因調控關系就能比較準確地識別出基因共調控網絡中的關鍵調控子,并且通過實驗證明識別的調控子具有很重要的生物意義,對于疾病機制的研究具有重要的理論意義和實用價值。

    Identification of key regulators in a gene co regulation network based on linear model

    The invention discloses a common promoter recognition method of key regulatory network in linear model based on gene expression data and gene regulation data using gene expression by constructing prediction of known disease genes to gene co regulation network control key recognition sub linear model. The invention is easy to implement, only according to gene expression data and gene regulation relationships can be accurately identified gene regulatory network is the key regulator, and through the experiment proves that it has very important biological significance of promoter recognition, has important theoretical significance and practical value for the study of disease mechanism.

    【技術實現步驟摘要】
    一種基于線性模型的基因共調控網絡中關鍵調控子識別方法
    本專利技術屬于計算生物學領域,涉及一種基于線性模型的基因共調控網絡中關鍵調控子識別方法。
    技術介紹
    在后基因組時代,理解基因、非編碼RNA、蛋白質和其他相關生物分子的功能,提示生物過程的實現機理成為當前計算系統生物學和生物信息學最重要的研究目標之一。其中,基因調控的研究是一個非常重要的課題。了解基因表達的調控機制,對于我們認識生物學過程和疾病的發(fā)生機制都起到了重要的作用。在真核生物中,有兩類重要的調控因子:轉錄因子(TF)和microRNA(miRNA),分別在轉錄水平及轉錄后水平上調控靶基因的表達水平。轉錄因子是一類具有特定功能的蛋白質,它通過結合到基因的啟動子區(qū)域來開啟基因的轉錄過程。miRNA是近年來研究發(fā)現的一種新的基因調控元件,是在真核生物中發(fā)現的一類內源性的具有調控功能的非編碼RNA,其大小長約20-25個核苷酸。轉錄因子、miRNA在基因表達調控中起到了重要的作用,這種調控作用遍及各種生物活動以及疾病發(fā)生過程。在此基礎上,研究發(fā)現轉錄因子和miRNA存在著廣泛的相互作用和合作調控,它們組成了一個復雜的共調控網絡。共調控網絡中包含轉錄因子調控miRNA、轉錄因子調控靶基因、miRNA調控轉錄因子和靶基因的調控作用,這些調控作用體現了細胞分子生命過程和功能執(zhí)行的各個階段,所以共調控網絡包含比單個網絡更豐富的生物信息。因此,有效地識別共調控網絡上的關鍵調控子對疾病的臨床治療和藥物設計都有重要作用,這將可能會給人類疾病的治療提供一種新的手段。隨著高通量技術的迅速發(fā)展,產生了大量的基因組學、轉錄組學和蛋白質組學等組學數據,為生物分子功能研究提供了新的契機。以往對于關鍵點的識別算法,主要是集中在蛋白質相互作用網絡上對于關鍵蛋白的識別。與蛋白質相互作用網絡相比,轉錄調控網絡的進化研究則更困難。首先,可信的轉錄調控網絡數據仍然不容易獲取;其次,就已有的轉錄調控網絡來看,由于網絡本身的功能特性,其展現出的拓撲特性與蛋白質相互作用網絡有較大不同,且加上調控作用的有向性,使得調控網絡展現出的拓撲特性更加復雜。因此對于調控網絡上關鍵調控子的識別也比關鍵蛋白的識別更為復雜。近年來,對于調控網絡的研究越來越多,已經有了多種基于計算的方法來識別調控網絡上的關鍵調控子,主要是有下面這幾類方法:基于信息流模型(RWR)、排名算法(PageRanking)、構建分類器(SVM、Regularizedleast-squaresclassification)、貝葉斯網絡、基于回歸模型等等。然而,已有的方法或多或少存在一些問題:比如不能處理大數據、時間復雜度太高、精度有待提高等等。2015年,Alexandra等提出了MIPRIP方法,利用線性模型來識別調控網絡上的關鍵調控子,實驗結果表明,基于線性模型的方法能有效的識別具有重要生物意義的調控子。然而,該方法只是單純的考慮了轉錄因子與基因之間的關系,并沒有考慮到共調控網絡中調控子之間的相互作用和合作調控關系,同時識別精度也有待提高。因此,有必要設計一種基于線性模型的基因共調控網絡中關鍵調控子識別方法。
    技術實現思路
    本專利技術所要解決的技術問題是提供一種基于線性模型的基因共調控網絡中關鍵調控子識別方法。該基于線性模型的基因共調控網絡中關鍵調控子識別方法只需根據基因表達譜數據和基因調控關系就能比較準確地識別基因共調控網絡中具有生物意義的關鍵調控子。專利技術的技術解決方案如下:一種基于線性模型的基因共調控網絡中關鍵調控子識別方法,包括以下步驟:步驟1)構建基因共調控網絡:輸入基因表達譜數據、基因調控關系和蛋白質相互作用數據(Protein-ProteinInteraction,PPI),過濾掉其中存在無表達譜數據節(jié)點的作用關系對,建立基因共調控網絡GCN(geneco-regulatorynetworks),基因共調控網絡GCN中共包含三種節(jié)點:調控子miRNA(microRNA)、調控子TF和基因gene,節(jié)點之間存在作用邊:miRNA-gene、TF-gene和gene-gene;若基因共調控網絡GCN中任意兩點,存在作用關系則邊權為1,否則為0;步驟2)對已知疾病基因,分別計算調控子miRNA、調控子TF和鄰接基因的活動值;活動值即miRNA、TF和鄰接基因對已知疾病基因的影響值;步驟3)在已構建的基因共調控網絡GCN中,利用基因表達譜數據以及步驟2)中得到的調控子和鄰接基因的活動值構建線性模型,預測已知疾病基因的表達,獲取已知疾病基因的預測表達值;步驟4)根據已知疾病基因的預測表達值和真實表達值之間的差值最小化將步驟3)構建的線性模型轉化為最優(yōu)化問題,基于混合整數線性規(guī)劃思想對最優(yōu)化問題進行求解,最終識別基因共調控網絡中的關鍵調控子。進一步地,所述用于預測已知疾病基因的表達構建的線性模型表達式如下:其中,i表示已知的疾病基因,m、t、g分別表示調控子miRNA、調控子TF、已知的疾病基因i的鄰接基因;g′i,s表示已知的疾病基因i在樣本s中預測的表達值,β0是指線性模型的附加權重(additiveoffset),M、T、G分別表示miRNA集、TF集、gene集;βm、βt、βg分別表示m、t、g的優(yōu)化參數,在步驟4)中的最優(yōu)化問題處理時利用優(yōu)化器可以直接計算得出;esm,i、tst,i、gsg,i分別表示m、t、g與i的作用邊權值,取值為0或1;actm,s、actt,s、actg,s分別表示m、t、g在樣本s中的活動值;所述樣本s是指已知疾病的某個觀測個體的數據。進一步地,所述的根據基因預測表達值和真實表達值之間的差值最小化將線性模型轉化為最優(yōu)化問題,表示為:其中,gi,s、g′i,s分別表示疾病基因i在樣本s中真實的表達值和預測的表達值,O與S分別表示的是已知的疾病基因集和該疾病的總樣本集;采用Gurobi優(yōu)化器對所述優(yōu)化問題進行求解,記錄每個調控子在求解優(yōu)化問題過程中被優(yōu)化器選擇的次數,根據選擇次數對所有調控子進行排名,取排名前50的調控子作為最終的候選調控子。當安裝好Gurobi優(yōu)化器后,只需在R語言中導入gurobi包,便可直接調用gurobi函數進行優(yōu)化問題處理,該gurobi函數存在三個輸入參數:優(yōu)化模型、timeLimit和OutputFlag,timeLimit一般取值600,OutputFlag取默認值0,所述優(yōu)化模型即為構建的線性模型利用已知疾病基因的預測表達值和真實表達值之間的差值最小化將構建的線性模型轉化為最優(yōu)化問題而得到的。為了得到一系列典型的不同大小的模型,通過約束基因的調控子個數來構建線性模型。對于每個已知疾病基因,分別設定調控子個數為1至k來構建線性模型。進一步地,所述的調控子miRNA、調控子TF和鄰接基因的活動值分別由下面兩種方法進行計算:1)計算調控子miRNA和調控子TF的活動值:第一步,首先計算調控子r的所有目標基因的基準表達值:其中,r表示調控子,為調控子miRNA或者調控子TF;表示調控子r的目標基因gt的基準表達值,取值為基因gt在調控子r表達水平趨于0的所有樣本中表達值的平均值;e(r)->0表示調控子r表達水平趨于0;目標基因的基準表達值是指無調控作用影響時的目標本文檔來自技高網
    ...
    一種基于線性模型的基因共調控網絡中關鍵調控子識別方法

    【技術保護點】
    一種基于線性模型的基因共調控網絡中關鍵調控子識別方法,其特征在于,包括以下步驟:步驟1)構建基因共調控網絡:輸入基因表達譜數據、基因調控關系和蛋白質相互作用數據,過濾掉其中存在無表達譜數據節(jié)點的作用關系對,建立基因共調控網絡GCN,基因共調控網絡GCN中共包含三種節(jié)點:調控子miRNA、調控子TF和基因gene,節(jié)點之間存在作用邊:miRNA?gene、TF?gene和gene?gene;若基因共調控網絡GCN中任意兩點,存在作用關系則邊權為1,否則為0;步驟2)對已知疾病基因,分別計算調控子miRNA、調控子TF和鄰接基因的活動值;步驟3)在已構建的基因共調控網絡GCN中,利用基因表達譜數據以及步驟2)中得到的調控子和鄰接基因的活動值構建線性模型,預測已知疾病基因的表達,獲取已知疾病基因的預測表達值;步驟4)根據已知疾病基因的預測表達值和真實表達值之間的差值最小化將步驟3)構建的線性模型轉化為最優(yōu)化問題,基于混合整數線性規(guī)劃思想對最優(yōu)化問題進行求解,最終識別基因共調控網絡中的關鍵調控子。

    【技術特征摘要】
    1.一種基于線性模型的基因共調控網絡中關鍵調控子識別方法,其特征在于,包括以下步驟:步驟1)構建基因共調控網絡:輸入基因表達譜數據、基因調控關系和蛋白質相互作用數據,過濾掉其中存在無表達譜數據節(jié)點的作用關系對,建立基因共調控網絡GCN,基因共調控網絡GCN中共包含三種節(jié)點:調控子miRNA、調控子TF和基因gene,節(jié)點之間存在作用邊:miRNA-gene、TF-gene和gene-gene;若基因共調控網絡GCN中任意兩點,存在作用關系則邊權為1,否則為0;步驟2)對已知疾病基因,分別計算調控子miRNA、調控子TF和鄰接基因的活動值;步驟3)在已構建的基因共調控網絡GCN中,利用基因表達譜數據以及步驟2)中得到的調控子和鄰接基因的活動值構建線性模型,預測已知疾病基因的表達,獲取已知疾病基因的預測表達值;步驟4)根據已知疾病基因的預測表達值和真實表達值之間的差值最小化將步驟3)構建的線性模型轉化為最優(yōu)化問題,基于混合整數線性規(guī)劃思想對最優(yōu)化問題進行求解,最終識別基因共調控網絡中的關鍵調控子。2.根據權利要求1所述的基于線性模型的基因共調控網絡中關鍵調控子識別方法,其特征在于,所述用于預測已知疾病基因的表達構建的線性模型表達式如下:其中,i表示已知的疾病基因,m、t、g分別表示調控子miRNA、調控子TF、已知的疾病基因i的鄰接基因;g′i,s表示已知的疾病基因i在樣本s中預測的表達值,β0是指線性模型的附加權重,M、T、G分別表示miRNA集、TF集、gene集;βm、βt、βg分別表示m、t、g的優(yōu)化參數,在步驟4)中的最優(yōu)化問題處理時利用優(yōu)化器可以直接計算得出;esm,i、tst,i、gsg,i分別表示m、t、g與i的作用邊權值,取值為0或1;actm,s、actt,s、actg,s分別表示m、t、g在樣本s中的活動值;所述樣本s是指已知疾病的某個觀測個體的數據。3.根據權利...

    【專利技術屬性】
    技術研發(fā)人員:王偉勝曾亞菲駱嘉偉劉智明蔡潔
    申請(專利權)人:湖南大學
    類型:發(fā)明
    國別省市:湖南,43

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 中文字幕无码免费久久99| 国产AV无码专区亚洲精品| 国产亚洲精品a在线无码| 亚洲AV无码一区东京热久久| 亚洲av永久无码精品古装片 | 人妻丰满熟妇AV无码区HD| 国产成人AV片无码免费| 国产精品亚洲а∨无码播放麻豆| 亚洲成A人片在线观看无码不卡 | 无码精品A∨在线观看无广告| 亚洲中文久久精品无码| 无码一区二区三区中文字幕| 无码国产色欲XXXXX视频| 精品国产毛片一区二区无码| 久久亚洲AV成人无码国产最大| 亚洲Av综合色区无码专区桃色| 极品无码国模国产在线观看| 人妻系列无码专区无码中出| 久久精品无码一区二区日韩AV| 无码中文字幕一区二区三区 | 日日摸日日碰夜夜爽无码| 无码AⅤ精品一区二区三区| 亚洲中文字幕久久精品无码A| 无码精品一区二区三区免费视频| 国产亚洲情侣一区二区无码AV | 无码精品不卡一区二区三区 | 久久精品国产亚洲AV无码娇色| 精品久久久无码中文字幕天天| 久久久久无码精品国产app| 亚洲Av永久无码精品黑人| 精品人妻系列无码天堂| 日韩人妻无码一区二区三区99 | 制服在线无码专区| 无码人妻少妇久久中文字幕蜜桃| 在线观看片免费人成视频无码| 国内精品无码一区二区三区| 天堂Aⅴ无码一区二区三区| 人妻少妇无码精品视频区| 亚洲av无码潮喷在线观看| 国产热の有码热の无码视频| 久久久久琪琪去精品色无码|