The invention discloses a common promoter recognition method of key regulatory network in linear model based on gene expression data and gene regulation data using gene expression by constructing prediction of known disease genes to gene co regulation network control key recognition sub linear model. The invention is easy to implement, only according to gene expression data and gene regulation relationships can be accurately identified gene regulatory network is the key regulator, and through the experiment proves that it has very important biological significance of promoter recognition, has important theoretical significance and practical value for the study of disease mechanism.
【技術實現步驟摘要】
一種基于線性模型的基因共調控網絡中關鍵調控子識別方法
本專利技術屬于計算生物學領域,涉及一種基于線性模型的基因共調控網絡中關鍵調控子識別方法。
技術介紹
在后基因組時代,理解基因、非編碼RNA、蛋白質和其他相關生物分子的功能,提示生物過程的實現機理成為當前計算系統生物學和生物信息學最重要的研究目標之一。其中,基因調控的研究是一個非常重要的課題。了解基因表達的調控機制,對于我們認識生物學過程和疾病的發(fā)生機制都起到了重要的作用。在真核生物中,有兩類重要的調控因子:轉錄因子(TF)和microRNA(miRNA),分別在轉錄水平及轉錄后水平上調控靶基因的表達水平。轉錄因子是一類具有特定功能的蛋白質,它通過結合到基因的啟動子區(qū)域來開啟基因的轉錄過程。miRNA是近年來研究發(fā)現的一種新的基因調控元件,是在真核生物中發(fā)現的一類內源性的具有調控功能的非編碼RNA,其大小長約20-25個核苷酸。轉錄因子、miRNA在基因表達調控中起到了重要的作用,這種調控作用遍及各種生物活動以及疾病發(fā)生過程。在此基礎上,研究發(fā)現轉錄因子和miRNA存在著廣泛的相互作用和合作調控,它們組成了一個復雜的共調控網絡。共調控網絡中包含轉錄因子調控miRNA、轉錄因子調控靶基因、miRNA調控轉錄因子和靶基因的調控作用,這些調控作用體現了細胞分子生命過程和功能執(zhí)行的各個階段,所以共調控網絡包含比單個網絡更豐富的生物信息。因此,有效地識別共調控網絡上的關鍵調控子對疾病的臨床治療和藥物設計都有重要作用,這將可能會給人類疾病的治療提供一種新的手段。隨著高通量技術的迅速發(fā)展,產生了大量的基因組學、轉錄組學 ...
【技術保護點】
一種基于線性模型的基因共調控網絡中關鍵調控子識別方法,其特征在于,包括以下步驟:步驟1)構建基因共調控網絡:輸入基因表達譜數據、基因調控關系和蛋白質相互作用數據,過濾掉其中存在無表達譜數據節(jié)點的作用關系對,建立基因共調控網絡GCN,基因共調控網絡GCN中共包含三種節(jié)點:調控子miRNA、調控子TF和基因gene,節(jié)點之間存在作用邊:miRNA?gene、TF?gene和gene?gene;若基因共調控網絡GCN中任意兩點,存在作用關系則邊權為1,否則為0;步驟2)對已知疾病基因,分別計算調控子miRNA、調控子TF和鄰接基因的活動值;步驟3)在已構建的基因共調控網絡GCN中,利用基因表達譜數據以及步驟2)中得到的調控子和鄰接基因的活動值構建線性模型,預測已知疾病基因的表達,獲取已知疾病基因的預測表達值;步驟4)根據已知疾病基因的預測表達值和真實表達值之間的差值最小化將步驟3)構建的線性模型轉化為最優(yōu)化問題,基于混合整數線性規(guī)劃思想對最優(yōu)化問題進行求解,最終識別基因共調控網絡中的關鍵調控子。
【技術特征摘要】
1.一種基于線性模型的基因共調控網絡中關鍵調控子識別方法,其特征在于,包括以下步驟:步驟1)構建基因共調控網絡:輸入基因表達譜數據、基因調控關系和蛋白質相互作用數據,過濾掉其中存在無表達譜數據節(jié)點的作用關系對,建立基因共調控網絡GCN,基因共調控網絡GCN中共包含三種節(jié)點:調控子miRNA、調控子TF和基因gene,節(jié)點之間存在作用邊:miRNA-gene、TF-gene和gene-gene;若基因共調控網絡GCN中任意兩點,存在作用關系則邊權為1,否則為0;步驟2)對已知疾病基因,分別計算調控子miRNA、調控子TF和鄰接基因的活動值;步驟3)在已構建的基因共調控網絡GCN中,利用基因表達譜數據以及步驟2)中得到的調控子和鄰接基因的活動值構建線性模型,預測已知疾病基因的表達,獲取已知疾病基因的預測表達值;步驟4)根據已知疾病基因的預測表達值和真實表達值之間的差值最小化將步驟3)構建的線性模型轉化為最優(yōu)化問題,基于混合整數線性規(guī)劃思想對最優(yōu)化問題進行求解,最終識別基因共調控網絡中的關鍵調控子。2.根據權利要求1所述的基于線性模型的基因共調控網絡中關鍵調控子識別方法,其特征在于,所述用于預測已知疾病基因的表達構建的線性模型表達式如下:其中,i表示已知的疾病基因,m、t、g分別表示調控子miRNA、調控子TF、已知的疾病基因i的鄰接基因;g′i,s表示已知的疾病基因i在樣本s中預測的表達值,β0是指線性模型的附加權重,M、T、G分別表示miRNA集、TF集、gene集;βm、βt、βg分別表示m、t、g的優(yōu)化參數,在步驟4)中的最優(yōu)化問題處理時利用優(yōu)化器可以直接計算得出;esm,i、tst,i、gsg,i分別表示m、t、g與i的作用邊權值,取值為0或1;actm,s、actt,s、actg,s分別表示m、t、g在樣本s中的活動值;所述樣本s是指已知疾病的某個觀測個體的數據。3.根據權利...
【專利技術屬性】
技術研發(fā)人員:王偉勝,曾亞菲,駱嘉偉,劉智明,蔡潔,
申請(專利權)人:湖南大學,
類型:發(fā)明
國別省市:湖南,43
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。