本發明專利技術提供一種基于分子間相對差異性變化的網絡構建方法,利用機體不同狀態下分子間差異性表達和相關性差異性變化,構建表征機體癌變的關鍵生物網絡,探究抗壞血酸對于肺癌以及新型冠狀病毒的治療機制。包括:將肺癌的基因組學數據特征集合1、新型冠狀病毒以及抗壞血酸相關的基因特征2、特征集合3取交集,作為輸入特征集合F;計算一對特征f
【技術實現步驟摘要】
一種基于分子間相對差異性變化的網絡構建方法
[0001]本專利技術涉及生物數據分析
,特別涉及一種基于分子間相對差異性變化的網絡構建方法。
技術介紹
[0002]生命機體是一個復雜的網絡系統,不同分子間相互關聯、相互作用,協同完成各項生理功能。系統探究不同分子間關聯關系的變化對于深入理解疾病的發生發展機制和治療方案的研究具有重要的現實意義。高通量技術的快速發展為研究者們提供了更為豐富的分子信息,然而,也給數據分析帶來了巨大的挑戰,例如高維小樣本引起的過擬合問題。此外,由于樣本數量相對較少,單個樣本質量的波動會影響數據分析結果的真實性,嚴重阻礙關鍵生物信息的篩選和臨床應用研究的發展。為發現有效的生物信息可以用于指導在新冠病毒流行下肺癌患者臨床管理方案的實施,本專利技術利用不同生理病理狀態下分子間差異性表達并結合相關性的差異性變化研制新的網絡構建方法,探究機體癌變過程中通路反應活動的異常,分析抗壞血酸治療肺癌以及新型冠狀病毒的基因靶點和作用機制。基于所得的生物網絡信息,重點關注位于生化反應活動樞紐位置的基因,從而可以發現更為有效的生物信息用于指導肺癌患者臨床管理方案的實施,助力提高肺癌患者的臨床治療效果。此外,本專利技術可以有效減少單個樣本質量波動對于數據分析結果的影響,有助于積極推動生物信息學、數據挖掘、轉化醫學等多個相關學科的進一步發展。
技術實現思路
[0003]為了解決
技術介紹
提出的技術問題,本專利技術提供一種基于分子間相對差異性變化的網絡構建方法,利用機體不同狀態下分子間差異性表達和相關性的差異性變化,構建表征機體癌變的關鍵生物網絡,探究抗壞血酸對于肺癌以及新型冠狀病毒的治療機制。
[0004]為了達到上述目的,本專利技術采用以下技術方案實現:
[0005]一種基于分子間相對差異性變化的網絡構建方法,包括如下步驟:
[0006]1)輸入肺癌的基因組學數據,數據包含樣本集合與基因特征集合,其基因特征集合記為特征集合1。
[0007]2)利用NCBI數據庫查找與新型冠狀病毒以及抗壞血酸相關的基因,其基因特征集合分別記為特征集合2和特征集合3。
[0008]3)將特征集合1、特征集合2以及特征集合3取交集,將交集基因作為輸入特征集合F。
[0009]4)根據公式(1)計算一對特征f
i
和f
j
在一類樣本和另一類樣本中事件f
i
<f
j
發生的概率p
ij
(c1)和p
ij
(c2)。
[0010]p
ij
(c
l
)=pr(f
it
<f
jt
|y
t
=c
l
,t=1,2,3
…
,n),l=1,2
??
(1)
[0011]其中c
l
表示第l類樣本的類別名稱,c1和c2分別表示正常組和疾病組,f
it
和f
jt
表示特征f
i
和f
j
在第t個樣本上的表達值,y
t
表示第t個樣本的類標,n表示樣本個數。
[0012]5)根據公式(2)計算一對特征f
i
和f
j
在一類樣本和另一類樣本中的相關性。
[0013][0014]其中μ
il
,μ
jl
為特征f
i
和f
j
在c
l
類樣本上的均值;σ
il
,σ
jl
為特征f
i
和f
j
在c
l
類樣本上的標準差,n
l
表示c
l
類的樣本個數。
[0015]6)根據公式(3)計算一對特征f
i
和f
j
的差異性變化得分Score
ij
:
[0016][0017]其中分子表示不同生理病理狀態下一對特征f
i
和f
j
在表達值上的差異性變化,該對特征表達值差異性越大,分子的絕對值越大,反之亦然;分母表示一對特征f
i
和f
j
的相關性差異變化,該對特征相關性差異越大,分母的絕對值越小,反之亦然;Score
ij
值越大,表明特征f
i
和f
j
之間所對應的生化反應活動越劇烈,越有可能成為癌癥診斷、預后以及治療的關鍵因素。
[0018]在網絡中,以單基因特征作為網絡結點,衡量一對基因在不同生理病理狀態下的差異性變化得分Score
ij
,當Score
ij
大于等于設定閾值時,則一對特征f
i
和f
j
對應的兩個網絡結點間存在一條連邊。
[0019]進一步地,還包括網絡分析方法,包括如下:
[0020]為篩選有效用于肺癌臨床診斷、預后以及治療的標志物,本專利技術重點關注機體癌變過程中的核心基因。度最大的結點表明該分子參與多條通路反應活動,處于中心樞紐位置,在機體的生理病理變化中起著重要的生物學作用。本專利技術提取網絡圖G中度最大的k個結點作為指導肺癌患者臨床管理的關鍵生物信息,用于肺癌的診斷、預后以及治療。
[0021]與現有技術相比,本專利技術的有益效果是:
[0022]本專利技術利用不同生理病理狀態下分子間差異性表達以及相關性的差異性變化構建表征肺癌發生發展的生物網絡,并深入探究抗壞血酸對于新冠病毒的肺癌患者的治療機制和作用靶點,從而提高肺癌患者臨床診斷、預后以及治療效果。分子間差異性表達和相關性的差異性變化兩種統計方法可以有效消除單一樣本質量波動對數據分析結果的影響,因此,本專利技術可以篩選出真實有效的臨床潛在性標志物用于指導新冠病毒的肺癌患者的臨床管理,以期提高肺癌患者的生存率,并且有助于積極推動生物信息學、數據挖掘、轉化醫學等多個相關學科的進一步發展。
附圖說明
[0023]圖1為本專利技術所選標志物在發現集上的生存曲線圖;
[0024]圖2為本專利技術所選標志物在驗證集1上的生存曲線圖;
[0025]圖3為本專利技術所選標志物在發現集上區分肺癌樣本和健康樣本的實驗結果;
[0026]圖4為本專利技術所選標志物在發現集上區分早期肺癌樣本和健康樣本的實驗結果。
具體實施方式
[0027]以下結合附圖對本專利技術提供的具體實施方式進行詳細說明。
[0028]基因之間相互關聯、相互作用,當機體出現生理、病理變化時,發生擾動的不僅僅
是一個基因,而是整個基因模塊或網絡。本專利技術提出了一種基于分子間相對差異性變化的網絡構建方法NNCM
?
MDC,從網絡的角度系統分析基因反應活動在肺癌發生發展中的本文檔來自技高網...
【技術保護點】
【技術特征摘要】
1.一種基于分子間相對差異性變化的網絡構建方法,其特征在于,包括如下步驟:1)輸入肺癌的基因組學數據,數據包含樣本集合與基因特征集合,其基因特征集合記為特征集合1;2)利用NCBI數據庫查找與新型冠狀病毒以及抗壞血酸相關的基因,其基因特征集合分別記為特征集合2和特征集合3;3)將特征集合1、特征集合2以及特征集合3取交集,將交集基因作為輸入特征集合F;4)根據公式(1)計算一對特征f
i
和f
j
在一類樣本和另一類樣本中事件f
i
<f
j
發生的概率p
ij
(c1)和p
ij
(c2);p
ij
(c
l
)=pr(f
it
<f
jt
|y
t
=c
l
,t=1,2,3
…
,n),l=1,2
?????
(1)其中c
l
表示第l類樣本的類別名稱,c1和c2分別表示正常組和疾病組,f
it
和f
jt
表示特征f
i
和f
j
在第t個樣本上的表達值,y
t
表示第t個樣本的類標,n表示樣本個數;5)根據公式(2)計算一對特征f
i
和f
j
在一類樣本和另一類樣本中的相關性;其中μ
il
,μ
jl
為特征f
i
和f
j
在c
l
類樣本上的均值;σ
...
【專利技術屬性】
技術研發人員:黃鑫,蘇本哲,王星宇,
申請(專利權)人:鞍山師范學院,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。