本發明專利技術的某些實施方案可以包括使用生物網絡識別藥物靶點的系統和方法。根據本發明專利技術的示例性實施方案,提供了一種用于預測治療疾病的藥物靶點效果的方法。所述方法可能包括至少部分地基于對疾病的藥物抑制效果的知識構建貝葉斯網絡結構;將一組參數與構建的貝葉斯網絡相關;通過自動過程確定貝葉斯網絡的聯合概率分布的值;至少部分地基于這些聯合概率值導出具有一個或多個平均參數的平均貝葉斯網絡;和至少部分地基于所述平均貝葉斯網絡計算定量預測。
【技術實現步驟摘要】
【國外來華專利技術】
本專利技術涉及系統生物學。更具體地,本專利技術提供了一種基于生物網絡的系統化方法,用于評估抑制對治療疾病的多種藥物靶點的效果。
技術介紹
貝葉斯網絡(BN)是一種由貝葉斯定理促進的普通類型的圖形化概率模型。逐漸地已經將這樣的網絡應用于各種計算應用中,如計算生物學和計算機視覺。可能將當前貝葉斯網絡參數學習方式分類為兩個種類采用最大似然(ML)估計的頻率統計方法,采用最大后驗(MAP)估計的貝葉斯方式。ML僅僅使用來自所述數據的統計計數以估計在貝葉斯網絡中的參數,而MAP使用某些類型的先驗統計信用以進一步調節來自所述數據的統計計數。因此,MAP參數估計是自數據和先前知識二者所計算的組合結果。可能將先前知識粗略地定義為涉及網絡的結構和參數屬性的任何陳述。例如,領域的專家可能提供與局部結構相關的信息,通過指定在變量子集之間的條件獨立性或甚至在完全指定變量之間的因果關系,因而這個邊緣的方向。領域的專家也可能提供與網絡參數相關的知識,所述網絡參數的范圍通過直接將值分配給條件概率表(CRT)中的入口以引入在一個分布中或跨越多個條件分布的不等式和等式約束。另外,域的知識也可能定義了在這些參數上的先驗分布。而且,一些知識規定了在先驗分布函數中超參數上的等式和不等式約束。在各種域知識之間,定性的陳述也許是域中最通用和最直觀的信息。這些陳述說明了域變量之間的(獨立性)依賴性和因果關系。根據定義,“(獨立性)依賴性”鏈接了聯合表示中的多個實體,“因果關系”規定了在這個聯合設置內的條件和方向。在貝葉斯框架中,在定性域知識中的(獨立性)依賴性和因果關系定義了在給出其父節點的所有可能配置的子節點的概率之間的一組不等式關系。由于接近每一個BN承認了給定結構的(獨立性)依賴性和因果關系,這種類型的約束提供了最通用和最有用的先驗約束給參數學習任務。而且,其對于領域的專家,比較在獨立入口上給出指定值或定義Dirichlet之前的超參數,去指定在CRT中入口上不等式約束要求更少。研究者已經提出了多個算法去學習貝葉斯網絡參數,通過利用各種形式的先前知識,如Dirichlet函數、。在某些參考文獻、、中,提出了結合參數共享約束的用于各種圖形模型的參數學習方案。例如,在一個多元條件分布中的參數等式。將這些約束的形式限制為或參數共享或在一個條件分布內的不等式約束,如P(A|B) >P(A| B)。更通用和重要的不等式約束,如P(A|B) >P(A| B)不被他們的方法所解決。在其他參考文獻和中,提出了方法用于處理在參數學習中的不等式約束。因而,不等式約束已經被提出并用于定性概率參考文獻、。而且,由于缺少在這些約束中的定性測量,他們在結合任意BN學習過程中的定性訓練數據中已經長期被忽略。當前藥物發展策略主要集中在研發用于單一目標的緊抑制劑,其可能不是治療疾病的最有效方法。系統生物學的最近發展清楚地驗證了基因/蛋白質緊密互連。毫無疑問,在基因網絡中藥物靶點的作用是用于抑制劑療效的決定因素。另外,考慮到基因網絡的冗余度和魯棒性,疾病的有效的治療可能需要同時抑制多種蛋白質。研發靶向在路徑中的一組蛋白質的制藥將開創在藥物探索中新的領域并在不久的將來將是一個趨勢。給定基因網絡的復雜度,困難的是,如果不是不可能的,去手動選擇蛋白質的組合作為藥物靶點并預測抑制這些蛋白質的效果。因此,正在不斷尋找新的藥物靶點的制藥公司需要一種以系統和公正方法可能解決這個問題的計算方式。專利技術概述 本專利技術的某些實施方案可以解決上述需要的一些或全部。本專利技術的某些實施方案可以包括。根據本專利技術的示例性實施方案,提供了一種被提供用于預測治療疾病的藥物靶點效果的方法。所述方法可能包括至少部分地基于對疾病的藥物抑制效果的知識構建貝葉斯網絡結構;將一組參數與構建的貝葉斯網絡相關;通過自動過程確定貝葉斯網絡的聯合概率分布的值;至少部分地基于這些聯合概率值導出具有一個或多個平均參數的平均貝葉斯網絡;和至少部分地基于所述平均貝葉斯網絡計算定量預測。根據本專利技術的另一示例性實施方案,提供了一種自動確定貝葉斯網絡中的多項分布的方法。所述方法包括使用與構建的貝葉斯網絡結構相關的一組聯合概率參數構建貝葉斯網絡的圖形結構;設計自動過程以確定與所述聯合概率參數相關的值;同時導出等效平均貝葉斯網絡或貝葉斯網絡的類;和使用等效平均貝葉斯網絡或貝葉斯網絡的類實施定量預測和推理模擬。根據本專利技術的示例性實施方案,提供了一種確定貝葉斯網絡的參數的系統。所述系統可以包括存儲可執行指令的至少一個存儲器;與所述至少一個存儲器通信的至少一個處理器,其中所述至少一個處理器可操作用來執行已存儲的指令以接收多個不等式參數約束,所述不等式約束至少部分地基于定性領域知識;基于所述多個不等式參數約束構建參數分布;使用定量數據統計,整合所述參數分布以使用定量領域知識確定貝葉斯參數計分函數,其中所述貝葉斯參數計分函數同時反映了所述定量領域知識和定性領域知識。本專利技術的示例性實施方案提供了一種通過將定性導出陳述的不等式限制與數據整合來實施在給定結構的貝葉斯網絡中的參數學習的算法或過程。由本專利技術的實施方案所提供的示例性算法可能處理許多其他類型的先前知識和限制,如未定向關系,邏輯和高階非線性約束。即使使用最通用的約束,本專利技術的示例性實施方案可能顯著地提高學習精度,即使使用非常稀少的數據(幾個樣本)。相比較而言,本專利技術的方法可以直接通過采樣和獲得dirichlet超參數來直接作用于參數空間。因而,本專利技術的方法可能比一些傳統方法更有效和可行。除了使用先前知識基于數據的學習方式,提供了一種新的算法用于通過僅僅使用先前知識(沒有任何定量訓練數據)實施在(動態)貝葉斯網絡中的定量概率推理。使用本專利技術的示例性實施方案,可能的是,表示具有線性回歸的條件概率之間的各種不等式關系。可以使用參數約束用于定義在其中每一個模型與先前知識的主體一致的模型空間中的分布。不一致的知識可能被轉化為在知識空間上的分布。本專利技術的示例性實施方案提供了一種使用系統生物學方式識別藥物靶點的計算方法。給定一種調節疾病的網絡,本專利技術的方法可能預測抑制在所述疾病的標記基因上的一組基因的效果。例如,如果在疾病中高度上調兩個標記基因,本專利技術的方法可能發現哪些基因可能減少所述兩個標記基因返回到正常水平的出現的抑制。因此,本專利技術的方法提供了一種識別藥物靶點的系統方式。更具體地,本專利技術的示例性實施方案提供了一種基于生物網絡的系統方法,用于評估治療疾病的多個藥物靶點的抑制效果。這樣的效果經常不能輕易地通過使用傳統分子生物學方式來識別。不同于使用普通或偏微分方程(0DE或TOE)的網絡行為建模的常用方式,示例性實施方案不需要任意類似于用在ODE或PDE中的速率常數的自由參數。這種特征使得建模大的網絡(數百個節點)并分析多個基因的同時擾動的后果成為可能。相反,ODE或PDE經 常被限制為分析相對較小的網絡(10-20個節點)。在藥物靶點探索中分析大的網絡的能力是重要的,因為調節疾病的基因網絡經常涉及大量的基因。因此,ODE或PDE方式僅僅可能考慮在網絡中的局部效果。然而,本專利技術的實施方案可能考慮到抑制在網絡中蛋白質的全局效果并因此可能用于藥物靶點探索中。 在某些實施方案中,本專利技術提供了一種自動確定在給本文檔來自技高網...
【技術保護點】
【技術特征摘要】
【國外來華專利技術】...
【專利技術屬性】
技術研發人員:王巍,常睿,
申請(專利權)人:加利福尼亞大學董事會,
類型:
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。