本發(fā)明專利技術(shù)涉及生物信息學(xué),具體說是一種基于生物信息學(xué)獲得雙DNA限制性內(nèi)切酶組合的方法。具體是根據(jù)限制性內(nèi)切酶的酶切位點,設(shè)計雙酶組合方案對目標(biāo)物種參考基因組進行模擬酶切;對模擬酶切產(chǎn)生的片段范圍為90bp-750bp的片段進行分布分析;通過上述分析統(tǒng)計其在目標(biāo)物種基因組上的分布情況,獲得不同雙酶組合的分布數(shù)值,高數(shù)值雙酶組合即為最優(yōu)的雙酶組合。本發(fā)明專利技術(shù)方法的優(yōu)點在于可以針對不同的實驗?zāi)康模ㄟ^選用不同的雙酶組合,達到不同的簡化效率,有利于實驗者在實驗成本與測序數(shù)據(jù)量之間做出平衡,從而優(yōu)化實驗方案。
【技術(shù)實現(xiàn)步驟摘要】
一種基于生物信息學(xué)獲得雙DNA限制性內(nèi)切酶組合的方法
本專利技術(shù)涉及生物信息學(xué),具體說是一種基于生物信息學(xué)獲得雙DNA限制性內(nèi)切酶組合的方法。
技術(shù)介紹
隨著第二代DNA測序技術(shù)的發(fā)展,DNA測序結(jié)果的質(zhì)量不斷提高,測序成本逐漸降低。很多科研工作者都在采用二代測序技術(shù)來獲得待研究物種的序列信息。對于待研究個體數(shù)目較少(少于100個)的項目來講,全基因組測序具有序列信息豐富、基因組覆蓋范圍廣泛的優(yōu)點,但是對于待研究個體數(shù)目較多(多于100個)的項目來說,全基因組重測序的成本仍然很大。如何能在保證獲得足夠的序列信息的基礎(chǔ)上降低測序成本就變得非常重要了。目前主流的方法是RAD、GBS等簡化基因組的方法,這兩種方法簡化基因組信息的主要方式就是通過DNA限制性內(nèi)切酶酶切基因組DNA,通過富集帶有酶切位點的片段來達到簡化的目的。這種方式最重要的步驟就是選擇合適的限制性內(nèi)切酶,合適的限制性內(nèi)切酶應(yīng)該滿足幾個條件:酶切片段均勻分布在基因組上;酶切片段對于基因的編碼區(qū)具有足夠的覆蓋度;酶切位點應(yīng)該盡量避免分布在基因組的重復(fù)序列區(qū);簡化效率合適;酶切片段大小合適,適合于進行PCR擴增和后續(xù)的上機測序等。
技術(shù)實現(xiàn)思路
本專利技術(shù)的目在于提供一種基于生物信息學(xué)獲得雙DNA限制性內(nèi)切酶組合的方法。為實現(xiàn)上述目的,本專利技術(shù)采用的技術(shù)方案為:一種基于生物信息學(xué)獲得雙DNA限制性內(nèi)切酶組合的方法,1)根據(jù)限制性內(nèi)切酶的酶切位點,設(shè)計雙酶組合方案對目標(biāo)物種參考基因組進行模擬酶切;2)對模擬酶切產(chǎn)生的片段范圍為90bp-750bp的片段進行分布分析;3)通過上述分析統(tǒng)計其在目標(biāo)物種基因組上的分布情況,獲得不同雙酶組合的分布數(shù)值,高數(shù)值雙酶組合即為最優(yōu)的雙酶組合。進一步的說,1)選擇多種雙DNA限制性內(nèi)切酶組合,在牡蠣基因組中定位選取組合的酶切識別位點,并給出其在染色體上相應(yīng)的位置坐標(biāo),根據(jù)限制性內(nèi)切酶的酶切位點,設(shè)計雙酶組合方案對牡蠣參考基因組進行模擬酶切;2)對模擬酶切產(chǎn)生的片段范圍為90bp-750bp的片段進行分布分析;3)利用上述分布分析得到的數(shù)據(jù)進行計算,獲得不同雙酶組合的分布數(shù)值,高數(shù)值雙酶組合即為最優(yōu)的雙酶組合。所述雙酶組合為識別6-8個堿基的限制酶與識別4-5個堿基的限制酶的組合。所述步驟2)對模擬酶切產(chǎn)生的片段范圍為90bp-750bp的片段通過RestrictToolKit的生物信息學(xué)軟件進行分布分析下述指標(biāo);指標(biāo)為雙酶切片段范圍為90bp-750bp的簡化率、酶切片段大小的分布、雙酶切片段范圍為90bp-750bp的片段占所有片段比率、雙酶切片段范圍為90bp-750bp的片段在外顯子區(qū)域的比率、雙酶切片段范圍為90bp-750bp的片段在基因間區(qū)的比率和雙酶切片段范圍為90bp-750bp的片段在unique區(qū)域的分布比率。所述步驟3)中分布分析得到的數(shù)據(jù)的規(guī)則為:a)對于雙酶切片段范圍為90bp-750bp的簡化率,其所占權(quán)重為20%,計算公式為:其中x為簡化率,y為相對應(yīng)的得分值;b)對于酶切片段大小的分布,其所占權(quán)重為30%,計算方法為評價一個比率值得大小,這個比率值等于所產(chǎn)生的酶切片段其大小范圍為90bp-750bp的片段占全部片段的比率比上酶切片段大小范圍為90bp以下的片段占全部片段的比率;計算公式為:其中x為比率值,y為相對應(yīng)的得分值;c)對于雙酶切片段范圍為90bp-750bp的片段占所有片段的比率,其權(quán)重占20%,其計算公式為:y=20x-4;其中x為雙酶切片段范圍為90bp-750bp的片段占所有片段的比率,y為相對應(yīng)的得分值;d)對于雙酶切片段范圍為90bp-750bp的片段位于外顯子區(qū)域的比率,其權(quán)重占10%,其計算公式為y=20x;其中x為雙酶切片段范圍為90bp-750bp的片段位于外顯子區(qū)域的比率,y為相對應(yīng)的得分值;e)對于雙酶切片段范圍為90bp-750bp的片段位于基因間區(qū)的比率,其權(quán)重占10%,其計算公式為y=-20x+14;其中x為雙酶切片段范圍為90bp-750bp的片段位于基因間區(qū)的比率,y為相對應(yīng)的得分值;f)對于雙酶切片段范圍為90bp-750bp的片段位于unique區(qū)域的比率,其權(quán)重占10%,對于此項目的計算,采用將產(chǎn)生的酶切片段使用BLAST軟件比對到牡蠣基因組上的方法,對酶切片段的比對情況進行統(tǒng)計,計算公式為:其中x為雙酶切片段范圍為90bp-750bp的片段位于unique區(qū)域的比率,y為相對應(yīng)的得分值;g)計算總分值得公式為:其中a為雙酶切片段范圍為90bp-750bp的簡化率的得分值,b為酶切片段大小的分布的得分值,c為雙酶切片段范圍為90bp-750bp的片段占所有片段的比率的得分值,d為雙酶切片段范圍為90bp-750bp的片段位于外顯子區(qū)域的比率的得分值,e為雙酶切片段范圍為90bp-750bp的片段位于基因間區(qū)的比率的得分值,f為雙酶切片段范圍為90bp-750bp的片段位于unique區(qū)域的比率的得分值。利用所述的最優(yōu)的雙酶組合對牡蠣基因組DNA進行酶切,以酶切產(chǎn)物連接接頭,進行PCR擴增,主要擴增插入片段為90bp-750bp的片段;將擴增片段利用第二代測序技術(shù)進行測序。本專利技術(shù)所具有的優(yōu)點在于:1)可以預(yù)測任意多種內(nèi)切酶組合的酶切效果,進而可以根據(jù)實驗?zāi)康倪x用不同的內(nèi)切酶組合;2)可以從多角度評價酶切片段的情況,為酶切片段提供多方面的評價指標(biāo),系統(tǒng)地了解酶切片段的屬性。3)本專利技術(shù)采用生物信息學(xué)的手段預(yù)測牡蠣基因組中的酶切位點,通過對酶切片段進行參數(shù)評價,獲得最優(yōu)的雙限制性內(nèi)切酶組合,將獲得的最優(yōu)的雙酶組合,對牡蠣基因組DNA進行雙酶切,通過第二代DNA測序技術(shù)獲得序列信息,從而簡化牡蠣基因組。4)采用本專利技術(shù)的方法可以快速有效地篩選出簡化牡蠣基因組過程中合適的DNA限制性內(nèi)切酶雙酶組合,避免工作的盲目性,提高工作效率。具體實施方式以下實施例用于說明本專利技術(shù),但不用來限制本專利技術(shù)的范圍。實施例11)根據(jù)限制性內(nèi)切酶的酶切位點,選擇酶切識別位點為6-8個堿基的限制性內(nèi)切酶與酶切識別位點為4-5個堿基的限制性內(nèi)切酶作為雙酶組合;即,DNA限制性內(nèi)切酶雙酶組合:EcoRI與MseI、BamHI與MseI、EcoRI與HinfI、MseI與AluI;2)對產(chǎn)生的模擬酶切片段進行分析,分別對上述獲得到范圍為90bp-750bp的模擬酶切片段進行分析:利用上述酶組合通過生物信息學(xué)軟件對牡蠣參考基因組進行模擬酶切,產(chǎn)生模擬酶切片段(模擬酶切后產(chǎn)生的酶切片段的序列,及其在參考基因組上的坐標(biāo)位置)參見表1。表1而后再對產(chǎn)生的酶切片段的參數(shù)進行分析評估主要包括如下參數(shù)指標(biāo):1)雙酶切片段范圍為90-750bp的簡化率;2)酶切片段大小分布;3)雙酶切片段范圍為90bp-750bp的片段占所有片段的比率;4)雙酶切片段范圍為90bp-750bp的片段位于外顯子區(qū)域的比率;5)雙酶切片段范圍為90bp-750bp的片段位于基因間區(qū)的比率;6)雙酶切片段范圍為90bp-750bp的片段位于unique區(qū)域的比率。上述參數(shù)指標(biāo)采用通過RestrictToolKit的生物信息學(xué)軟件計算獲得(參見表2)。該軟件可以實現(xiàn)模擬酶切的功能,也可以實現(xiàn)對產(chǎn)生的酶切片段的參數(shù)進行分析的功本文檔來自技高網(wǎng)...
【技術(shù)保護點】
一種基于生物信息學(xué)獲得雙DNA限制性內(nèi)切酶組合的方法,其特征在于:1)根據(jù)限制性內(nèi)切酶的酶切位點,設(shè)計雙酶組合方案對目標(biāo)物種參考基因組進行模擬酶切;2)對模擬酶切產(chǎn)生的片段范圍為90bp?750bp的片段進行分布分析;3)通過上述分析統(tǒng)計其在目標(biāo)物種基因組上的分布情況,獲得不同雙酶組合的分布數(shù)值,高數(shù)值雙酶組合即為最優(yōu)的雙酶組合。
【技術(shù)特征摘要】
1.一種基于生物信息學(xué)獲得雙DNA限制性內(nèi)切酶組合的方法,其特征在于以下步驟:步驟1)根據(jù)限制性內(nèi)切酶的酶切位點,設(shè)計雙酶組合方案對目標(biāo)物種參考基因組進行模擬酶切;步驟2)對模擬酶切產(chǎn)生的片段范圍為90bp-750bp的片段進行分布分析;步驟3)通過上述分析統(tǒng)計其在目標(biāo)物種基因組上的分布情況,獲得不同雙酶組合的分布數(shù)值,高數(shù)值雙酶組合即為最優(yōu)的雙酶組合;所述步驟2)對模擬酶切產(chǎn)生的片段范圍為90bp-750bp的片段通過RestrictToolKit的生物信息學(xué)軟件進行分布分析下述指標(biāo);指標(biāo)為雙酶切片段范圍為90bp-750bp的簡化率、酶切片段大小的分布、雙酶切片段范圍為90bp-750bp的片段占所有片段比率、雙酶切片段范圍為90bp-750bp的片段在外顯子區(qū)域的比率、雙酶切片段范圍為90bp-750bp的片段在基因間區(qū)的比率和雙酶切片段范圍為90bp-750bp的片段在unique區(qū)域的分布比率。2.按權(quán)利要求1所述的基于生物信息學(xué)獲得雙DNA限制性內(nèi)切酶組合的方法,其特征在于以下步驟:步驟1)選擇多種雙DNA限制性內(nèi)切酶組合,在牡蠣基因組中定位選取組合的酶切識別位點,并給出其在染色體上相應(yīng)的位置坐標(biāo),根據(jù)限制性內(nèi)切酶的酶切位點,設(shè)計雙酶組合方案對牡蠣參考基因組進行模擬酶切;步驟2)對模擬酶切產(chǎn)生的片段范圍為90bp-750bp的片段進行分布分析;步驟3)利用上述分布分析得到的數(shù)據(jù)進行計算,獲得不同雙酶組合的分布數(shù)值,高數(shù)值雙酶組合即為最優(yōu)的雙酶組合。3.按權(quán)利要求1或2所述的基于生物信息學(xué)獲得雙DNA限制性內(nèi)切酶組合的方法,其特征在于:所述雙酶組合為識別6-8個堿基的限制酶與識別4-5個堿基的限制酶的組合。4.按權(quán)利要求2所述的基于生物信息學(xué)獲得雙DNA限制性內(nèi)切酶組合的方法,其特征在于:所述步驟3)中分布分析得到的數(shù)據(jù)的規(guī)則為:a)對于雙酶切片段范圍為90bp-750bp的簡化率,其所占權(quán)重為20%,計算公式為:其中x為簡化率,y為相對應(yīng)的得分值;b)對于酶切片段大小的分布,其所占權(quán)重為30%,計算方法為評價一個比率值得大小,這個比率值等...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:王金鵬,李莉,亓海剛,杜雪地,張國范,
申請(專利權(quán))人:中國科學(xué)院海洋研究所,
類型:發(fā)明
國別省市:山東;37
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。