本發明專利技術公開了一種單核苷酸多態性SNP的檢測方法及裝置,包括獲取含有核酸序列信息的讀段序列;將讀段序列與參考序列進行比對,獲取比對上的讀段序列;將比對上的讀段序列按照堿基序列5’端比對位置劃分為不同的冗余讀段序列組;對不同冗余讀段序列組中的每個冗余讀段序列組中的每個讀段序列進行計分,依據讀段序列的得分從一個冗余讀段序列組中得到一個代表讀段序列組;判斷代表讀段序列組是否存在支持假陰性SNP的讀段序列;若判斷結果為是,則從代表讀段序列組中去除支持假陰性SNP的代表讀段序列,獲得不支持假陰性SNP的代表讀段序列組;對不支持假陰性SNP的代表讀段序列組進行SNP檢測。通過本發明專利技術提供的SNP檢測方法,可以提高測序分析結果準確率。
【技術實現步驟摘要】
本專利技術涉及基因組學及生物信息學
,具體涉及一種單核苷酸多態性的檢 測方法及裝置。
技術介紹
隨著測序技術的發展,高通量測序技術被廣泛的應用到生命科學的各個 領域,高通量測序技術(High-throughput sequencing)又稱"下一代"測序技術 (〃Next_generation〃sequencing technology),能一次并行對幾十萬到幾百萬條脫氧核糖 核酸(DNA,Deoxyribonucleic acid)分子進行序列測定和一般讀長(reads)較短等為標 志,亦能用于核糖核酸(RNA,Ribonucleic Acid)測序(RNA-seq,RNA sequencing)。目前 高通量測序平臺有多種,包括 Illumina Solexa/Hiseq、Roche454、Life Technologies ABI SOLiD/Ion Torren,PacBio、Helicos單分子測序平臺以及納米孔測序平臺等。不同測序平 臺的測序原理有所不同,但步驟基本包括文庫制備,測序等。 對測序數據的處理分析包括變異的識別檢測,根據結構的大小,變異可分為單 核苷酸多態性(single nucleotide polymorphism,SNP)、插入缺失(indel)、拷貝數變異 (cope number variants, CNVs)、重復、倒置、平衡/非平衡易位和染色體非整倍性等多種 類型。SNP是指單個核苷酸變異,是人類可遺傳變異中最常見的一種,包括置換、顛換、缺失 和插入,理論上每一個SNP位點都可以有4種不同的變異形式,但實際發生的只有轉換和顛 換。SNP在基因組中分布相當廣泛,譬如在人類基因組中約每1000堿基就出現一次。研究 表明,SNP可能與個體表型差異、對藥物或疾病的易感性等等相關。目前的高通量測序中, 在連續相同堿基處容易發生測序錯誤。譬如Ion Proton測序平臺,其測序原理是當DNA聚 合酶把核苷酸聚合到延伸的DNA鏈上時,會釋放出一個氫離子導致反應池中的pH發生改 變,位于池下的離子感受器感受到信號,再把化學信號直接轉化為數字信號,從而讀出DNA 序列;對于連續η個相同堿基,則DNA聚合酶將連續η核苷酸結合的時候,釋放出來的H+離 子信號強度并不是結合單個核苷酸的釋放出來的完整的η倍,在測讀連續堿基時易發生錯 誤,對后續變異檢測的準確性造成影響。
技術實現思路
本專利技術提供一種SNP的檢測方法及裝置,以提高測序分析結果的準確率。 依據本專利技術的一方面提供一種SNP的檢測方法,其特征在于, 獲取含有核酸序列信息的讀段序列; 將讀段序列與參考序列進行比對,獲取比對上的讀段序列; 將比對上的讀段序列按照5'端比對位置劃分為不同的冗余讀段序列組; 對不同冗余讀段序列組中的每個冗余讀段序列組中的每個讀段序列進行計分,依 據讀段序列的得分從一個冗余讀段序列組中得到一個代表讀段序列組; 判斷代表讀段序列組是否存在支持假陰性單核苷酸多態性SNP的讀段序列, 若判斷結果為是,則從代表讀段序列組中去除支持假陰性SNP的代表讀段序列, 獲得不支持假陰性SNP的代表讀段序列組;若判斷結果為否,則代表讀段序列組為不支持 假陰性SNP的代表讀段序列組; 依據不支持假陰性SNP的代表讀段序列組進行SNP檢測。 依據本專利技術的另一方面提供一種SNP的檢測裝置,包括:數據輸入單元,用于輸入 數據;數據輸出單元,用于輸出數據;存儲單元,用于存儲數據,其中包括可執行的程序;處 理器,與數據輸入單元、數據輸出單元及存儲單元數據連接,用于執行存儲單元中存儲的可 執行的程序,該程序的執行包括完成上述SNP的檢測方法。 本專利技術的有益效果是:通過判斷堿基是否存在假陰性SNP以去除假陽性SNP,從而 提高測序分析結果準確率。【附圖說明】 圖1為本專利技術實施例一的高通量測序流程圖; 圖2為本專利技術實施例一的流程圖; 圖3為本專利技術實施例二的流程圖。【具體實施方式】 下面通過【具體實施方式】結合附圖對本專利技術作進一步詳細說明。 現有的高通量測序平臺有多種,包括Roche454,Ion PGM和Ion Proton等。本發 明中的實施例以Ion Proton測序平臺作說明。本專利技術提供的方法適用于DNA或RNA的SNP 檢測,因此將分別以實施例作闡述。實施例中樣本DNA或RNA的提取、構建文庫等均可利用 現有技術進行,測序文庫構建步驟一般包括打斷、末端修復、加 proton接頭、擴增等,請參 考圖1,RNA樣本的文庫構建一般還包括將RNA反轉錄為DNA來進行文庫構建,測序步驟及 參數可以根據測序平臺、樣本種類等有所調整,不構成對本專利技術的限制。實施例中未注明具 體條件的,按照常規條件或制造商建議的條件進行;所用試劑或儀器未注明生產廠商的,均 為可以通過市面購買獲得的常規產品。 實施例一: 本實施例采用RNA樣本構建文庫。RNA樣本使用人組織混合液RNA的微陣列 質量控制標準品(UHRR-MAQC,Universal Human Reference RNA-MicroArray Quality Control)和人腦混合液RNA微陣列質量控制標準品(HBRR-MAQC,Human Brain Reference RNA-MicroArray Quality Control),其中 UHRR-MAQC 標準品米購自安捷倫公司(Agilent Technologies, Inc. ),HBRR-MAQC購自Ambion公司。在其他【具體實施方式】中,亦可以使用 其他種類的RNA標準品,或是采購自其他公司所生產的RNA標準品,對本專利技術不構成限制。 本實施例構建文庫的過程如下:取總RNA樣品,用DEPCXdiethyl pyrocarbonate, 焦碳酸二乙酯)水稀釋,混勻,65°C變性,使用dT (Dynalbeads 01igo)25·珠將總RNA中的 信使RNA(mRNA)調取出來并純化;將所得mRNA與打斷試劑混合得到打斷的mRNA,再與試劑 I混合進行一鏈合成反應;將一鏈合成反應后的體系與試劑II混合,進行二鏈合成反應,反 應完成后,用Ampure XP磁珠純化二鏈產物;所得二鏈產物與試劑III混合進行末端修復, 并用Ampure XP磁珠純化末端修復產物;所得末端修復產物與試劑IV混合進行加接頭,并 用Ampure XP磁珠純化加接頭產物;采用PCR儀擴增,并用Ampure XP磁珠純化PCR產物, 獲得測序文庫。構建轉錄本文庫或其它RNA文庫亦可利用現有方法,文庫構建并不構成本 專利技術的限制。 試劑 I :0· 5 μ 1 的 IOOmM 二硫蘇糖(DTT,DL-Dithiothreitol)、0· 5 μ 1 的 IOmM 脫 氧核糖核苷三憐酸(dNTP Mix,deoxy-ribonucleoside triphosphate)、0·5μ1 的 RNases 抑制劑(RNase Inhibitor)。 試劑 II :10μ I GEX Second Strand Buffer、2y IlOmM dNTP Mix,0· 2μ 1 逆轉錄 酶 RNaseH、2.5yl DNA 聚合酶 I (DNA Po本文檔來自技高網...

【技術保護點】
一種單核苷酸多態性的檢測方法,其特征在于,包括:獲取含有核酸序列信息的讀段序列;將所述讀段序列與參考序列進行比對,獲取比對上的讀段序列;?將比對上的讀段序列按照5’端比對位置劃分為不同的冗余讀段序列組;對所述不同冗余讀段序列組中的每個冗余讀段序列組中的每個讀段序列進行計分,依據讀段序列的得分從一個冗余讀段序列組中得到一個代表讀段序列組;判斷所述代表讀段序列組是否存在支持假陰性單核苷酸多態性SNP的讀段序列,若判斷結果為是,則從所述代表讀段序列組中去除支持假陰性SNP的代表讀段序列,獲得不支持假陰性SNP的代表讀段序列組;若判斷結果為否,則所述代表讀段序列組為不支持假陰性SNP的代表讀段序列組;依據所述不支持假陰性SNP的代表讀段序列組進行所述SNP檢測。
【技術特征摘要】
【專利技術屬性】
技術研發人員:朱鵬遠,黃文潘,李雅喬,賀玲瑜,盧志遠,章文蔚,席鳳,龔梅花,韓鴻雁,
申請(專利權)人:深圳華大基因科技有限公司,
類型:發明
國別省市:廣東;44
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。