本發明專利技術涉及基于單細胞全基因組測序的遺傳圖譜構建和單體型分析方法,以及用于所述方法的裝置。遺傳圖譜構建方法包括將某物種單細胞的全基因組序列與參考序列進行比對,得到單核苷酸多態性位點基因型的統計結果;對基因型結果進行親本分型,分為最合適的父本/母本(a/b)結果,使得所有細胞的統計結果中出現的重組次數最少;根據分型后的結果,將其劃分為連鎖區域(bin);通過計算a/b的變化比率得到所有相鄰bin之間的重組率;根據每個重組位點的重組率,最終獲得遺傳圖譜。本發明專利技術的方法能夠利用單細胞獲得高分辨率的遺傳圖譜,其不僅可用于人,還可用于一些繁殖能力有限的高等生物,特別是瀕危物種。
【技術實現步驟摘要】
本專利技術涉及遺傳學和生物信息學領域,具體涉及遺傳圖譜的構建方法和裝置,以及單體型分析方法和裝置,特別是涉及基于單細胞全基因組測序的遺傳圖譜構建方法和裝置,以及單體型分析 方法和裝置。
技術介紹
遺傳圖譜的構建基于遺傳學第三定律——基因的連鎖和交換定律,即是以具有遺傳多態性的遺傳標記為“路標”,以遺傳學距離(在減數分裂事件中兩個位點之間進行交換、重組的百分率,I %的重組率稱為IcM)為圖距的基因組圖。遺傳圖譜的構建對于各物種的研究具有重大的意義,能夠闡釋物種的遺傳規律、特點,利用這一功能,我們能夠研究很多與人類相關的生物功能的遺傳規律。比如,在農作物研究中遺傳圖譜的構建能夠使我們了解與作物高產、抗病相關基因的遺傳重組規律,指導我們進行育種工作,獲得高產耐性強的產品;而對于人類自身,遺傳圖譜的構建能夠更好的讓我們進行某些遺傳病的研究,以及指導優生。但是目前遺傳圖譜構建的傳統方法,不能很好的運用于人類自身。由于遺傳圖譜的構建是基于減數分裂中產生的同源重組事件隨機分配到子代個體中的統計分析,因此需要選取每一代的大量個體進行研究,而哺乳動物缺少構圖的大量后代,這就直接限制了人類遺傳譜圖的構建過程,因為很難選取一個如此龐大的家系來滿足統計學隨機性的條件進行研究。N. ARNHEIM, H. LI等利用單精子來構建遺傳圖譜(Genetic mapping by singlesperm typing, Animal Genetics 1991, 22,105-115),解決了樣本選取問題,但是仍然存在很大的局限。文中所采用的方法只能對已知的部分基因作擴增進行后續分析,不僅依賴引物的效果,而且對于未知基因以及不易擴增出的片段無能為力,因此該方法得到的遺傳圖譜相對片面、不完善。以Illumina Solexa、ABI SOLiD和Roche 454為代表的第二代高通量測序技術,以及第三代測序技術(即單分子測序技術),主要包括Helic0s公司的真實單分子測序技術、Pacific Biosciences 公司的單分子實時測序技術和 Oxford Nanopore Technologies公司的納米孔測序技術等在近幾年得到快速發展,已成為基因組學研究的重要工具。
技術實現思路
本專利技術利用全基因組測序技術,獲得單細胞全基因組序列數據,對數據進行生物信息學分析和處理,最終能夠獲得高分辨率的遺傳圖譜并進行單體型分析。本專利技術的第一方面涉及基于單細胞測序的遺傳圖譜構建方法,其包括以下步驟通過全基因組測序獲得某物種單細胞的全基因組序列;將獲得的全基因組序列與該物種的參考序列進行比對,得到包括所有單細胞個體的單核苷酸多態性(SNP)位點的基因型(genotype)數據;根據獲得的基因型數據,運用最小重組法(maximum parsimony ofrecombination, MPR法),推斷出發生重組事件最少情況下的父本和母本兩套染色體各自的基因型,進而確定出各個單細胞SNP基因型的父本/母本(a/b)分型結果;根據分型后的SNP的基因型結果,在染色體上劃分出連鎖區域(linkage region,LR,也可稱為bin),劃分為一個bin的標準是(1)連續相同SNP (即都為a或b)的數量至少為5個;(2)選取的bin的物理長度大于250kb ;得到bin的分型后,通過對所有細胞bin的情況進行統計,計算出a/b的變化比率,進而可得出每連續兩個bin與bin之間的重組率; 根據每連續兩個bin與bin之間的重組率,得到重組圖譜;其中a型與b型bin交界的位點即為重組位點,通過統計多個樣本在重組位點的重組情況,得到每個重組位點的重組率,最終獲得遺傳圖譜。根據本專利技術第一方面的構建方法,其中所述的某物種為子代數目有限的高等生物,例如為哺乳動物;在本專利技術的實施方案中,所述的某物種為人。根據本專利技術第一方面的構建方法,其中所述的單細胞可以為生殖細胞,在本專利技術的實施方案中,所述的單細胞為精子細胞。根據本專利技術第一方面的構建方法,其中所述的獲得某物種單細胞全基因組序列的方法為本領域技術人員知曉和使用的常規方法,其中包括獲得細胞的全基因組DNA、擴增全基因組DNA和全基因組DNA測序的步驟;根據本專利技術第一方面的構建方法,所述的擴增全基因組DNA的方法為本領域技術人員知曉和使用的常規方法,例如可以為簡并寡核苷酸引物PCR (degenerateoligonucleotide-primed PCR, D0P-PCR)、連接反應介導的 PCR(ligation mediated PCR,LM-PCR)、改良的擴增前引物延伸反應(improved primer extension preamplification,I-PEP)、多重鏈轉換擴增(multiple displacement amplification, MDA)或基于引物酶的全基因組擴增技術(primase-based whole ge-nome amplification,pWGA)等方法,在本專利技術的一個實施方案中,所述的擴增全基因組DNA的方法為基于鏈置換反應的DNA等溫擴增方法,例如為MDA方法。根據本專利技術第一方面的構建方法,可以采用本領域常規的高通量測序方法進行全基因組測序,例如以Illumina Solexa、ABI SOLiD和Roche 454為代表的第二代測序技術,以及第三代測序技術,即單分子測序技術,例如Helic0S公司的真實單分子測序技術、Pacific Biosciences公司的單分子實時測序技術和Oxford Nanopore Technologies公司的納米孔測序技術;在本專利技術的實施方案中,采用Illumina Solexa第二代測序技術。根據本專利技術第一方面的構建方法,其中所述的獲得細胞全基因組DNA的方法中包括使用微量鹽酸胍的步驟。在本專利技術的實施方案中,采用室溫堿裂解細胞、并加入微量鹽酸胍的方法。其中所述微量鹽酸胍的終濃度為2X 10_3 3X K^mol/L,在本專利技術的一個實施方案中,所述微量鹽酸胍的終濃度為2X10_3mol/L。在本專利技術的一個實施方案中,所述的單細胞為精子細胞。根據本專利技術第一方面的構建方法,其中將獲得的全基因組序列與該物種的參考序列進行比對,得到SNP位點基因型的統計結果的方法為本領域技術人員知曉和常用的方法,在本專利技術的一個實施方案中,其包括以下步驟以所述物種例如人類的參考序列例如Hgl9為對照建立索引,將測序獲得的全基因組序列數據通過核酸序列比對軟件例如SOAP的比對分析得到比對結果;以參考序列例如人類Hgl9的fasta文件和dbSNP作為參照,將上述比對結果通過SNP探測軟件例如SOAPsnp得到call SNP的結果cns文件;通過對cns文件的進一步處理,即可篩選得到可靠的SNP位點數據;通過將不同單細胞的SNP位點數據整合到一個文件中,得到一個包括所有單細胞的各個SNP位點基因型的統計結果。本專利技術的第二方面涉及基于單細胞測序的遺傳圖譜構建裝置(圖2),其包括單細胞全基因組測序單元,用于獲得某物種單細胞的全基因組序列; SNP位點基因型統計單元,與所述的單細胞全基因組測序單元相連,用于將某物種單細胞的全基因組序列與該物種的參考本文檔來自技高網...
【技術保護點】
基于單細胞測序的遺傳圖譜構建方法,其包括以下步驟:通過全基因組測序獲得某物種單細胞的全基因組序列;將獲得的全基因組序列與該物種的參考序列進行比對,得到包括所有單細胞SNP位點的基因型的統計結果數據;根據獲得的基因型數據,運用最小重組法推斷出發生重組事件最少情況下的父本和母本兩套染色體各自的基因型,進而確定出各個單細胞SNP基因型的父本/母本(a/b)分型結果;根據分型后的SNP的基因型結果,在染色體上將其劃分為連鎖區域(bin),劃分為一個bin的標準是:(1)連續相同a或b的SNP數量至少為5個;(2)選取的bin的物理長度大于250kb;得到bin的分型后,通過對所有細胞bin的情況進行統計,計算出連續兩個bin之間a/b的變化比率,進而可得出每連續兩個bin與bin之間的重組率;根據每連續兩個bin與bin之間的重組率,得到重組圖譜;其中a與b交界的位點即為重組位點,通過統計多個樣本在重組位點的重組情況,得到每個重組位點的重組率,最終獲得遺傳圖譜。
【技術特征摘要】
【專利技術屬性】
技術研發人員:宋盧挺,邵迪,鄭澤群,鄭智俊,吳逵,梁舒恒,陶曄,侯勇,
申請(專利權)人:深圳華大基因科技有限公司,深圳華大基因研究院,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。