本發明專利技術提出單細胞分類和篩選的方法,以及用于所述方法的裝置。將樣本測序得到的reads與參考基因組進行比對,并將比對結果進行數據過濾;根據過濾后的數據確定每個單細胞樣本的一致基因型,并將所有單細胞樣本的一致基因型保存為SNP數據集;從已保存的SNP數據集提取與參考基因組SNP數據集位置對應的位點的基因型文件;挑選細胞突變SNP位點,并根據細胞突變SNP位點的基因型文件,對細胞進行分類及功能基因篩選。本發明專利技術避免對細胞進行標記的操作,解決了傳統的單細胞分類方法中某些細胞亞群無對應的特異性標記物而無法分類的問題;另一方面,全面完整地分析單細胞基因組的遺傳變異信息,大大提高了細胞亞群分類的準確性。
【技術實現步驟摘要】
本專利技術涉及生物信息學,尤其涉及單細胞分類和篩選方法以及用于所述方法的裝置。
技術介紹
不同個體之間,個體的不同組織之間,甚至同一組織的不同部位在基因表達、拷貝數變異、表觀遺傳等方面都存在顯著差異。細胞之間也存在異質性,即使是體外培養遺傳背景完全相同的細胞群體。對于干細胞或前體細胞,因為任何狀態改變都是可遺傳的,細胞異質性尤為明顯。為了更好地研究細胞生物學,揭示細胞異質性的規律,非常需要開發應用于單個細胞研究的技術方法,因此有學者提出“單細胞分析(SCA) ”概念,從“組學(Omics)I度進行闡述。單細胞分類和篩選為單細胞分析提供了重要基礎。·單細胞分類可以有效應用于各種干細胞分化過程的研究中,如腫瘤干細胞、胚胎干細胞的定向分化、造血干細胞的研究中,需要篩選不同分化階段的干細胞,進行各種干細胞的檢測。在耐藥性研究中,需要對給藥不同時期的細胞進行精確分類,從而進一步分析該細胞亞群的耐藥性和耐藥基因,例如可進行癌癥病人的多藥耐藥性及多藥耐藥基因與藥物濫用、藥物耐受、藥物依賴的關系的研究。同樣地,在藥物靶點基因的篩選中,由于藥物與細胞,特別是敏感細胞相互作用,將引起細胞外部形態及內部正常代謝過程的一系列變化,因此篩選出敏感細胞是關鍵的第一步,為后期精確定位藥物靶點基因提供重要基礎。單細胞分類和篩選應用于建立藥效篩選模型,為藥物設計、靶點的選擇和用藥方案的確定提供理論依據,同時使藥物篩選有了更高的特異性。目前,常用的篩選單細胞方法多為物理機械、化學或生物的方法,如流式細胞儀、磁性細胞分選儀等方法。一方面,這些技術采用表面活性劑、熒光染料、抗原抗體,細胞毒性大,只能對特異標記的或非特異標記的單細胞懸液進行分選,前期樣本制備過程繁瑣,且目前對眾多熒光探針、單抗(包括細胞表面CD分子)的特異性爭論較多,許多細胞亞群并無對應的特異性標記物/特異性抗原;另一方面,這些技術采用生物學、免疫學、化學方法,通過表型測定(包括細胞大小、細胞粒度、細胞表面積、核漿比例等),進行統計學分析,對于亞群分類、篩選和檢測的靈敏度低,缺乏有效的準確性評估。
技術實現思路
在本專利技術中,除另有說明,否則本文中使用的科學和技術術語具有本領域技術人員所通常理解的含義。同時,為了更好地理解本專利技術,下面提供相關術語的定義和解釋。術語“基因型的可能性文件”,是指利用SNP檢測軟件,設置先驗概率參數利用貝葉斯公式計算出的樣本目標區域可能的基因型的后驗概率的數值集合;當利用的SNP檢測軟件是SOAPsnp時,生成的“基因型的可能性文件”即為CNS文件。如本文使用的,“基因型文件”是指選擇上述“基因型的可能性文件”中概率最大的基因型作為每個細胞的一致基因型后,根據參考基因組SNP數據集位置信息,提取每個細胞基因型的相應位點,獲得的群體SNP在各細胞相應位點的基因型集合。鑒于現有單細胞的分類和篩選方法存在的問題,本專利技術提出單細胞分類和篩選方法,以及所述方法的裝置。本專利技術提出單細胞分類方法,包括以下步驟將每個單細胞樣本經測序得到的reads (讀段)結果與參考基因組序列進行比對,并將比對結果進行數據過濾;根據過濾后的數據確定每個單細胞樣本的一致基因型(genotype),并將所有單細胞樣本的一致基因型保存為SNP數據集; 從已保存的SNP數據集提取與參考基因組SNP數據集位置對應的位點的基因型文件;挑選細胞突變SNP位點,并根據細胞突變SNP位點的基因型文件,對細胞進行分類。本專利技術還提出單細胞分類裝置,包括數據過濾模塊,將每個單細胞樣本經測序得到的reads與參考基因組序列進行比對,并將比對結果進行數據過濾;基因型確定模塊,根據過濾后的數據確定每個單細胞樣本的一致基因型,并將所有單細胞樣本的一致基因型保存為SNP數據集;基因型文件提取模塊,從已保存的SNP數據集提取與參考基因組SNP數據集位置對應的位點的基因型文件;分類模塊,挑選細胞突變SNP位點,根據細胞群體突變SNP的基因型文件,對細胞進行分類。本專利技術還提出單細胞篩選方法,包括以下步驟得到已預測基因組中基因的起止位置;根據細胞分類結果獲得已分類群體,計算每類群體中每個基因所有SNP位點的統計量,并累加統計量;對獲得的統計量作差異檢驗,獲得檢驗值;將已預測基因按統計量或檢驗值進行排序,篩選出統計量或檢驗值最高的基因。本專利技術還提出單細胞篩選裝置,包括獲取單元,得到已預測基因組中基因的起止位置;計算單元,根據細胞分類結果獲得已分類群體,計算每類群體中每個基因所有SNP位點的統計量,并累加統計量;對獲得的統計量作差異檢驗,獲得檢驗值;排序單元,耦合于獲取單元和計算單元,將已預測基因按統計量或檢驗值進行排序,篩選出統計量或檢驗值最聞的基因。本專利技術采用新一代測序技術(NGS),通過生物信息學方法,對單細胞基因組進行分析和研究,收集細胞亞群(或微粒)進行深入的后續研究。一方面,避免對細胞進行標記的操作,有效解決了傳統的單細胞分類方法中某些細胞亞群無對應的特異性標記物而無法進行分類的問題;另一方面,全面完整地分析單細胞基因組的遺傳變異信息,并設置多個對照樣本,大大提高了細胞亞群分類的準確性。本專利技術還提出單細胞篩選方法,能夠篩選出細胞亞群(或微粒),提高了細胞篩選的準確性。附圖說明圖I為現有技術的重復片段(Duplication Reads)示意圖;圖2為現有技術的唯一比對上參考基因組的片段(Unique mapped reads)的示意圖;圖3為本專利技術單細胞分類和篩選的方法流程圖;圖4為本專利技術腎癌外顯子組測序的N-J關系樹;圖5為本專利技術腎癌外顯子組測序的最大似然關系樹;圖6為本專利技術腎癌外顯子組測序PCA結果圖,橫坐標表示第一主成分向量,縱坐標·表不第二主成分向量;圖7為本專利技術腎癌外顯子組測序PCA結果圖,橫坐標表示第一主成分向量,縱坐標表不第三主成分向量;圖8為本專利技術腎癌外顯子組測序PCA結果圖,橫坐標表示第一主成分向量,縱坐標表不第四主成分向量;圖9為本專利技術腎癌外顯子組測序Structure結果圖,其中“系列I”表示癌細胞群體,“系列2”表示癌旁細胞群體;圖10為本專利技術53個癌細胞與8個正常細胞分類關系示意圖;圖11為本專利技術癌細胞與正常細胞聚類示意圖,橫坐標表示第一主成分向量,縱坐標表示第二主成分向量;圖12為本專利技術單細胞分類裝置示意圖;圖13為本專利技術單細胞分類裝置中篩選模塊示意圖。具體實施例方式本專利技術采用新一代測序技術(NGS),通過生物信息學方法,對單細胞基因組進行分析和研究,篩選和收集細胞亞群(或微粒)進行深入的后續研究。以更高效、方便地應用于臨床診斷和治療(如產前診斷、胚胎植入前遺傳診斷、個體化治療、多點圖譜制作、精子和卵子的分型、遺傳病診斷、腫瘤(如淋巴瘤、白血病)分型等)、醫學研究(如自閉癥、神經系統疾病和自體免疫性疾病的研究、基因組變異率研究、干細胞研究、耐藥性研究、藥物靶點基因的篩選、轉錄組檢測、細胞模型研究、種群鑒定等)、考古學研究、法醫學檢測中。本專利技術中涉及的單細胞樣本包括核酸(基因組DNA或RNA,如非編碼RNA、mRNA);單細胞來自生物體,采用常規方法制備。特別的,DNA或RNA可由細菌、原生動物、真菌、病毒及高等生物/高等動植物,如哺乳動物,特別是人類的單細胞提取或擴增得到。單細胞本文檔來自技高網...
【技術保護點】
單細胞分類方法,包括以下步驟:將每個單細胞樣本經測序得到的reads結果與參考基因組序列進行比對,并將比對結果進行數據過濾;根據過濾后的數據確定每個單細胞樣本的一致基因型,并將所有單細胞樣本的一致基因型保存為SNP數據集;從已保存的SNP數據集提取與參考基因組SNP數據集位置對應的位點的基因型文件;挑選細胞突變SNP位點,并根據細胞突變SNP位點的基因型文件,對細胞進行分類。
【技術特征摘要】
【專利技術屬性】
技術研發人員:徐訊,鮑莉,何偉明,侯勇,陶曄,
申請(專利權)人:深圳華大基因科技有限公司,深圳華大基因研究院,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。