【技術實現步驟摘要】
本申請涉及生物特征檢測,尤其涉及一種納米孔測序數據的處理方法、裝置、設備及介質。
技術介紹
1、納米孔基因測序技術是一種新興的單分子測序技術,它通過將dna或rna引導通過納米孔,利用孔內的電信號來實現對dna或rna的測序。相比傳統的測序技術,納米孔測序技術具有高通量、單分子、實時性等優勢。納米孔基因測序的數據處理過程包括信號處理、堿基識別、序列比對等多個步驟,這些步驟需要大量的計算資源支持。隨著數據規模的增大和測序技術的發展,計算資源消耗成為限制納米孔測序技術廣泛應用的一個重要問題。
技術實現思路
1、本申請實施例的目的在于提出一種納米孔測序數據的處理方法、裝置、設備及介質,以減少納米孔基因測序的數據處理過程中的計算資源,提高數據處理效率。
2、為了解決上述技術問題,本申請實施例提供一種納米孔測序數據的處理方法,包括:
3、獲取電流信號數據,并對所述電流信號數據進行預處理,得到基礎電流信號數據;
4、確定所述基礎電流信號數據的數據分割點,基于所述數據分割點對所述基礎電流信號數據進行分割和映射,得到目標數據,并將所述目標數據劃分為訓練數據和驗證數據;
5、基于所述訓練數據和驗證數據對第一深度學習模型進行訓練,并在訓練過程中對所述訓練數據進行過濾,得到目標第一深度學習模型,其中,所述目標第一深度學習模型用于識別和解碼納米孔測序數據中的堿基信息;
6、獲取多個物種的基因組序列數據,并基于所述基因組序列數據生成目標訓練數據和目
7、基于所述目標訓練數據和所述目標驗證數據對第二深度學習模型進行多重強化訓練,并在訓練過程中對所述目標訓練數據進行過濾,得到目標第二深度學習模型,其中,所述目標第二深度學習模型用于對多種類型的所述納米孔測序數據進行數據處理。
8、為了解決上述技術問題,本申請實施例提供一種納米孔測序數據的處理裝置,包括:
9、電流信號獲取單元,用于獲取電流信號數據,并對所述電流信號數據進行預處理,得到基礎電流信號數據;
10、目標數據生成單元,用于確定所述基礎電流信號數據的數據分割點,基于所述數據分割點對所述基礎電流信號數據進行分割和映射,得到目標數據,并將所述目標數據劃分為訓練數據和驗證數據;
11、第一模型訓練單元,用于基于所述訓練數據和驗證數據對第一深度學習模型進行訓練,并在訓練過程中對所述訓練數據進行過濾,得到目標第一深度學習模型,其中,所述目標第一深度學習模型用于識別和解碼納米孔測序數據中的堿基信息;
12、多物種數據處理單元,用于獲取多個物種的基因組序列數據,并基于所述基因組序列數據生成目標訓練數據和目標驗證數據;
13、第二模型訓練單元,用于基于所述目標訓練數據和所述目標驗證數據對第二深度學習模型進行多重強化訓練,并在訓練過程中對所述目標訓練數據進行過濾,得到目標第二深度學習模型,其中,所述目標第二深度學習模型用于對多種類型的所述納米孔測序數據進行數據處理。
14、為解決上述技術問題,本專利技術采用的一個技術方案是:提供一種電子設備,包括,一個或多個處理器;存儲器,用于存儲一個或多個程序,使得一個或多個處理器實現上述任意一項所述的納米孔測序數據的處理方法。
15、為解決上述技術問題,本專利技術采用的一個技術方案是:一種計算機可讀存儲介質,所述計算機可讀存儲介質上存儲有計算機程序,所述計算機程序被處理器執行時實現上述任意一項所述的納米孔測序數據的處理方法。
16、本專利技術實施例提供了一種納米孔測序數據的處理方法、裝置、設備及介質。其中,方法包括:獲取電流信號數據,并對所述電流信號數據進行預處理,得到基礎電流信號數據;確定所述基礎電流信號數據的數據分割點,基于所述數據分割點對所述基礎電流信號數據進行分割和映射,得到目標數據,并將所述目標數據劃分為訓練數據和驗證數據;基于所述訓練數據和驗證數據對第一深度學習模型進行訓練,并在訓練過程中對所述訓練數據進行過濾,得到目標第一深度學習模型,其中,所述目標第一深度學習模型用于識別和解碼納米孔測序數據中的堿基信息;獲取多個物種的基因組序列數據,并基于所述基因組序列數據生成目標訓練數據和目標驗證數據;基于所述目標訓練數據和所述目標驗證數據對第二深度學習模型進行多重強化訓練,并在訓練過程中對所述目標訓練數據進行過濾,得到目標第二深度學習模型,其中,所述目標第二深度學習模型用于對多種類型的所述納米孔測序數據進行數據處理。本專利技術實施例納米孔測序數據能夠高效地處理納米孔測序產生的大量數據,減少不必要的計算開銷,從而有利于減少納米孔基因測序的數據處理過程中的計算資源,提高了數據處理效率,進而加快數據分析速度。
本文檔來自技高網...【技術保護點】
1.一種納米孔測序數據的處理方法,其特征在于,包括:
2.根據權利要求1所述的納米孔測序數據的處理方法,其特征在于,所述獲取電流信號數據,并對所述電流信號數據進行預處理,得到基礎電流信號數據,包括:
3.根據權利要求1所述的納米孔測序數據的處理方法,其特征在于,所述確定所述基礎電流信號數據的數據分割點,基于所述數據分割點對所述基礎電流信號數據進行分割和映射,得到目標數據,并將所述目標數據劃分為訓練數據和驗證數據,包括:
4.根據權利要求3所述的納米孔測序數據的處理方法,其特征在于,所述基于所述數據分割點對所述塊狀數據集進行索引信息填充,得到所述目標數據,包括:
5.根據權利要求1所述的納米孔測序數據的處理方法,其特征在于,所述基于所述訓練數據和驗證數據對第一深度學習模型進行訓練,并在訓練過程中對所述訓練數據進行過濾,得到目標第一深度學習模型,包括:
6.根據權利要求5所述的納米孔測序數據的處理方法,其特征在于,所述在每一次迭代訓練過程中,基于所述驗證數據計算驗證損失和準確率,并對輸入到所述第一深度學習模型中的訓練數據進行
7.根據權利要求1至6任一項所述的納米孔測序數據的處理方法,其特征在于,所述基于所述目標訓練數據和所述目標驗證數據對第二深度學習模型進行多重強化訓練,并在訓練過程中對所述目標訓練數據進行過濾,得到目標第二深度學習模型之后,所述方法還包括:
8.一種納米孔測序數據的處理裝置,其特征在于,包括:
9.一種電子設備,其特征在于,包括存儲器和處理器,所述存儲器中存儲有計算機程序,所述處理器執行所述計算機程序時實現如權利要求1至7中任一項所述的納米孔測序數據的處理方法。
10.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質上存儲有計算機程序,所述計算機程序被處理器執行時實現如權利要求1至7中任一項所述的納米孔測序數據的處理方法。
...【技術特征摘要】
1.一種納米孔測序數據的處理方法,其特征在于,包括:
2.根據權利要求1所述的納米孔測序數據的處理方法,其特征在于,所述獲取電流信號數據,并對所述電流信號數據進行預處理,得到基礎電流信號數據,包括:
3.根據權利要求1所述的納米孔測序數據的處理方法,其特征在于,所述確定所述基礎電流信號數據的數據分割點,基于所述數據分割點對所述基礎電流信號數據進行分割和映射,得到目標數據,并將所述目標數據劃分為訓練數據和驗證數據,包括:
4.根據權利要求3所述的納米孔測序數據的處理方法,其特征在于,所述基于所述數據分割點對所述塊狀數據集進行索引信息填充,得到所述目標數據,包括:
5.根據權利要求1所述的納米孔測序數據的處理方法,其特征在于,所述基于所述訓練數據和驗證數據對第一深度學習模型進行訓練,并在訓練過程中對所述訓練數據進行過濾,得到目標第一深度學習模型,包括:
6.根據權利要求5所述的納米孔測序數...
【專利技術屬性】
技術研發人員:李軍,臧宇鵬,
申請(專利權)人:深圳市梅麗納米孔科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。