【技術實現步驟摘要】
本專利技術屬于生物信息,尤其涉及一種快速大批量設計目標基因sgrna的方法。
技術介紹
1、基因編輯(gene?editing)是對生物體遺傳物質進行針對性的修飾,其利用高效而精確的基因編輯技術實現了目標基因的插入、缺失或替換,從而改變生物體遺傳信息和表型特征。基因編輯技術的快速發展給醫學、農業和生物
帶來了巨大的變革和希望。近年來,鋅指核酸酶(zfn)、類轉錄激活因子效應核酸酶(talen)、crispr/cas9、is轉座子核酸酶(tnpb)和單堿基編輯(be)等技術的不斷出現和持續改進,使得基因編輯變得更加準確、高效和可控。這些技術的不斷演進為疾病治療、分子育種和生物技術創新等領域提供了新的工具和方法。特別是crispr/cas9技術,憑借其操作便捷、高效、特異性強等特點,成為了基因編輯鄰域的一顆明星。同時tnpb作為crispr-cas9核酸酶的祖先,其rerna骨架更小,可能具有更好的遞送性能。在醫學和農業領域,tnpb也許能夠發揮重要作用,為基因編輯技術的進一步發展和應用提供思路和方向。
2、作為一種承載物種遺傳信息的載體,基因組序列具有重要意義,可以幫助研究者更好地了解不同物種的遺傳特征、進化歷史和基因功能等重要的信息。此外,基因組序列也為基因編輯技術提供了基礎模板,使得研究者能夠準確地對基因進行編輯,從而實現精準的基因組改造和研究。自2019年以pacbio?hifi測序為代表的高準確度長度長測序技術的出現徹底改變了基因組序列組裝領域,科學家們利用高準度和長度長的特點,首次成功完成了一個完整的人
3、sgrna作為基因編輯工具系統的重要組成部分之一,其作用是引導基因編輯核酸酶準確定位到目標基因的特定位置,從而實現基因編輯的目的。因此,確保sgrna的特異性至關重要,特異性良好的sgrna有助于提高基因編輯的效率和準確性,尤其是針對等位基因,設計特異性良好的sgrna尤為關鍵。目前,雖然有一些在線工具可供設計sgrna,其也具有良好的可視化操作界面。然而,很少有工具專門針對等位基因進行sgrna的設計。此外,現有的在線工具受限于其數據庫中所包含的物種基因組信息,如果研究的物種基因組信息不在其數據庫收錄,就無法利用該工具進行sgrna設計。另外,sgrna的特異性評估也是非常重要的,需要將候選的sgrna與物種的全基因進行比對,以確定其可能的靶向位置,這將需要耗費大量的時間。除此,如果利用基因編輯的方式去構建物種突變體庫,這將需要對大量的目標基因進行sgrna設計,如果能夠利用服務器進行批量并行操作,將會節省大量的時間和人力成本。因此,開發一種具備本地sgrna設計功能的工具將會非常有益,其不會受限于數據庫中物種基因信息的收錄情況。
技術實現思路
1、鑒于此,本專利技術的目的在于提供一種快速大批量設計目標基因sgrna的方法。
2、為了實現上述專利技術目的,本專利技術提供了以下技術方案:
3、本專利技術提供了一種快速大批量設計目標基因sgrna的方法,其特征在于,包括以下步驟:
4、步驟1,輸入必要參數,所述必要參數為設計目標基因sgrna的基因id、核酸酶、含pam基序的sgrna長度、物種全基因組序列、物種所有的cds序列、物種所有基因的bed文件、等位基因數據庫和sgrna數據庫;
5、步驟2,從等位基因數據庫中搜索輸入的目標基因是否存在等位基因,如果存在等位基因,則根據等位基因的bed信息和基因id分別提取等位基因的基因序列和cds序列;如果輸入的目標基因不存在等位基因,則根據輸入的目標基因的bed信息和基因id分別提取目標基因的基因序列和cds序列;
6、步驟3,如果輸入的目標基因存在等位基因,則利用muscle工具對提取的等位基因序列進行多序列比對,鑒定保守序列,得到muscle比對的輸出結果,并且將muscle比對的輸出結果轉換為phylip格式的文本,得到phylip格式的比對結果,然后將保守序列根據輸入的sgrna長度參數切割為k-mer片段,同時對k-mer片段進行反向互補操作,并將原始的k-mer片段和反向互補后的k-mer片段作為候選的sgrna;如果輸入的目標基因不存在等位基因,則直接將目標基因序列根據輸入的sgrna長度參數切割為k-mer片段,同時對k-mer片段進行反向互補操作,并將原始的k-mer片段和反向互補后的k-mer片段作為候選的sgrna;
7、步驟4,根據核酸酶的pam基序,對步驟3候選的sgrna進行篩選,以獲取符合核酸酶的篩選后的sgrna;
8、步驟5,利用sgrna數據庫對步驟4篩選后的sgrna進行特異性評估,根據特異性由好到差對sgrna評估結果進行排序,同時獲取sgrna靶向的基因、外顯子信息以及sgrna中堿基“g”和“c”的百分比含量,得到最終設計的sgrna;
9、步驟6,將步驟2~步驟5結果輸出到對應的結果文件中,同時在輸出目錄中創建的readme文件,對各個輸出文件進行詳細說明。
10、優選的,在步驟1中,所述核酸酶為cas9核酸酶或tnpb核酸酶;所述含pam基序的sgrna長度為19~25nt。
11、優選的,在步驟1中,所述物種所有基因的bed文件的構建方法,包括以下步驟:從物種基因組注釋文件中提取染色體編號、基因id、基因在染色體上的起始位置和終止位置以及基因所在的染色體的正負鏈信息,得到物種所有基因的bed文件。
12、優選的,在步驟1中,所述等位基因數據庫的構建方法包括以下步驟:
13、(s1)將物種基因組注釋文件根據不同的同源染色體進行劃分,得到劃分的同源染色體注釋文件,利用劃分的同源染色體注釋文件和全基因組序列提取cds序列,然后將cds序列翻譯為氨基酸序列;
14、(s2)利用diamond工具對步驟(s1)得到的氨基酸序列進行比對,得到比對結果,對比對結果,以氨基酸序列一致性值大于80為閾值進行過濾,得到序列一致性值大于80的氨基酸序列,并保存到后綴為blast的文件中,得到后綴為blast的本文檔來自技高網...
【技術保護點】
1.一種快速大批量設計目標基因sgRNA的方法,其特征在于,包括以下步驟:
2.根據權利要求1所述的方法,其特征在于,在步驟1中,所述核酸酶為Cas9核酸酶或TnpB核酸酶;所述含PAM基序的sgRNA長度為19~25nt;
3.根據權利要求2所述的方法,其特征在于,在步驟(S2)中,所述比對的參數e-value閾值設為1e-10,比對到的最大序列數設為5;
4.一種計算機可讀存儲介質,其特征在于,所述計算機存儲介質用于存儲計算機指令、程序、代碼集或指令集,當其在計算機上運行時,使得計算機執行權利要求1~3任意一項所述快速大批量設計目標基因sgRNA的方法。
5.一種電子設備,其特征在于,包括處理器和存儲器,所述存儲器用于存儲程序;所述處理器用于運行所述存儲程序,以實現權利要求1~3任意一項所述快速大批量設計目標基因sgRNA的方法。
6.一種根據權利要求1~3任意一項所述方法得到的sgRNA。
7.根據權利要求6所述的sgRNA,其特征在于,所述sgRNA的核苷酸序列如SEQ?ID?NO.1所示;所述sgR
8.一種CRISPR/Cas9系統,其特征在于,在pYLCRISPR/Cas9P35S-H骨架載體上連接有權利要求6或7所述的sgRNA。
9.根據權利要求6或7所述的sgRNA或權利要求8所述的CRISPR/Cas9系統在目標基因編輯或研究目標基因功能中的應用。
...【技術特征摘要】
1.一種快速大批量設計目標基因sgrna的方法,其特征在于,包括以下步驟:
2.根據權利要求1所述的方法,其特征在于,在步驟1中,所述核酸酶為cas9核酸酶或tnpb核酸酶;所述含pam基序的sgrna長度為19~25nt;
3.根據權利要求2所述的方法,其特征在于,在步驟(s2)中,所述比對的參數e-value閾值設為1e-10,比對到的最大序列數設為5;
4.一種計算機可讀存儲介質,其特征在于,所述計算機存儲介質用于存儲計算機指令、程序、代碼集或指令集,當其在計算機上運行時,使得計算機執行權利要求1~3任意一項所述快速大批量設計目標基因sgrna的方法。
5.一種電子設備,其特征在于,包括處理器和存儲器,所...
【專利技術屬性】
技術研發人員:王永強,陳海濤,段康,劉歡立,劉霖,王瑞瑞,董怡玲,王麗萍,竇潔靜,
申請(專利權)人:三杰牧草楊凌研究院有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。