• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種快速大批量設計目標基因sgRNA的方法技術

    技術編號:43804562 閱讀:13 留言:0更新日期:2024-12-27 13:22
    本發明專利技術提供了一種快速大批量設計目標基因sgRNA的方法,屬于生物信息技術領域。本發明專利技術所述方法將等位基因進行匹配判斷、提取基因序列和CDS序列、使用Muscle工具對提取的基因序列進行多序列比對、提取比對結果中的保守序列、根據保守序列進行sgRNA設計和特異性評估這五部分流程整合到一起,以適應本地化大批量設計和評估目標基因sgRNA的需求。本發明專利技術所述方法能夠有效避免現有在線工具受到其數據庫收錄的物種基因組信息的限制,可以對大批量目標基因快速設計sgRNA以及sgRNA的特異性評估,該方法利用sgRNA編輯目標基因的效率高,編輯效率在72%以上。

    【技術實現步驟摘要】

    本專利技術屬于生物信息,尤其涉及一種快速大批量設計目標基因sgrna的方法。


    技術介紹

    1、基因編輯(gene?editing)是對生物體遺傳物質進行針對性的修飾,其利用高效而精確的基因編輯技術實現了目標基因的插入、缺失或替換,從而改變生物體遺傳信息和表型特征。基因編輯技術的快速發展給醫學、農業和生物
    帶來了巨大的變革和希望。近年來,鋅指核酸酶(zfn)、類轉錄激活因子效應核酸酶(talen)、crispr/cas9、is轉座子核酸酶(tnpb)和單堿基編輯(be)等技術的不斷出現和持續改進,使得基因編輯變得更加準確、高效和可控。這些技術的不斷演進為疾病治療、分子育種和生物技術創新等領域提供了新的工具和方法。特別是crispr/cas9技術,憑借其操作便捷、高效、特異性強等特點,成為了基因編輯鄰域的一顆明星。同時tnpb作為crispr-cas9核酸酶的祖先,其rerna骨架更小,可能具有更好的遞送性能。在醫學和農業領域,tnpb也許能夠發揮重要作用,為基因編輯技術的進一步發展和應用提供思路和方向。

    2、作為一種承載物種遺傳信息的載體,基因組序列具有重要意義,可以幫助研究者更好地了解不同物種的遺傳特征、進化歷史和基因功能等重要的信息。此外,基因組序列也為基因編輯技術提供了基礎模板,使得研究者能夠準確地對基因進行編輯,從而實現精準的基因組改造和研究。自2019年以pacbio?hifi測序為代表的高準確度長度長測序技術的出現徹底改變了基因組序列組裝領域,科學家們利用高準度和長度長的特點,首次成功完成了一個完整的人類基因組組裝,使得每條染色體從端粒到端粒都得到了完整的組裝(telomere-to-telomere,t2t)。隨后,越來越多的物種也相繼實現了端粒到端粒的完整基因組組裝。許多科學家認為,基因組組裝已經進入了t2t時代,標志著可以更加準確地了解其中的基因和序列特征,包括等位基因。除了單個物種的基因組研究外,圖泛基因組的概念也逐漸受到關注。圖泛基因組考慮了一個物種多個個體之間的基因組變異和多樣性,其將多個個體的基因組進行基因分型。通過圖泛基因組組裝,可以更好地捕捉種群內部更加豐富的遺傳變異信息。綜上所述,隨著t2t基因組和圖泛基因組組裝的快速發展,基于物種t2t基因組和圖泛基因組為基礎模板進行基因編輯將會成為一種方法,尤其是在分子育種領域。在這個過程中,設計特異性較好的sgrna(small?guide?rna)以實現等位基因的純合編輯的目標也將是重要的一環。

    3、sgrna作為基因編輯工具系統的重要組成部分之一,其作用是引導基因編輯核酸酶準確定位到目標基因的特定位置,從而實現基因編輯的目的。因此,確保sgrna的特異性至關重要,特異性良好的sgrna有助于提高基因編輯的效率和準確性,尤其是針對等位基因,設計特異性良好的sgrna尤為關鍵。目前,雖然有一些在線工具可供設計sgrna,其也具有良好的可視化操作界面。然而,很少有工具專門針對等位基因進行sgrna的設計。此外,現有的在線工具受限于其數據庫中所包含的物種基因組信息,如果研究的物種基因組信息不在其數據庫收錄,就無法利用該工具進行sgrna設計。另外,sgrna的特異性評估也是非常重要的,需要將候選的sgrna與物種的全基因進行比對,以確定其可能的靶向位置,這將需要耗費大量的時間。除此,如果利用基因編輯的方式去構建物種突變體庫,這將需要對大量的目標基因進行sgrna設計,如果能夠利用服務器進行批量并行操作,將會節省大量的時間和人力成本。因此,開發一種具備本地sgrna設計功能的工具將會非常有益,其不會受限于數據庫中物種基因信息的收錄情況。


    技術實現思路

    1、鑒于此,本專利技術的目的在于提供一種快速大批量設計目標基因sgrna的方法。

    2、為了實現上述專利技術目的,本專利技術提供了以下技術方案:

    3、本專利技術提供了一種快速大批量設計目標基因sgrna的方法,其特征在于,包括以下步驟:

    4、步驟1,輸入必要參數,所述必要參數為設計目標基因sgrna的基因id、核酸酶、含pam基序的sgrna長度、物種全基因組序列、物種所有的cds序列、物種所有基因的bed文件、等位基因數據庫和sgrna數據庫;

    5、步驟2,從等位基因數據庫中搜索輸入的目標基因是否存在等位基因,如果存在等位基因,則根據等位基因的bed信息和基因id分別提取等位基因的基因序列和cds序列;如果輸入的目標基因不存在等位基因,則根據輸入的目標基因的bed信息和基因id分別提取目標基因的基因序列和cds序列;

    6、步驟3,如果輸入的目標基因存在等位基因,則利用muscle工具對提取的等位基因序列進行多序列比對,鑒定保守序列,得到muscle比對的輸出結果,并且將muscle比對的輸出結果轉換為phylip格式的文本,得到phylip格式的比對結果,然后將保守序列根據輸入的sgrna長度參數切割為k-mer片段,同時對k-mer片段進行反向互補操作,并將原始的k-mer片段和反向互補后的k-mer片段作為候選的sgrna;如果輸入的目標基因不存在等位基因,則直接將目標基因序列根據輸入的sgrna長度參數切割為k-mer片段,同時對k-mer片段進行反向互補操作,并將原始的k-mer片段和反向互補后的k-mer片段作為候選的sgrna;

    7、步驟4,根據核酸酶的pam基序,對步驟3候選的sgrna進行篩選,以獲取符合核酸酶的篩選后的sgrna;

    8、步驟5,利用sgrna數據庫對步驟4篩選后的sgrna進行特異性評估,根據特異性由好到差對sgrna評估結果進行排序,同時獲取sgrna靶向的基因、外顯子信息以及sgrna中堿基“g”和“c”的百分比含量,得到最終設計的sgrna;

    9、步驟6,將步驟2~步驟5結果輸出到對應的結果文件中,同時在輸出目錄中創建的readme文件,對各個輸出文件進行詳細說明。

    10、優選的,在步驟1中,所述核酸酶為cas9核酸酶或tnpb核酸酶;所述含pam基序的sgrna長度為19~25nt。

    11、優選的,在步驟1中,所述物種所有基因的bed文件的構建方法,包括以下步驟:從物種基因組注釋文件中提取染色體編號、基因id、基因在染色體上的起始位置和終止位置以及基因所在的染色體的正負鏈信息,得到物種所有基因的bed文件。

    12、優選的,在步驟1中,所述等位基因數據庫的構建方法包括以下步驟:

    13、(s1)將物種基因組注釋文件根據不同的同源染色體進行劃分,得到劃分的同源染色體注釋文件,利用劃分的同源染色體注釋文件和全基因組序列提取cds序列,然后將cds序列翻譯為氨基酸序列;

    14、(s2)利用diamond工具對步驟(s1)得到的氨基酸序列進行比對,得到比對結果,對比對結果,以氨基酸序列一致性值大于80為閾值進行過濾,得到序列一致性值大于80的氨基酸序列,并保存到后綴為blast的文件中,得到后綴為blast的本文檔來自技高網...

    【技術保護點】

    1.一種快速大批量設計目標基因sgRNA的方法,其特征在于,包括以下步驟:

    2.根據權利要求1所述的方法,其特征在于,在步驟1中,所述核酸酶為Cas9核酸酶或TnpB核酸酶;所述含PAM基序的sgRNA長度為19~25nt;

    3.根據權利要求2所述的方法,其特征在于,在步驟(S2)中,所述比對的參數e-value閾值設為1e-10,比對到的最大序列數設為5;

    4.一種計算機可讀存儲介質,其特征在于,所述計算機存儲介質用于存儲計算機指令、程序、代碼集或指令集,當其在計算機上運行時,使得計算機執行權利要求1~3任意一項所述快速大批量設計目標基因sgRNA的方法。

    5.一種電子設備,其特征在于,包括處理器和存儲器,所述存儲器用于存儲程序;所述處理器用于運行所述存儲程序,以實現權利要求1~3任意一項所述快速大批量設計目標基因sgRNA的方法。

    6.一種根據權利要求1~3任意一項所述方法得到的sgRNA。

    7.根據權利要求6所述的sgRNA,其特征在于,所述sgRNA的核苷酸序列如SEQ?ID?NO.1所示;所述sgRNA為紫花苜蓿基因MsPALM1的sgRNA。

    8.一種CRISPR/Cas9系統,其特征在于,在pYLCRISPR/Cas9P35S-H骨架載體上連接有權利要求6或7所述的sgRNA。

    9.根據權利要求6或7所述的sgRNA或權利要求8所述的CRISPR/Cas9系統在目標基因編輯或研究目標基因功能中的應用。

    ...

    【技術特征摘要】

    1.一種快速大批量設計目標基因sgrna的方法,其特征在于,包括以下步驟:

    2.根據權利要求1所述的方法,其特征在于,在步驟1中,所述核酸酶為cas9核酸酶或tnpb核酸酶;所述含pam基序的sgrna長度為19~25nt;

    3.根據權利要求2所述的方法,其特征在于,在步驟(s2)中,所述比對的參數e-value閾值設為1e-10,比對到的最大序列數設為5;

    4.一種計算機可讀存儲介質,其特征在于,所述計算機存儲介質用于存儲計算機指令、程序、代碼集或指令集,當其在計算機上運行時,使得計算機執行權利要求1~3任意一項所述快速大批量設計目標基因sgrna的方法。

    5.一種電子設備,其特征在于,包括處理器和存儲器,所...

    【專利技術屬性】
    技術研發人員:王永強陳海濤段康劉歡立劉霖王瑞瑞董怡玲王麗萍竇潔靜
    申請(專利權)人:三杰牧草楊凌研究院有限公司
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 亚洲AV无码专区国产乱码不卡| 无码人妻一区二区三区免费看| 亚洲AV无码之国产精品| 亚洲AV无码成人网站在线观看| 无码国内精品久久人妻麻豆按摩 | 精品无码国产自产拍在线观看| 亚洲综合无码无在线观看| 亚洲国产综合无码一区二区二三区| 亚洲AV区无码字幕中文色| 东京热加勒比无码视频| 毛片无码一区二区三区a片视频| 韩日美无码精品无码| 无码中文字幕色专区| 亚洲看片无码在线视频| 久久精品中文字幕无码| 免费人妻av无码专区| 国产精品无码一区二区三区毛片 | 亚洲AV无码一区二区三区网址| 国产成人无码AV一区二区| 五月天无码在线观看| 无码日韩人妻av一区免费| 91无码人妻精品一区二区三区L| 亚洲精品无码久久一线| 亚洲一本大道无码av天堂| 国产精品无码2021在线观看| av无码免费一区二区三区| 成人午夜亚洲精品无码网站| 熟妇人妻中文av无码| aⅴ一区二区三区无卡无码| 丰满爆乳无码一区二区三区| 亚洲精品偷拍无码不卡av| 熟妇人妻无码中文字幕| 蜜芽亚洲av无码精品色午夜| 国产成人精品无码免费看| 无码人妻AV一二区二区三区| 亚洲av无码av制服另类专区| 亚洲va无码专区国产乱码| 亚洲AV无码久久精品色欲| 国产成人AV片无码免费| 亚洲Av无码一区二区二三区| 亚洲熟妇无码av另类vr影视|