CRISPR-Cas9最著名的功能是作為編輯DNA的實驗室工具,但它的自然功能是作為免疫系統(tǒng)的一部分,幫助某些微生物對抗病毒。

CRISPR-Cas9系統(tǒng)(如圖)用于發(fā)現(xiàn)和切割特定的DNA序列。圖片來源:CarlosClarivan/SciencePhotoLibrary
麻省理工學院生物化學家張鋒團隊聯(lián)合美國國家生物技術信息中心研究人員開發(fā)出一種名為FLSHclust的新算法,在數(shù)十億個蛋白質序列中發(fā)現(xiàn)了188個罕見且以前未知的CRISPR連接基因模塊。新發(fā)現(xiàn)為利用CRISPR系統(tǒng)和了解微生物蛋白質的功能多樣性提供了新機會。
“我們對CRISPR系統(tǒng)的多樣性感到驚訝。”麻省理工學院生物化學家張鋒,“做這種分析可以讓我們一石二鳥:既研究生物學,也可能找到有用的東西。”
單細胞細菌和古細菌使用CRISPR系統(tǒng)來保護自己免受噬菌體的侵害。CRISPR系統(tǒng)通常由兩部分組成:識別并結合噬菌體DNA或RNA的“引導RNA”分子,以及在引導RNA指示的位點切割或干擾遺傳物質的酶。
到目前為止,研究人員已經(jīng)確定了六種CRISPR系統(tǒng),分別從I命名到VI。它們有不同的特性,包括使用酶的類型,以及它們如何識別、結合和切割RNA或DNA。用于基因工程的CRISPR-cas9系統(tǒng)被歸類為II型,其他類型的CRISPR特征可能對其他方面有用。
為了在自然界中找到不同的CRISPR系統(tǒng),張鋒團隊開發(fā)了一種名為FLSHclust的算法,可分析公共數(shù)據(jù)庫中的基因序列。這些數(shù)據(jù)庫包含來自細菌和古細菌的數(shù)十萬個基因組,數(shù)億個未與特定物種相關聯(lián)的序列,以及數(shù)十億個編碼蛋白質的基因。FLSHclust通過尋找基因序列之間的相似性,并將它們分組成大約5億個簇,發(fā)現(xiàn)了CRISPR相關基因。
通過觀察這些簇的預測功能,研究人員發(fā)現(xiàn)了大約13萬個基因以某種方式與CRISPR相關,其中188個是以前從未見過的,他們在實驗室測試了幾個基因以了解它們的作用。實驗結果揭示了CRISPR系統(tǒng)用來攻擊噬菌體的各種策略,包括解開DNA雙螺旋結構,以及以允許基因插入或刪除的方式切割DNA。他們還發(fā)現(xiàn)了“抗CRISPR”的DNA片段,這可能有助于噬菌體逃避細菌的防御。
在這些新基因中,有一種完全未知的靶向RNA的CRISPR系統(tǒng)的代碼,該團隊將其命名為VII型。研究通訊作者之一、美國國家生物技術信息中心生物學家EugeneKoonin表示,找到新的CRISPR系統(tǒng)越來越難了,VII型和任何其他尚未被識別的CRISPR類型在自然界中一定是極其罕見的,這可能需要付出巨大的努力才能找到下一種類型。
巴黎薩克雷大學微生物學家ChristinePourcel說,很難知道某些類型的CRISPR系統(tǒng)是罕見的,因為它們對微生物通常沒有用處,還是專門適應于生活在特定環(huán)境中的生物體。她補充說,由于研究中使用的基因數(shù)據(jù)庫包括與特定生物體沒有聯(lián)系的基因組片段,因此很難研究一些新系統(tǒng)的作用。
新西蘭達尼丁奧塔哥大學生物化學家ChrisBrown表示,該算法本身就是一項重大進步,因為它將使研究人員能夠在不同物種之間尋找其他類型的蛋白質。
“這是生物化學家的寶庫?!钡聡R爾堡大學微生物學家LennartRandau對此表示贊同。他說,下一步將是找出酶和系統(tǒng)工作的機制,以及如何將它們用于生物工程?!耙恍〤RISPR蛋白會隨機切割DNA,對工程毫無用處。但它們在檢測DNA或RNA序列方面非常精確,可能會成為很好的診斷或研究工具。”
研究人員認為,現(xiàn)在說VII型CRISPR系統(tǒng)或FLSHclust鑒定的任何其他基因是否對基因工程有幫助還為時過早,但它們有一些可能有用的特性。例如,VII型病毒只涉及很少的基因,這些基因可以很容易地裝入病毒載體并傳遞到細胞中。相比之下,該團隊發(fā)現(xiàn)的其他一些系統(tǒng)包含非常長的引導RNA,這可能使它們能夠以前所未有的準確性靶向特定的基因序列。