SNP 在人類基因組中的發(fā)生頻率比較高,大約平均每1000個堿基對中就有一個多態(tài)位點(diǎn),估計(jì)其總數(shù)可達(dá)300萬個甚至更多[2]。當(dāng)SNP發(fā)生在基因編碼區(qū)或基因的調(diào)節(jié)區(qū)域時,它會對基因表達(dá)產(chǎn)生巨大的影響,從而影響基因的功能。有一些SNP位點(diǎn)已被證明在人類健康研究中非常重要,例如鐮狀細(xì)胞貧血、β地中海貧血和囊性纖維化的發(fā)生主要是由于SNP的出現(xiàn)。同時,研究人員發(fā)現(xiàn),SNP可能有助于預(yù)測個體對某些藥物的反應(yīng)、對毒素等環(huán)境因素的易感性以及罹患特定疾病的風(fēng)險。例如,攜帶有APOE(載脂蛋白)ε4突變的個體表現(xiàn)出患阿爾茨海默病的更高風(fēng)險[3,4](圖3)。

圖3 APOE4促進(jìn)病理性tau蛋白的再分配。
a:人源APOE敲入小鼠海馬體tau蛋白染色結(jié)果;b:Tau蛋白陽性區(qū)域占海馬體齒狀回部位的面積 (TE2:APOE2敲入小鼠, TE3: APOE3敲入小鼠, TE4: APOE4敲入小鼠, TEKO: ApoE敲除小鼠)[4]
全基因組范圍內(nèi)SNP關(guān)聯(lián)分析
隨著測序技術(shù)的發(fā)展,全基因組關(guān)聯(lián)分析(Genome-wide Association Study,GWAS)已廣泛應(yīng)用于復(fù)雜疾病的遺傳因素分析(圖4),可以更高效地獲得疾病與SNP之間的相關(guān)性。GWAS利用高通量測序技術(shù),分析數(shù)以萬計(jì)的SNPs以及這些SNPs與臨床表型和可測性狀的相關(guān)性,從而全面地揭示出不同復(fù)雜性狀的遺傳機(jī)制。目前,全世界范圍內(nèi)已開展了4000多項(xiàng)GWAS研究,發(fā)現(xiàn)了超過10萬個與各種疾病(如癌癥,高血壓,II型糖尿病,類風(fēng)濕性關(guān)節(jié)炎等)以及重要生理性狀關(guān)聯(lián)的基因位點(diǎn)。

圖4 GWAS分析人群中等位基因的變異頻率(https://www.ebi.ac.uk/)
完成了GWAS分析之后,我們還需要借助下游工具對GWAS的分析結(jié)果進(jìn)一步注釋和挖掘,篩選可能致病的SNP位點(diǎn)。相關(guān)的注釋網(wǎng)站和數(shù)據(jù)庫很多,以下推薦2個網(wǎng)站,供大家參考。GWAS4D是通過組織/細(xì)胞類型特異性和非編碼調(diào)控變異的優(yōu)先排序,來預(yù)測特定復(fù)雜疾病和性狀的潛在致病機(jī)制。我們將GWAS summary數(shù)據(jù)導(dǎo)入,便可以輸出SNP位點(diǎn)的優(yōu)先排序、SNP位點(diǎn)在基因組區(qū)域的可視化以及SNP功能預(yù)測和注釋等結(jié)果(圖7)。網(wǎng)址:http://mulinlab.tmu.edu.cn/gwas4d 。

圖5 GWAS4D可進(jìn)行分析的界面
SNPedia是一個SNP百科全書類網(wǎng)站,它引用已經(jīng)發(fā)布的文章或者數(shù)據(jù)庫信息,對SNP位點(diǎn)進(jìn)行描述,共享著人類基因組變異的信息。我們可以搜索某個SNP位點(diǎn)來尋找與之相關(guān)的信息,也可以根據(jù)相關(guān)疾病和癥狀來尋找相關(guān)的SNP(圖6)。網(wǎng)址:https://www.snpedia.com/index.php/SNPedia。
圖6 SNPedia首頁
受益于二代測序及GWAS的聯(lián)合應(yīng)用,研究人員發(fā)現(xiàn)了眾多和臨床表型具有一定聯(lián)系的SNP位點(diǎn),然而要驗(yàn)證這些位點(diǎn)與臨床表現(xiàn)的關(guān)系,必須回到體內(nèi)進(jìn)行研究。如果這些突變可以在小鼠體內(nèi)找到,那么突變小鼠就能為臨床研究提供寶貴的信息。因此構(gòu)建突變小鼠,是有效驗(yàn)證臨床檢測結(jié)果的關(guān)鍵一步。
構(gòu)建突變小鼠時,首先需要確定的是突變位點(diǎn)的人鼠同源性及保守性。小鼠是解析人類基因功能、研究人類疾病重要的模式生物。99%的人類基因都可以在其基因組中能找到相應(yīng)的基因。但需要注意的是,人鼠編碼基因序列相似性平均為85%,而非編碼基因的相似度只有50%[5],因此找到同源基因還需要判斷突變位點(diǎn)的序列保守性。
這里舉一個例子,PLD3的一個SNP(rs145999145)是遲發(fā)性阿爾茲海默癥的危險因素之一。我們在NCBI-SNP數(shù)據(jù)庫可搜索到該SNP的位點(diǎn)信息,如下:

圖7 rs145999145在NCBI數(shù)據(jù)庫中的信息頁
可見紅色框中提供了突變位點(diǎn)的序列信息,而綠色框中提示了突變類型是錯義突變(圖7)。根據(jù)該位點(diǎn)附近的側(cè)翼序列以及給到的基因組位點(diǎn),我們可以找到其在人源PLD3基因上的位置,轉(zhuǎn)錄本NM_012268.4,c.694 G>A,也即p.232V>M,位于exon9。通過對人鼠同源基因的同源性分析(圖8),可以很快找到相應(yīng)小鼠的突變位點(diǎn):NM_001317355.1,c.688 G>A,p.230V>M,位于exon10。

圖8 人鼠PLD3蛋白同源性對比結(jié)果
確定了小鼠的突變位點(diǎn)后,我們便可以針對該突變位點(diǎn)設(shè)計(jì)Guide RNA,利用Crispr/Cas9技術(shù)來構(gòu)建點(diǎn)突變小鼠(圖9)。

圖9 PLD3-V230M突變小鼠構(gòu)建策略
接下來和大家分享一個案例來具體說明如何利用基因修飾小鼠驗(yàn)證SNP的臨床表型。
【標(biāo)題】自身免疫疾病相關(guān)IgG1變體調(diào)控B淋巴細(xì)胞活化和分化的新機(jī)制
【期刊】Science (IF=41)

系統(tǒng)性紅斑狼瘡SLE是最常見的自身免疫疾病之一,是一種由遺傳、環(huán)境、免疫等多種因素導(dǎo)致的復(fù)雜性疾病。其發(fā)病機(jī)制至今尚不清楚,導(dǎo)致治療手段有限且無法根治。人體中廣泛存在具有自身反應(yīng)性的IgG型記憶性B細(xì)胞,SLE等自身免疫疾病常伴隨大量自身抗體的產(chǎn)生。
研究人員猜想IgG型B細(xì)胞受體(IgG-BCR)的異常活化可能參與到SLE的發(fā)病過程。通過對患者進(jìn)行基因檢測,研究人員發(fā)現(xiàn),IgG1重鏈基因IGHG1上的SNP(rs117518546)在SLE患者中顯著增加,該SNP導(dǎo)致IgG1第396位甘氨酸突變?yōu)榫彼幔↖gG1-G396R)(圖9)。攜帶該SNP的SLE患者產(chǎn)生更多更廣泛的IgG1型的自身抗體,發(fā)生炎癥反應(yīng)的風(fēng)險增加,疾病活動指數(shù)也更高,揭示該SNP為新的SLE易感基因位點(diǎn)。

圖10 rs117518546突變位點(diǎn)(圖A)及在不同地區(qū)人群中的比例(圖B)
值得注意的是,該SNP在東亞人群中的出現(xiàn)的頻率遠(yuǎn)高于歐美人群(圖10),這提示該SNP是以漢族為代表的東亞人群特有的SLE易感基因位點(diǎn),可能是我國SLE患者與其他人群患者的臨床表現(xiàn)和治療反應(yīng)存在差異的因素之一。
通過同源性對比,研究者發(fā)現(xiàn)該SNP在小鼠上的位點(diǎn)為390位甘氨酸突變?yōu)榫彼幔虼藰?gòu)建了IgG1-G390R突變小鼠(圖11)。通過誘導(dǎo)野生型小鼠和突變小鼠發(fā)生自身免疫疾病,研究者發(fā)現(xiàn)攜帶該SNP的小鼠產(chǎn)生更多、更廣泛的自身抗體,而這依賴于B細(xì)胞受抗原刺激后大量自身反應(yīng)性漿細(xì)胞的分化(圖12)。這一結(jié)果驗(yàn)證了在SLE患者中的發(fā)現(xiàn),并從B細(xì)胞命運(yùn)決定層面給出了初步解釋[6]。

圖11 構(gòu)建IgG1-G390R敲入小鼠

圖12誘導(dǎo)自身免疫病發(fā)生后,野生型小鼠和G390R小鼠體內(nèi)dsDNA和SmD抗體動態(tài)變化。
該研究從疾病易感基因位點(diǎn)的臨床遺傳學(xué)研究出發(fā),經(jīng)過基于基因修飾小鼠的動物模型研究,將臨床上發(fā)現(xiàn)的問題在真實(shí)的體內(nèi)實(shí)驗(yàn)中驗(yàn)證,確認(rèn)了IgG1-G396R在SLE疾病發(fā)生發(fā)展中的作用。這項(xiàng)研究為SLE研究提供了全新的研究靶點(diǎn),也為復(fù)雜疾病相關(guān)易感基因位點(diǎn)的研究提供了創(chuàng)新性的研究模式,最終發(fā)表在《Science》雜志上。
南模生物深耕基因修飾動物模型行業(yè)二十余年,在構(gòu)建類人SNP同源突變小鼠方面具有豐富的經(jīng)驗(yàn),助力客戶發(fā)表在《Cell Research》、《Immunity》等多種高水平雜志上,受到廣泛認(rèn)可。歡迎大家咨詢,快來定制專屬您的點(diǎn)突變小鼠吧。
參考文獻(xiàn):
[1]楊煥明. 人類基因組計(jì)劃及其意義——規(guī)模化、序列化、信息化與產(chǎn)業(yè)化、醫(yī)學(xué)化、人文化[J]. 科技與法律, 2000(3):2.
[2] Altshuler D, Pollara VJ, Cowles CR. An SNP map of the human genome generated by reduced representation shotgun sequencing. Nature. 2000 Sep 28;407(6803):513-6.
[3] https://www.snpedia.com/index.php/APOE-%CE%B54
[4] Shi Y, Yamada K, Liddelow SA, et al. ApoE4 markedly exacerbates tau-mediated neurodegeneration in a mouse model of tauopathy. Nature. 2017 Sep 28;549(7673):523-527. doi: 10.1038/nature24016
[5] https://www.nih.gov/news-events/news-releases/new-comprehensive-view-mouse-genome-finds-many-similarities-striking-differences-human-genome
[6] Chen X, Sun X, Yang W, et al. An autoimmune disease variant of IgG1 modulates B cell activation and differentiation. Science. 2018 Nov 9;362(6415):700-705. doi: 10.1126/science.aap9310.