-
一篇就夠了,帶你了解高通量測序!
發(fā)布時(shí)間: 2021-08-27 點(diǎn)擊次數(shù): 2356次說到近十年來發(fā)展最迅猛的生物技術(shù),首先想到了高通量測序,我們研究基因組學(xué)都離不開它。目前,高通量測序已經(jīng)深入到生命科學(xué)的各個(gè)領(lǐng)域,不僅有力地推動(dòng)了基礎(chǔ)研究的發(fā)展,也在逐漸征服臨床應(yīng)用。
所謂的高通量測序技術(shù),又名大規(guī)模平行測序,是將 DNA(或者 cDNA)隨機(jī)片段化、加接頭,制備測序文庫,通過對文庫中數(shù)以萬計(jì)的克隆(colony)進(jìn)行延伸反應(yīng),檢測對應(yīng)的信號,最終獲取序列信息。與 Sanger 法為代表的傳統(tǒng)測序法相比,高通量測序技術(shù)在處理大規(guī)模樣品時(shí)具有顯著的優(yōu)勢,又快(兩天)又多(數(shù)百萬克?。?,成為目前組學(xué)研究的主要技術(shù)。
當(dāng)前主要的測序技術(shù)平臺(tái),主要分為:
*solexa 測序技術(shù)(即大家耳熟能詳?shù)?illumina 測序平臺(tái));
*454 測序技術(shù)(讀長長,但是準(zhǔn)確度較低,成本較高,即焦磷酸測序技術(shù),少量市場占有);
*solid 測序技術(shù)(雙色編碼技術(shù),目前基本在市場上見不到了)。
那么高通量測序技術(shù)可以幫助我們做到什么呢?
首先是基因組層面的應(yīng)用。
對于疾病診斷領(lǐng)域,全基因組重測序技術(shù)是一種非常有力的手段。所謂的全基因組重測序,即對基因組序列已知物種的個(gè)體(比如人,小鼠等)進(jìn)行基因組測序,并進(jìn)行差異信息分析的方法。基于全基因組測序,可以快速的尋找到大量的遺傳差異,從而實(shí)現(xiàn)遺傳進(jìn)化分析及重要性狀候選基因的預(yù)測,找到大量的 SNP,InDel,結(jié)構(gòu)變異(SVs)等變異信息,從而獲取生物群體的遺傳特征。臨床上,常規(guī)的產(chǎn)前診斷技術(shù)是需要通過穿刺(絨毛穿刺、羊膜腔穿刺等)的方法取得胎兒的組織進(jìn)行遺傳學(xué)檢測,這可能導(dǎo)致一定的流產(chǎn)風(fēng)險(xiǎn)。而在 1997 年,Lo 團(tuán)隊(duì)[1]發(fā)現(xiàn)了孕婦外周血中存在有胎兒的游離 DNA,而高通量測序技術(shù)可以針對短序列 DNA 進(jìn)行精準(zhǔn)的測序。2010 年,Lo 團(tuán)隊(duì)借助測序技術(shù)完成了母血中胎兒的全部組基因組圖譜的繪制[2],證實(shí)了利用 cffDNA(cell free fetal DNA)進(jìn)行胎兒基因檢測是*可行的。
目前應(yīng)用高通量測序技術(shù)的三體綜合征產(chǎn)前基因診斷技術(shù)已經(jīng)開展臨床試點(diǎn)。
在動(dòng)物學(xué)研究方面,Xia 等人[3]運(yùn)用新一代測序技術(shù)對 29 種家蠶(Bombyx mori)和 11 種野 蠶(Bombyx mandarina)進(jìn)行了基因組重測序, 構(gòu)建了一個(gè)單堿基分辨率的家蠶遺傳變異圖譜. 每個(gè)個(gè)體測序約 3X, 覆蓋基因組序列的 99.88%, 鑒定出 1600 多萬個(gè) SNPs, InDels 和 SVs。 分析結(jié)果表明,馴化家蠶由野生蠶分化而來,且在馴養(yǎng)過程中,人為選擇優(yōu)良品種,性狀相 對單一。同時(shí),還發(fā)現(xiàn)了 354 個(gè)受到馴化和人工選擇壓力影響的蛋白編碼基因,主要參與調(diào)控蠶的絲蛋白合成,能量代謝,生殖特性和飛行能力。
一個(gè)人樣品的全基因組測序,目前的價(jià)格在 1.3 萬人民幣左右。然而大量的基因組區(qū)域是不編碼蛋白質(zhì)的,甚至對于特定疾病或者表型來說,參與調(diào)控的關(guān)鍵基因是已知的,所以研究者更關(guān)心的是某一個(gè)特定區(qū)域的表達(dá)情況。這時(shí)候,外顯子組和目標(biāo)區(qū)域測序就非常適合了。所謂的外顯子組(exome)是一個(gè)物種基因組中全部外顯子區(qū)域的總和,通過探針法捕獲基因組中全部外顯子序列,然后使用高通量測序技術(shù)對外顯子組測序,可以直接的發(fā)現(xiàn)與蛋白質(zhì)功能變異相關(guān)的遺傳突變。相對于全基因組測序,外顯子測序更加的經(jīng)濟(jì),只需 9000 人民幣。而對于感興趣的特定基因組區(qū)域,可以進(jìn)行目標(biāo)區(qū)域的深度測序。這就更便宜了,200 個(gè)擴(kuò)增子(產(chǎn)物長度<300bp),如果來自同一個(gè)模板,則只需 400 塊!
那么,除了以上介紹的兩種主流的基因組測序方法之外,還衍生出了其他的分析方法,比如簡化基因組測序,可以對重要的和復(fù)雜性高的 QTLS(quantitative trait loci,數(shù)量性狀位點(diǎn))精細(xì)定位。簡化代表文庫測序,對群體中不同基因型的個(gè)體采用相同的內(nèi)切酶酶切,回收相同大小范圍的酶切片段并測序,可以降低基因組分析的復(fù)雜性。酶切位點(diǎn)相關(guān) DNA 測序(RADseq)等一些新興的測序分析技術(shù)。
在基因組分析上更進(jìn)一步,我們會(huì)對基因表達(dá),可變剪切,基因結(jié)構(gòu)變化等內(nèi)容感興趣。所以我們需要使用到轉(zhuǎn)錄組測序,即 RNA-seq。即從總的 RNA 中富集出單鏈 mRNA,再反轉(zhuǎn)錄成雙鏈 cDNA,隨后進(jìn)行高通量測序,并與基因組 DNA 序列進(jìn)行比對。比如,Gruber 等[4] 對 14 例兒童非唐氏綜合征急性巨核細(xì)胞白血病患者進(jìn)行轉(zhuǎn)錄組測序,發(fā)現(xiàn)了一個(gè)隱匿的 16 號染色體倒位,inv(1 6)(P13.3 q24.3),形成 CBFA2T3 一 GLIS2 融合蛋白,CBFA2T3-GLIS2 在果蠅和鼠的造血細(xì)胞里的表達(dá)能夠誘導(dǎo)成骨蛋白信號系統(tǒng)的激活,從而促進(jìn)造血祖細(xì)胞的自我更新,研究結(jié)果表明 CBFA2T3-GLIS2 融合蛋白的表達(dá)可能促進(jìn)白血病的發(fā)生。Zhang 等人 [4]以水稻 9311 的愈傷組織、根尖、莖尖、葉、稻花/稻穗為材料, 進(jìn)行轉(zhuǎn)錄組測序, 展示了栽培水稻不同器官的轉(zhuǎn)錄組圖譜. 采用高通量雙末端測序, 檢測到了 7232 個(gè)新轉(zhuǎn)錄本, 這些轉(zhuǎn)錄本表達(dá)豐度低, 且具有組織特異性. 共發(fā)現(xiàn)了 23800 個(gè)可變剪接,說明轉(zhuǎn)錄融合事件比我們原來預(yù)想的要更加的常見。
通過 RNA-seq,還可以發(fā)現(xiàn)新的轉(zhuǎn)錄物。長鏈非編碼 RNA(lncRNA)是當(dāng)前研究的熱點(diǎn),其功能廣泛,涉及到個(gè)體發(fā)育、干細(xì)胞分化、細(xì)胞代謝、腫瘤發(fā)生發(fā)展等眾多方面。最早的大規(guī)模發(fā)掘 lncRNA 的工作是通過芯片完成的,但是后來人們發(fā)現(xiàn),高通量測序特別適合用于發(fā)掘新的 lncRNA。近年來,在人、小鼠、大鼠、果蠅、斑馬魚、豬等物種中,通過 RNA-seq, 發(fā)現(xiàn)了一大批的 lncRNA。進(jìn)一步研究證實(shí)有的 lncRNA 具有調(diào)控各種生物過程的能力。這方面的工作比較簡單,也形成了一定的套路,對于廣大的生命科學(xué)研究人員來說是較容易出成果的一個(gè)領(lǐng)域。
除 lncRNA 外,環(huán)狀 RNA(circular RNAs ,circRNAs)研究也是 RNA-seq 的一個(gè)重要應(yīng)用方向。circRNAs 是一類特殊的非編碼 RNA 分子,也是 RNA 領(lǐng)域最新的研究熱點(diǎn)。與傳統(tǒng)的線性 RNA (linear RNA,含 5’和 3’末端)不同,circRNA 分子呈封閉環(huán)狀結(jié)構(gòu),不受 RNA 外切酶影響,表達(dá)更穩(wěn)定,不易降解。有研究表明 circRNA 可能通過 miRNA-sponge 的方式來調(diào)控 miRNA 對靶基因的抑制作用,在某些疾病中具有重要意義。通過 RNA-seq,可以找到融合(fusion)的序列接口,從而發(fā)掘新的 circRNA。這項(xiàng)技術(shù)已經(jīng)得到了許多重要的應(yīng)用。
同時(shí),我們也常常用到 DGE(digital gene expression)技術(shù)。其基本原理是對 cDNA 進(jìn)行雙酶切,從而每一條 mRNA 都會(huì)得到一個(gè)對應(yīng)的標(biāo)簽,隨后進(jìn)行高通量測序,比較不同樣本之間各種標(biāo)簽的數(shù)目,從而找出差異化的標(biāo)簽,即差異化的 mRNA。
microRNA 測序也是目前常用的測序項(xiàng)目。microRNA 是一類內(nèi)源小分子 RNA,通常在轉(zhuǎn)錄后水平,負(fù)調(diào)節(jié)基因表達(dá)來發(fā)揮作用,控制了多種生物和代謝途徑中眾多基因的表達(dá),在生物生長和發(fā)育中扮演重要角色,目前 microRNA 測序技術(shù)普遍用于動(dòng)植物表觀遺傳學(xué)研究。
除以上介紹的測序技術(shù)之外,常用的測序技術(shù)還有:
MeDIP-Seq 技術(shù)(methylation DNA immunoprecipitationsequencing,甲基化 DNA 免疫共沉淀),是研究甲基化的一種有效的手段。由于在哺乳動(dòng)物中甲基化一般發(fā)生在 CpG 的胞嘧啶 5 位碳原子上,所以可通過特異性結(jié)合甲基化 DNA 的蛋白 MBD2b 或 5’-甲基胞嘧啶抗體富集高甲基化的 DNA 片段,并結(jié)合第二代高通量測序,對富集到的 DNA 片段進(jìn)行測序,從而檢測全基因組范圍內(nèi)的甲基化位點(diǎn)。
ChIP-seq,染色質(zhì)免疫共沉淀技術(shù),研究體內(nèi)蛋白與 DNA 相互作用的一種方法先通過 ChIP 特異性地富集與目的蛋白相結(jié)合的 DNA 片段, 而后對所得 DNA 片段進(jìn)行高通量測序。
總體來說,高通量測序技術(shù)的誕生可以說是基因組學(xué)研究領(lǐng)域一個(gè)具有里程碑意義的事件。該技術(shù)使得核酸測序的單堿基成本與第一代測序技術(shù)相比急劇下降。但是同時(shí)由于數(shù)據(jù)量的大幅度上升,全基因組測序臨床應(yīng)用的瓶頸在于信息的分析和解讀能力不足。如何更好的分析數(shù)據(jù),挖掘數(shù)據(jù),驗(yàn)證結(jié)果,隨之而來的生物信息學(xué)解決方案可以為基因組學(xué)研究帶來更大的機(jī)遇。
參考文獻(xiàn):
[1] Lo Y M, Corbetta N, Chamberlain P F, et al. Presence of fetal DNA in maternal plasma and serum[J] .Lancet, 1997,350(9076):485-487
[2] Lo Y M, Chan K C, Sun H, et al. Maternal plasma DNA sequencing reveals the genome-wide genetic and mutational profile of the fetus [J]. Sci Transl Med, 2010,2(61):61r-91r
[3] Xia Q, Guo Y, Zhang Z, et al. Complete resequencing of 40 genomes reveals domestication events and genes in silkworm (Bombyx). Science, 2009, 326: 433–436
[4]Gruber TA, Larson GedmanA, Zhang J, et al. An lnv(16)(p13,3q24.3)- encoded CBFA2T3-GLIS2 fusion protein defines an aggressive subtype of podiatric acute megakaryoblasticleukemia[J]. Cancer Cell, 2012, 22(5):683-697
-
血清系列
-
細(xì)胞轉(zhuǎn)染
-
支原體清除
-
細(xì)胞凍存
-
實(shí)驗(yàn)耗材
-
分子試劑
-
細(xì)胞增殖與凋亡
-
Biozellen系列
-
培養(yǎng)基
-
ELISA試劑盒
-
TOYOBO(東洋紡)
-
ZYMO RESEARCH
-
Greiner(格瑞納)
-
IKA(艾卡)
-
化學(xué)發(fā)光底物(ECL)
-
PROSPEC系列
-
Epigentek系列
-
微生物檢測
-
細(xì)胞生物學(xué)
-
Corning康寧
-
解離試劑
-
細(xì)胞類-實(shí)驗(yàn)耗材
-
原代細(xì)胞
-
植物檢測系列試劑盒
-
SERANA
-
細(xì)胞系
-
生化試劑盒
-
環(huán)境檢測系列試劑盒(AKEN)
-
類器官培養(yǎng)
-
緩沖器和解決方案
-
生物三凝膠基質(zhì)
-
細(xì)胞因子分子
-
生物樣本庫