高通量測序技術(High-throughput sequencing)又稱“下一代”測序(next generation sequencing,NGS)技術、大規(guī)模平行測序或深度測序技術,以能一次并行對幾十萬到幾百萬條DNA分子進行序列測定和一般讀長較短等為標志。包括第二代測序技術、第三代測序技術和第四代測序技術。
第二代測序技術
第二代測序技術的核心原理是邊合成邊測序,其與第一代測序技術(Sanger法)相比,具有通量提高、成本降低、周期縮短,敏感性提高、讀長變短等特點。目前具代表性的第二代測序平臺主要有來自Roche公司的454法、Illumina公司的Solexa法和ABI公司的SOLiD法。
Roche 454法
Roche 454(GS-FLX)是一種基于微乳液PCR(Emulsion PCR)和焦磷酸測序技術的測序平臺。其測序原理是:在DNA聚合酶、ATP硫酸化酶、熒光素酶和雙磷酸酶的協(xié)同作用下,GS-FLX系統(tǒng)將引物上每一個dNTP的聚合與一次化學發(fā)光信號的釋放偶聯(lián)起來,通過檢測化學發(fā)光信號的有無和強度,達到實時檢測DNA序列的目的。
測序流程:
- 文庫制備:將基因組DNA/cDNA打斷成300-800bp長的片段,經(jīng)末端修復與特異性接頭連接修飾后,變性處理,回收單鏈DNA(ssDNA)。
- Emulsion PCR:ssDNA與水油包被的磁珠在一起孵育,退火,接頭使成百上千條ssDNA分別結合到磁珠上(磁珠表面含有與接頭互補的寡聚核苷酸序列)(一個DNA片段=一個磁珠),擴增試劑使磁珠乳化,形成油包水的混合物,每個DNA片段在這個混合小滴里進行獨立的擴增,從而實現(xiàn)所有DNA片段的平行擴增(emPCR)。
- 焦磷酸測序:經(jīng)過emPCR擴增后,每個DNA片段將被擴增大約100萬倍,預先用Bacillus stearothermophilus聚合酶和單鏈結合蛋白處理帶有DNA片段的磁珠,然后將磁珠被放入Pico Titer Plate板中供(焦磷酸)測序反應使用。
優(yōu)點:
讀取序列長(400 bp);短耗時;可進行從頭測序(de novo sequence)。
缺點:
焦磷酸測序試劑成本相對較高;樣本制備相對較復雜;無法判斷重復堿基個數(shù)。
Solexa法
Illumina公司的Solexa/Hiseq技術是目前應用最廣泛的二代測序平臺。這兩項技術,都是是基于橋式PCR和熒光可逆終止子的邊合成邊測序(SBS),其測序原理是:可逆終止化學反應,下面介紹了Solexa技術。
測序流程:
- 待測DNA文庫的構建:將待測序列打斷成200-500bp(或更短)的小片段,兩頭用酶補平后,在小片段兩端加上不同的接頭(adapter),連接載體,構建ssDNA文庫。
- DNA與流動槽(Flow Cell)的附著:Flow Cell是一種含有8條lane的芯片,每條lane的表面固定有很多(P5’/P7)接頭(引物)。測序時利用微注射系統(tǒng)將已經(jīng)加過(P5/P7)接頭的ssDNA片段隨機添加到Flow Cell內(nèi),ssDNA片段的P5接頭序列與芯片表面的P5’引物互補,一端被“固定”在芯片上。
- 橋式PCR(Bridge PCR)向Flow Cell中添加未標記的dNTP和聚合酶,以ssDNA片段為模板合成出一條全新的DNA鏈(P5’-P7’互補鏈),然后再加入NaOH溶液,使DNA雙鏈解鏈,由于模板鏈沒有結合在lane上,模板鏈會被溶液流洗脫,但互補鏈仍固定在lane上。加入中性緩沖溶液,環(huán)境變成中性后,互補鏈的P7’與lane上P7接頭互補雜交,形成橋型ssDNA,接下來加入dNTP和聚合酶,聚合酶就沿著P7接頭合成出一條新的鏈(橋型ssDNA擴增為橋型dsDNA)。再加入NaOH堿溶液,使DNA雙鏈解鏈,然后再加中和液,繼續(xù)擴增,經(jīng)過不斷的擴增和變性循環(huán)(大約35個循環(huán))后,最終每種ssDNA都將在各自的位置上集中成束(cluster),每一束都含有單個DNA模板的500-1000個拷貝,從而達到測序所需信號強度的模板量。
- 橋式PCR完成之后,再次強堿解鏈,采用一種酶–甲酰胺基嘧啶糖苷酶(Fpg)選擇性的切掉lane上p5‘ 連接的鏈,只留下了與lane p7連接的鏈–Forward Strand。同時。添加ddNTP阻斷延伸。形成cluster測序單元,可直接用于邊合成邊測序反應。
- 測序:向反應體系中添加DNA聚合酶、接頭引物和帶有熒光標記的4種dNTP(可逆終止子:dNTP的3‘羥基被疊氮基團替代,只容許每次添加一個dNTP)。dNTP被添加到合成鏈上之后,將剩余游離dNTP和DNA聚合酶洗脫。然后加入激發(fā)熒光所需的緩沖液,用激光激發(fā)熒光信號,光學設備記錄熒光信號,計算機分析并將其轉化為測序結果。再加入化學試劑猝滅熒光信號,并使dNTP的3’疊氮基團變成羥基,繼續(xù)進行下一輪測序反應。
優(yōu)點:
高度自動化系統(tǒng);讀取片段多;適合大量小片段的測序(microRNA、lncRNA等);高性價比。
缺點:
讀取序列較短;不適于de novo sequence。
SOLiD法
寡聚物連接檢測測序(supported oligo ligation detetion,SOLiD)法是利用DNA連接酶在連接過程中進行測序,其技術核心是:4種熒光標記寡核苷酸的連接反應。
測序流程:
- DNA文庫的構建:將基因組DNA/cDNA進行片段打斷,并在片段兩端加上測序接頭,連接載體,構建ssDNA文庫。
- Emulsion PCR:與454技術的Emulsion PCR類似,但磁珠比454小很多,只有1μm。將帶接頭的ssDNA固定在磁珠表面,進行PCR擴增,在擴增的同時對擴增產(chǎn)物進行3’端修飾,3’修飾的磁珠會被沉積在上樣玻片(Slide)上,在上樣過程中沉積小室將每張玻片分成1、2或8個測序區(qū)域。
- 連接酶測序:向體系中加入DNA連接酶、通用測序引物n和反應底物-8堿基單鏈熒光探針混合物(3’-XXnnnzzz-5’結構)。探針的5’末端分別標記了CY5、CY3、Texas Red、6-FAM四種顏色的熒光。在這個探針中,第1和第二位(XX)上的堿基是確定的,根據(jù)種類的不同在第6-8位(zzz)上添加了不同的熒光標記。這種由兩個堿基確定一個熒光信號的測序方法被稱為兩堿基測序。當熒光探針與DNA模板鏈配對而連接時,會發(fā)生代表1,2位堿基的熒光信號。記錄下熒光信號后,通過化學方法在第5和第6位堿基之間進行切割,移除熒光信號,以進行下一個位置的測序。通過這種方法,每次測序的位置都相差5位,即第一次測序的位置是第1、2位,第二次測序的位置是第6、7位……在測到末尾后,將新合成的鏈變性,洗脫。然后用通用引物n-1(在引物n的基礎上將測序位置往3’端移動一個堿基,能測定第0、1位和第5、6位)進行第二輪測序。以此類推,再加入n-2、n-3、n-4進行測序,這樣可以完成全部位置的堿基測序,并且每個位置的堿基均被檢測了2次。
優(yōu)點:
高通量;高準確度;可分割測序區(qū)域;系統(tǒng)靈活可以進行樣本的pooling。
缺點:
讀取長度受連接反應限制;一旦在熒光解碼階段發(fā)生錯誤就容易產(chǎn)生連鎖的解碼錯誤。
第三代測序技術
第三代測序技術的顯著特點是單分子測序,測序過程無需進行PCR擴增,直接進行邊合成邊測序。該技術有兩點是二代測序不具備的:一是直接測RNA的序列,第二個是直接測甲基化的DNA序列。目前具有代表性的第三代測序平臺有美國Helicos Biosciences公司的HeliScope單分子熒光可逆終止技術和Pacific Biosciences公司的單分子實時(single molecule real time,SMAT)測序技術。二者均利用熒光信號進行測序。
HeliScope單分子熒光可逆終止技術
HeliScope單分子熒光可逆終止技術是基于邊合成邊測序的思想,測序過程無需對模板進行擴增,測序原理是:將DNA片段隨機打斷成小片段分別進行dNTP熒光標記,經(jīng)過不斷地重復合成、洗脫、成像、猝滅過程完成測序。
測序流程:
- 將待測序列隨機打斷成小分子DNA片段,在3’末端加上poly(A),并在poly(A)的末端進行熒光標記和阻斷。
- 將待測模板固定到芯片上(通過poly-A尾與固定在芯片上的poly-T雜交),制成測序芯片。
- 加入DNA聚合酶和被Cy3熒光標記的脫氧核苷酸進行DNA合成,每一輪反應只加入一種dNTP,然后將未參與合成的DNA聚合酶和dNTP洗脫。
- 采集Cy3熒光信號,然后切除熒光標記基團,加入下一種dNTP和DNA聚合酶的混合物,進行下一輪測序反應,如此反復,最終獲得完整的序列信息。
優(yōu)點:
高通量;避免PCR擴增引入錯誤,提高準確率。
缺點:
讀長短;測序成本較高;單讀長的錯誤率偏高,需重復測序以糾正錯誤;儀器非常昂貴。
SMRT
SMRT也是基于邊合成邊測序的思想,該技術以SMRT芯片(一種帶有很多零模波導(Zero-Mode Waveguide,ZMW)孔(納米級)的金屬片)為測序載體。其基本測序原理是:不同熒光標記的4種dNTP,在堿基配對階段,隨堿基加入的不同,會發(fā)出不同熒光,根據(jù)光的波長與峰值可判斷堿基類型。
測序流程:
- 將DNA聚合酶、待測序序列和被不同熒光標記的dNTP(標記的是磷酸基團而不是堿基)放入ZMW進行合成反應,由于ZMW孔外徑僅100多納米(比檢測激光波長?。す鈴牡撞看蛳氯ズ蟛荒艽┩感】?,進入上方溶液區(qū),能量均被限制在一個小范圍里,正好能夠覆蓋需要檢測的部分,從而使信號均來自于反應區(qū)域。而孔外未參與合成的dNTP由于未進入檢測區(qū),則不會發(fā)出熒光。
- 當一個被熒光標記的dNTP被加入到合成鏈上的同時,會進入ZMW孔的信號檢測區(qū),在激光束的激發(fā)下發(fā)出熒光,根據(jù)熒光種類可判斷dNTP種類。
- 在熒光脈沖結束后,被標記的磷酸基團被切割并釋放,聚合酶轉移到下一個位置,下一個dNTP連接到位點上開始釋放熒光脈沖,繼續(xù)進行下一個循環(huán)。
優(yōu)點:
測序速度快,每秒約10個dNTP;讀長可達幾千個堿基;不需要擴增,原始DNA不被破壞。
缺點:
儀器昂貴,測序成本較高;單讀長的錯誤率偏高;DNA聚合酶在陣列中降解。
第四代測序技術
第四代測序技術又稱“納米孔測序技術”,是近幾年興起的新一代測序技術。另外納米孔測序在國外也被歸納為第三代測序技術。目前市場上廣泛接受的納米孔測序平臺是英國Oxford Nanopore Technologies(ONT)公司的單分子納米孔測序技術(Nanopore sequencing)。
nanopore sequencing
nanopore sequencing是一種基于電信號測序的技術。其測序原理為:當DNA分子在通過納米孔道時,會對通過納米孔的電流或橫穿過納米孔的電流產(chǎn)生影響。不同堿基通過時,對電流產(chǎn)生的影響不同。利用這種差異,nanopore sequencing就可以識別基因中堿基(對)的排列順序。
- 獨特特點:能夠直接讀取甲基化的胞嘧啶。
測序流程:
- α-溶血素為材料構建生物納米孔,孔內(nèi)共價結合有分子接頭——環(huán)糊精,孔外一側吸附有核酸外切酶。
- 將該系統(tǒng)鑲嵌在一個脂雙分子層內(nèi),為了提供既符合堿基檢測又滿足外切酶活性的物理條件,脂雙分子層兩側應分別設定為不同鹽濃度。
- 在適合的電壓下,用核酸外切酶切割ssDNA,被切割下來的單個堿基落入納米孔,并和孔內(nèi)的環(huán)糊精相互作用,短暫地影響流過納米孔的電流強度,每個堿基均因其產(chǎn)生特有的電流干擾振幅而能夠被區(qū)分。
- 堿基在納米孔內(nèi)的停留時間是毫秒級的,其解離速率常數(shù)與電壓有關,180mV的電壓即可保證在電信號記錄后將堿基從納米孔中清除。
優(yōu)點:
測序讀長長(超過150kb);測序速度快;測序數(shù)據(jù)實時監(jiān)控;機器方便攜帶等。
缺點:
采用水解測序法,不能進行重復測序;切斷的核苷酸可能被讀錯方向;難于生產(chǎn)出帶多重平行孔的裝置,通量較小。
高通量測序技術的應用
- 轉錄組測序:研究細胞表現(xiàn)和功能
- 甲基化測序:表觀遺傳學標記信息
- 外顯子組測序:研究定向富集的DNA
- 染色質(zhì)免疫沉淀-深度測序(ChIP-seq)
- 基因組測序等。