3.5 片段純化
經酶解和化學裂解得到的基因片段(見 10.3.3 ) 即可通過硅膠樹脂直接從切割反應液中純化(見 10.3. 5.1),也可通過制備型尿素變性聚丙烯酰胺凝膠電泳純化(見 10.3.5.2) 。
最初我們認為如想得到特定大小的片段必須通過凝膠電泳來純化,以確保在重組裝反應中沒有較長片段甚或全長片段的參雜,以免影響碰撞概率。而實際上,如不經多輪的重組裝反應,就無法從純化的片段中直接擴增出全長產物,這表明切割反應進行的十分徹底(見 10.3.7) 。因此,只有對片段大小范圍有十分嚴格的要求時才有必要 使用凝膠電泳純化。
3.5.1 哌啶切割后直接純化
( 1 ) 最簡便的片段純化方法就是使用 Qiaex II 試劑盒(Qiagen) 從哌啶切割后的反應液中直接純化(見 10.3.3)。依據該試劑盒指南進行操作(見注 14),加入結合緩沖液后中和(約 20 μl 3 mol/L 乙酸緩沖液)。
( 2 ) 清洗兩次后,分兩步加入 25 μl 洗脫緩沖液洗脫。將兩次洗脫液混合。
( 3 ) 離心兩次,每次換一個干凈的離心管(見注 15)。
3.5.2 尿素變性聚丙烯酰胺凝肢電泳純化
注意此步為可選步驟。嘗試了兩種方法從凝膠中回收片段。一種是經典的水提取后乙酸/鎂離子沉淀法,另一種是使用 Qiagen 公司的 Qiaex II 試劑盒。但通過染色檢測提取完基因后的凝膠,發現兩者都存在提取不完全的問題。
( 1 ) 經制備型尿素變性聚丙烯酰胺凝膠電泳后(見 10.3.4,步驟 1 ) ,在低強度紫外燈照射下將目標大小的條帶切割下來(圖 10.2B)。放入離心管中充分搗碎后加入提取緩沖液(QiaexII 提取,步驟 2 ) 或 1 ml 水(水提取,步驟 3 ),放入熱混合器(Eppendorf ) 中以 37°C,1000 r/min 過夜孵育。
( 2 ) 如果使用 QiaexII 提取緩沖液提取,見 10.3.5.1 節。
( 3 ) 如使用水提取,加 1/10 體積的乙酸緩沖液,1/100 體積的氯化鎂和 1 體積的異丙醇沉淀 DNA;-20°C 反應 1 h;4°C 20000 g 離心 15 min;將沉淀重懸在 50 μl 90% 乙醇中,放入熱混合器中 37°C,1000 r/min 反應 1 h;-20°C 放置 1 h;4°C 20000 g 離心 15 mm;將沉淀在空氣中晾干后,加入 30 μl 加入洗脫緩沖液,37°C,1000 r/min 孵育 1 h。
為得到膠提取步驟的交叉率,我們設計了 3 個母本克隆(CAT_Nd10 突變體)的混編檢測實驗。其中兩個克隆在 100 bp 范圍內包含 1 個特異的突變,另一個在 100 bp 范圍內包含 2 個特異突變。混編并經 Tag 酶擴增后挑選 8 個克隆測序,結果表明其中的 6 個克隆在 100 bp 范圍內有一個交叉。這與直接快速純化得到的交叉率可比 ( 見 10.3. 5.1 和 10.3.8 )。實驗共測序了 3851 個堿基,發現了 12 處錯誤,突變率為 0.31%。這樣的錯誤率比快速純化的錯誤率高很多,可能是由于 UV 照射(哪怕是弱的 366 nm 的光源)或是凝膠中的化學修飾引起的。因此我們在最終的 NExT DNA 混編方法中,去掉了凝膠純化的步驟,因為額外的工作并未帶來益處,反而損失了產量,提高了錯誤率。
3.6 純化片段的定量
為了分析和比較純化得到的 DNA 的產量,我們首先使用 SYBR Greenn 試劑來定量。因為 NExT DNA 混編方法的重復率很髙,我們只定量一次即可(見注 16 )。通常我們都能獲得濃度為 40~60 ng/μl 的 DNA 片段。
( 1 ) 取 2 μl 純化的 DNA 片段(見 10.3.4),加入 50 μl 1 : 5000 稀釋的 SYBR GreenII 溶液染色,此染色液對單鏈 DNA 非常敏感(見注 17) 。
( 2 ) 在暗箱中反應 5 min 后檢測熒光信號(我們使用 96 孔的 Perkin Elmer LS 50B 熒光粉光光度計;見注 18)。染料的激發波長是 480 nm,可在 515 nm 檢測發射值。
( 3 ) 使用片段大小范圍內的標準寡核苷酸,稀釋不同的倍數繪制濃度標準曲線,標定片段所含 DNA 的濃度。
3.7 基因重組裝和擴增
通過內部引物延伸反應從純化的基因片段重組得到全長基因(見 10.3. 5),其 間不斷提高退火溫度并最好使用具有校正功能的 DNA 聚合酶,如 Vent ( 圖 10.3)。在內部引物延伸 PCR 過程中,片段之間可相互作為引物,因此每個循環反應后都會加長,直到最終得到全長基因。最后,通過常規 PCR 反應,加入兩個末端引物對組裝反應的產物進行擴增,構建克隆送測序。在方法建立過程中,通過瓊脂糖凝膠電泳不斷檢測重組裝反應結果(圖 10.3 )。重組裝反應在進行若干輪后停止,所得產物在此基礎上進行 PCR 擴增。最后一步反應的基本原理與其他的基因組裝進程相同,但有很重要的改變。盡管經歷了劇烈的化學切割條件,使用了高保真 DNA 聚合酶的組裝反應仍很高效。
( 1 ) 取出約 2 μg 的純化 DNA 片段(見 10.3.5 ) 進行重組裝。事實上如使用 Vent 聚合酶,少于 1 μg 的 DNA 片段都夠用。通常我們都使用 20~25 μl 的片段溶液,無須檢測濃度。
( 2 ) 在 DNA 片段中加入 4 μl ( 見注 19 ) 10 mmol/L 的 dATP、dTTP、d CTP 和 dGTP 的混合物(終濃度 800 μmol/L ) ,以及 4 U Vent DNA 聚合酶(NEB),1~4 μl 25 mmol/L 的硫酸鎂,5 μl 的 10X 反應緩沖液,加水定溶至 50 μl 。
( 3 ) 循環反應為 94°C 3 min;92°C 變性 30s,30°C 退火 60s,每輪增加 1°C ( 冷卻率 1°C/s),72°C 延伸 1 min,每輪多加 4s,共進 36 個循環;最終 72°C 再延伸 3 min。
( 4 ) 取重組裝產物 10 μl ( 見注 20 ) 使用基因的合適引物(25 pmol 引物,0.2 mmo/L dNTP,25 個循環,40s 的延伸時間),進行常規 PCR 反應。
( 5 ) 使用適當的限制性酶切位點將擴增的基因克隆到載體上。
據我們所知,大多數已發表的片段重組裝過程都使用 Taq 酶。Vent DNA 聚合酶的 3'→5' 校對核酸外切酶活性是基于其僅在 3' 端移除合成鏈上錯配的核苷酸,直到聚合反應可以從退火的末端開始。這意味著核苷酸鏈上的點突變,即便是緊鄰 3' 端的位置,都不會有問題 [19] 。為了比較這兩種聚合酶的作用,分別使用 Tag 和 Vent 酶平行進行兩組重組裝實驗,均使用相同的片段庫作為起始。適量的重組裝產物作為擴增 PCR 的模板,當使用 Taq 酶時,產物經瓊脂糖凝膠電泳只有一條帶,然后通過圖像分析定量。結果,使用 Vent 酶的得到 DNA 產量為 Taq 酶的 35 倍。有意思的是,將使用 Tag 酶得到的 6988 個堿基測序,發現只有 5 個額外的突變(0.075% ) 。因此,在現有序列的統計誤差內,使用 Tag 和 Vent 酶進行 NExT DNA 混編產生的錯誤率基本是相同的(見 10.3.8 )。關于兩者產量的顯著差別,可用校正酶的性質來解釋。以 Vent 酶為例,該酶具有鏈置換活性 [ 20 ] ,這可能會幫助許多雜交反應的進行,另外 Vent 酶在 95°C 的半衰期約為 8 h,相對于 Tag 酶的 1.6 h [ 20 ] ,更適合長時間的重組裝反應。另外,Taq 酶習慣在 3' 端多加額外的 dATP [21] ,這也是妨礙重組裝反應進行的可能原因。除了上述因素,還發現 Tag 酶雖然適合片段的重組裝反應,但其重組裝的產物作為下一步擴增反應的模板,很難使用具有校正功能的 DNA 聚合酶進行擴增。
3.8 交叉率、片段的平均長度及突變率分析
將上面描述的 NExT DNA 混編技術應用在 600 bp 長的 CAT 基因的定向進化研究中,其中 N 端和 C 端分別截短 10 個和 9 個氨基酸殘基(CAT_Nd10_Cd 9 ) 。實驗中,挑選 12~383 堿基間具有不同突變模式的 5 個克隆與一個用于回交的截短野生型克隆相混合作為固定庫,進行 33.3% 尿苷酸交換 PCR 來混編。從溶液中直接純化片 段(見 10. 3.5.1 ) ,再經 Vent 聚合酶進行重組裝反應(見 10.3.7 節)。在沒有抗性選擇壓力的對照平板中挑選 8 個混編克隆進行測序(圖 10.4A ) 。這些克隆獨特的突變模式顯示所有被檢測的克隆都是從 2 ( 如克隆 1 ) ~4 個(如克隆 4 ) 母本克隆演化來的。在所涉及的 372 bp 的片段中,每 93~186 bp 就有一個交叉,平均片段長度為 114 bp。
通過測序結果計算突變率。在所測的 4425 個堿基中,發現了 4 個突變(一個 A 變為 G,一個 T 變為 C,1 bp 的插入和 1 bp 的缺失),計算突變率為 0.09%。這比之前報道的 DNA 酶混編的錯誤率 0.7% 要低得多。如 10.3.7 節中所述,并不是只有 Vent 聚合酶才能達到如此低的突變率。因為我們得到的片段大小分布和交叉率均與 DNA 酶混編的實驗結果相當,因此分析前面報道的高錯誤率可能是由 DNA 酶解及凝膠觀測時的紫外損傷引起的,而與片段大小和聚合酶種類無關。低突變率對長片段 DNA 的混編尤為重要,因為我們要盡可能地避免將功能異常的或不需要的分子引入基因庫中。
進一步的實驗中,挑選 4 個截短 CAT 基因(CAT_ Cd26 ) 母本進行了上述相同的混編實驗,它們均包含一個突變,分布在 9~575 堿基,最終挑選 5 個克隆測序(圖 10. 4B)。可檢測的片段平均長度為 86 bp,其中包括許多短的片段。在 “對照 5”克隆中,突變位置分別相隔僅 6 個堿基(324 和 330 位置),12 個堿基(364 和 376 位置) 及 11 個堿基(404 和 415 位置)的突變體都被分開。這次實驗得到片段的平均長度比之前的實驗要小,這是因為更多的突變利于片段長度的檢測。至于許多短片段的獲得可能原因有兩點:使用的 QiaexII 試劑盒可高效的回收短片段 DNA,或者基因擴增時的交叉是一個復雜的過程,包含如 PCR 基礎上的鏈交換。
3.9 NEXT 片段斷裂—預測程序
因為 dUTP 的摻入及產生的片段斷裂都基于可推導的原則,我們開發了名為 NExTProg 的計算程序。該程序可預測雙鏈 DNA 的 NExT 斷裂模式,使得研究人員不需要實驗就可設計合適的 dUTP: dTTP 比率。該程序通過讀入 DNA 序列文件和 dUTP: dTTP 比值,就可算出所有可能的片段、它們出現的可能性及相對分布。給定 DNA 的互補鏈由程序自動生成并加入計算。計算后的結果以柱型統計圖表形式顯示,所有數據都可以列表形式輸出以備使用(圖 10. 5A ) 。當需要設定片段大小的上下限時(如凝膠純化所需),程序可計算材料損失的可能性并調整每個片段的相對分布值。


3.9.1 數學原理
( 1 ) 設定給定 DNA 序列中的一個胸腺嘧啶被尿嘧啶替代的概率為 p。
( 2 ) 當兩個胸腺嘧啶都被尿嘧啶替代時,就生成兩者之間的片段,其概率為 p X p。
( 3 ) 只有當上述兩個胸腺嘧啶間的 n 個胸腺嘧啶都不被替代時,片段才能存在,得到的概率為 p X p X ( 1-p)n。
( 4 ) 對于包含 1 個或 2 個 DNA 末端的片段,p X p 概率中的 1 個或 2 個 p 設為 1 ( 見注21)。
( 5 ) 為比較斷裂結果,我們定義片段概率為除以所有值的和。
我們的計算方法與先前的計算都不同 [23],因為我們考慮到片段的兩個末端都需要產生,但不考慮諸如序列偏倚性和不確定的酶解條件等問題,這些會嚴重阻礙對 DNA 酶酶解的計算。
對于包含 x 個尿苷酸的基因,最多可產生可能片段 [ 根據高斯定理,當 x 為奇數時,等于( x + 1 ) X (x + 2 ) / 2;見注 22 ]。因此,對于一個典型的包含 250 個胸腺嘧啶和 240 個腺嘌呤(在互補鏈中也計算為胸腺嘧啶)1000 bp 長的基因,很快程序計算產生 31626 + 29161 = 60787 個片段,包括它們的概率和序列。
因為大多數用戶可能都對結果概貌感興趣,該程序將所有具有相同大小的片段匯集在一起,將它們的概率加和,給出占所有概率加和的百分比對長度的分布,在程序中以 “%mol ”表示。為了將電泳條帶可視化,通過某一片段的概率乘以其長度計算 “mass”分布。這些值被均一化,代表堿基比率,定義為 “ mass”,如在堿基對中固定長度,程序中顯示為“ %mass ”。片段序列的輸出文件按出現可能性由大到小列出了所有的片段。同樣的序列只列出一次,概率為它們的加和。
3.9.2 程序的校準及與實驗結果的對比
在比較測量和計算的結果之前,有一個非常重要的值要考慮:就是交換 PCR 時聚合酶摻入尿苷酸對胸苷酸的比率。這個值可能不僅取決于 dUTP : dTTP 的值,也取決于使用的聚合酶類型、核苷酸的絕對濃度以及使用的緩沖液。因此當使用程序時,需要設定該值。尿苷酸的摻入量可用下列方法測量:直接的方法是通過放射性標記的 dUTP,計算 PCR 產物的放射能;間接的方法是定量分析斷裂圖譜。我們選擇后者,因為它同時提供了與我們的軟件相似的基本原則。但需要注意這種對資料的雙重利用只有在斷裂完全的情況下才有效。
為定量分析裂解實驗,我們使用常用的條件(標準 Tag 聚合酶 [ 24 ] ,200 μmol/L dNTPs)。
( 1 ) 在尿苷酸交換 PCR 反應中(見 10.3.2,見注 2 ) ,使用 32P-dCTP 標記的 DNA。
( 2 ) 進行變性聚丙烯酰胺凝膠電泳(見 10.3.4 ) 。
( 3 ) 通過成像儀對凝膠進行放射能成像(見注 23)。這避免了因小片段的低效染色造成的信號變形。
( 4 ) 將每條帶都通過圖像分析軟件,如 QuantityOne ( BioRad ) 或 NIH Image/Scion Image/imagej ) 生成線密度曲線。
( 5 ) 從線密度曲線中計算出片段和放射標記的分子質量標準的相對遷移值。
( 6 ) 將代表標記物相對距離和長度的可變參數 a 和 b 代入方程:相對距離 = a X In (堿基對長度)+ b 。
( 7 ) 用上述公式將片段的相對距離值換算為核苷酸長度。
( 8 ) 通過結合整數的核苷酸長度值和將相應的強度信號平均化,將強度信號/連續長度分布轉換為強度信號/整數(只列出分散的寡核苷酸長度)。
( 9 ) 通過將每個單獨的強度除以強度總和,將分布均一化。
上述變性膠的放射能成像圖見圖 10.5B。強度均一化后表示為 “%mass”( 見圖 10.50。將這一實驗與程序計算結果相比較確定的尿苷酸對胸苷酸的相對摻入值。程序計算中,設置的摻入值為 0.2~0.3,按 0.01 增長。當設置值為 0.26 時,實驗和計算結果最為吻合,其中根據測量和均方根分析預測的片段大小范圍為 10~150 個堿基, 而計算得到的可靠片段長度為 4~200 個堿基(圖 10.50。當使用分子質量標準的范圍時(20~100 個堿基),因子最佳的設置值為 0.25。很顯然這些圖譜重疊得很好,并且電泳條帶中的峰和點都可以很好地解釋(圖 10.5B、圖 10.50。重要的是,y 軸的值落在了不需進一步調整的位置。我們確信尿苷酸的摻入率是確定的,并且沒有不完全斷裂造成的影響,因為實驗和計算得到的結果幾乎一模一樣,并且嘗試了許多實驗條件檢測斷裂情況。使 用 33.3% U 斷裂的放射活性測量值與計算值也吻合得很好 。但使用 25% U 斷裂的放射活性檢測結果中產生了相當量的大于 100 bp 標準的片段,并且出現了一些因標尺問題引起的偏離。然而同樣使用摻入率 0.26,與使用 EB 染色后的斷裂結果相比較,考慮到凝膠染色的長度依賴性,結果十分吻合(圖 10.5D ) ,其中 EB 染色因有合適的分子質量標準,對于較長片段更為準確。因為針對放射活性檢測和 EB 染色的尿苷酸摻入 PCR 分別使用了不同的緩沖液(見 10.2.2),多種 PCR 增強劑,如硫酸銨、吐溫- 20 或 Triton X-100 的加入 對 dUTP 對 dTTP 的摻入率并沒有顯著的影響。