色色综合资源,亚洲、欧美、都市、激情、校园、乱伦,憨豆网现在改名叫啥,一级黄色日逼视频

當前位置: 首頁 > CAS號數據庫 > 7240-90-6 > 7240-90-6/在大腸桿菌中高效表達外源蛋白的全攻略

手機掃碼訪問本站

微信咨詢

7240-90-6/在大腸桿菌中高效表達外源蛋白的全攻略

本世紀60至70年代對大腸桿菌的研究使之成為自然界中最普遍為人們所認識的生物體。大腸桿菌具有兩個顯著特征:操作簡單和能在廉價的培養基中高密度培養,它的這些特征加上十多年外源基因表達的經驗使其在大多數科研應用中成為高效表達異源蛋白最常用的原核表達系統。盡管大腸桿菌有眾多的優點,但并非每一種基因都能在其中有效表達。這歸因于每種基因都有其獨特的結構、mRNA的穩定性和翻譯效率、蛋白質折疊的難易程度、宿主細胞蛋白酶對蛋白質的降解、外源基因和E.coli 在密碼子利用上的主要差別以及蛋白質對宿主的潛在毒性等等。但知識的大量積累還是有助于為表達方面某些特定的困難提供一般的解決方法。

大腸桿菌作為表達系統的主要障礙包括:不能象真核蛋白那樣進行翻譯后修飾、缺乏將蛋白質有效釋放到培養基中的分泌機制和充分形成二硫鍵的能力。另一方面,許多真核蛋白在非糖基化的形式下能保留其生物學活性,因而也就可以用大腸桿菌來表達。如何實現外源基因在原核細胞中的有效表達,自60年代以來,對影響外源基因在其表達體系中表達效率的各個因素作了大量實驗研究,并有多篇歸納性綜述發表[1,2,3]。國內針對外源基因在原核細胞中高效表達的關鍵因素,構建了高效表達載體[4],并在此基礎上成功表達了一系列細胞因子的基因[5,6,7]。我們在分析了國內外有關在原核系統中表達蛋白的實驗資料的基礎上,對在大腸桿菌中高效表達外源蛋白的策略所涉及的內容進行全面的總結,以期有助于我國在這方面的研究。

1.有效表達載體的構型

構建表達質粒需要多種元件,需要仔細考慮它們的組合,以保證最高水平的蛋白質合成 。E.coli 表達載體的基本結構[8]。

在大腸桿菌中高效表達外源蛋白的全攻略

啟動子(以雜和的tac 啟動子為例)位于核糖體結合位點(RBS)上游10-100bp處,由調節基因(R)控制,調節基因可以是載體自身攜帶,也可以整合到宿主染色體 上。E.coli 的啟動子由位于轉錄起始位點上游約35bp的六核苷酸序列(-35區)和一短序列隔開的另一六核苷酸序列(-10區)組成[9,10,11]。有許多啟動子可用于在E.coli中的基因表達,包括來源于革蘭氏陽性菌和噬菌體的啟動子。理想的啟動子具有以下特性:作用強;可以嚴格調控;容易轉導入其他E.coli 以便篩選大量的用于生產蛋白的菌株,而且對其誘導是簡便和廉價的[12]。在啟動子下游是RBS,其跨度約為54個核苷酸,兩端限定在 -35(±2)和mRNA編碼序列的+19到+22之間[13]。Shine-Dalgarno(SD)位點[14,15]在翻譯起始階段與16S rRNA的3’端相互作用[16]。SD與起始密碼子間的距離約為5-13bp[17],而且此區的序列在mRNA轉錄物中應避免出現二級結構,否則將會降低翻譯起始的效率[18]。在RBS的5’和3’端均為A豐富區[19]。轉錄終止子位于編碼序列的下游,作為轉錄終止的信號[20]和組成發卡結構的保護性元件,阻止核酸外切酶對mRNA的降解,從而延長mRNA的半衰期[21]。

除了上述對基因表達的效率有直接影響的元件以外,載體還含有抗生素抗性基因,以方便質粒的篩選和傳代。氨芐青霉素是最常用的抗性標記。但在生產人用治療性蛋白時,最好選擇其他抗性標記(如Tet)以避免可能發生的過敏反應[22]。質粒的拷貝數由復制起點決定。在特殊情況下,選用失控復制子能夠獲得大量的質粒拷貝數和較高產量的質粒編碼蛋白[23,24]。但在另外一些情況下,選用超過pBR322的高拷貝質粒似乎并沒有好處。而且已有資料表明,增加質粒的拷貝數降低E.coli中胰酶的產量,在高拷貝質粒中,強啟動子的存在嚴重影響了細胞的活性[25,26]。

轉錄水平調控

1.啟動子

能在E.coli中發揮作用的啟動子很多。這些啟動子必須具有適合高水平蛋白質合成的某些特性。首先啟動子的作用要強,待表達基因的產物要占或超過菌體總蛋白的的10-30%;第二,它必須表現最低水平的基礎轉錄活性。若要求大量的基因表達,最好選用高密度培養細胞和表現最低活性的可誘導和非抑制啟動子。如果所表達的蛋白具有毒性或限制宿主細胞的生長,選用可抑制的啟動子則至關重要[27,28]。例如,輪狀病毒的VP7蛋白能有效地殺死細胞,因此必須在嚴格控制的條件下表達[29]。但在某些情況下,啟動子的嚴格性并不合理,因為即使最小量的基因產物也能由于其毒性而殺死細胞。如能滅活核糖體或破壞膜滲透壓的分子對細胞來說是致死性的[30]。對宿主的毒性并不僅限于外源基因,某種自身蛋白的過量表達也能造成同樣的結果。如編碼外膜磷脂蛋白的traT基因[31]。另外,不完全抑制的表達系統會造成質粒的不穩定,細胞生長速度的下降和重組蛋白產量的降低[32,33]。Lanzer和Bujard曾對常用的lac啟動子-操縱子系統進行了廣泛的研究,證明操縱子放在啟動子序列的不同位置會造成70倍差異的抑制。將17bp的操縱子置于-10和-35六聚體區之間所形成的抑制比將其放在-35區的上游或-10區的下游要高50-70倍[34]。啟動子的第三個特性是其簡便和廉價的可誘導性。大量生產蛋白質最常用的啟動子是熱誘導(λPL)和化學誘導(trp)啟動子。異丙基硫代-β-D-半乳糖苷(IPTG)誘導的雜交啟動子tac[35]或trc[36]都是強啟動子,在基礎研究中應用很廣。但在大量生產人用治療性蛋白時用IPTG做誘導劑是不可取的,因為IPTG具有毒性而且價格昂貴[37]。IPTG的這些不足至今仍限制tac或trc強啟動子在大量生產人用治療性蛋白中的應用。編碼熱敏lac阻遏蛋白[38]的突變lacI(Ts)基因的出現使得目前能夠對這些啟動子進行熱誘導[39,40]。另外,還出現了一些新型載體,它們允許在30℃對trc啟動子進行嚴緊調節。最近還報道了兩種不同的lac阻遏蛋白突變體,能夠同時允許熱誘導和IPTG誘導[41,42]。盡管野生型lacI基因也能熱誘導,但不能對其進行嚴緊型調節,且不能用于lacIq 菌株,因為溫度的變化不能遏制由lac阻遏蛋白的過量表達所造成的嚴緊性抑制[43]。因此,該系統只能用用于生產對宿主菌無害的一些蛋白。

冷反應啟動子盡管不象其他啟動子那樣得到廣泛的研究,但已經被證明能在低溫條件下進行有效的基因表達。噬菌體λPL啟動子的活性在20℃時最高,隨著溫度的升高,其活性逐漸降低[44]。PL啟動子的冷反應由E.coli整合宿主因子,一種與DNA結合的序列特異性多功能蛋白來正調控[45,46]。主要冷應激基因cspA啟動子同樣也被證明在低溫具有活性[47]。對cspA和PL啟動子進行分子剖析,鑒定了在較低溫度下參與增強轉錄的特異性DNA區域。從而開發了一系列在20℃低溫具有高活性的PL衍生啟動子[48]。選用冷反應啟動子的基本原理是在15-20℃的條件下,蛋白質的折疊速度只受到輕微的影響,而作為生物化學反應,轉錄和翻譯的速度將被充分降低。這就為蛋白質折疊、產生有活性的蛋白和避免非活性蛋白聚合體即包涵體的形成提供了充足的時間,而目的蛋白的最終產量并未減少。最近新報道的一些啟動子具有諸多誘人之處,為選擇新的高效表達系統提供了方便。如非常強的pH啟動子[49,50],重組蛋白的產量可達總蛋白的40-50%[51]。但表達的水平會因不同的基因而有差異。因為蛋白質的合成不僅依賴于啟動子的強弱,而且有賴于轉錄的效率。

人們通常只考慮E.coli啟動子的核心區域,即-10和-35六核苷酸區和一15-19bp的間隔序列。但有人提出核心序列以外的元件也能刺激啟動子的活性[52]。許多研究也已證明,核心啟動子上游的序列能夠在體內提高轉錄起始的效率[53,54,55]。Gourse等證明,位于E.coli rRNA啟動子rrnB P1 -35區上游的DNA序列即UP元件,能夠在體內和體外提高轉錄效率30倍[56]。UP元件是作為一個獨立的啟動子組件發揮作用的,因為將其融合到其他啟動子如lacUV5中也能刺激轉錄[57,58]。UP元件與其他啟動子融合所表現的這種轉錄增強子效應,使其有望通用于高效表達系統。盡管已經證明rRNA啟動子P1、P2的超強能力[59],但它們仍未被用于E.coli進行高水平表達,其主要原因是難以對其進行調控。rRNA的體內合成從屬于細胞增殖速度的控制。在細胞快速增殖期,P1和P2是活化的,當細胞處于生長的靜息期,則P1、P2被負調節。因此,rRNA啟動子在前誘導期將持續活化。在體內快速增殖的細胞中,P2的活性很弱,而且可誘導性差,但若與P1分開,P2啟動子的活性明顯升高(達到P1的70%),且對應激反應敏感。這表明在天然的串聯體中,P2是部分關閉的[60]。Brosius和Holy[61]將lac操縱子序列插入到rrnB rRNA P2啟動子的下游,在帶有lacIq基因的菌株中成功地抑制了P2的活性。轉錄活性是以氯霉素乙酰轉移酶的產生和4.5s RNA的表達為標準的。然而,P2構建體的活性只相當于tac啟動子活性的1/2,而且當rrnB P1啟動子被置于P2啟動子下游時,不能完全抑制轉錄。有人試圖利用反轉啟動子的方向來嚴格調控rRNA啟動子。將rRNA啟動子克隆于目的基因的上游,但轉錄方向相反。利用λ整合位點和可調控的λ整合酶來實現啟動子的反轉,從而達到進行誘導的目的,而且,在高度活化的啟動子上游有一強轉錄終止子將避免在前誘導期可能出現的載體的不穩定性。

2.轉錄終止子

在原核生物中,轉錄終止有兩種不同的機制。一種是依賴六聚體蛋白rho的rho依賴性轉錄終止,rho蛋白能使新生RNA轉錄本從模板解離。另一種是rho非依賴性轉錄終止,它特異性依賴于模板上編碼的信號,即在新生RNA中形成發卡結構的一回文序列區,和位于該回文序列下游4-9bp處的dA、dT富含區[62,63]。雖然轉錄終止子在表達質粒的構建過程中常被忽略,但有效的轉錄終止子是表達載體必不可少的元件,因為它們具有極其重要的作用。貫穿啟動子的轉錄將抑制啟動子的功能,造成所謂的啟動子封堵[64]。這種效應可以通過在編碼序列下游的適當位置放置一轉錄終止子,阻止轉錄貫穿別的啟動子來避免。同樣地,在啟動目的基因的啟動子上游放置一轉錄終止子,將最大限度地減小背景轉錄[65]。另有資料證明,由強啟動子啟動的轉錄會使轉錄通讀到復制區,造成控制質粒拷貝數的ROP蛋白的過量表達,從而導致質粒的不穩定[66]。另外,轉錄終止增強mRNA的穩定性[67],從而提高蛋白質的表達水平。如果來源于E.coli rrB rRNA操縱子的兩個轉錄終止子T1和T2串聯,則效果更好[68]。但其他的許多轉錄終止子通常情況下都是十分有效的。

3.轉錄抗終止子

細菌中許多參與氨基酸生物合成的操縱子在其第一個結構基因的5’端含有轉錄衰減子。衰減子由特定操縱子的氨基酸產物調節。這樣關聯的帶電荷tRNA的存在就會在核糖體剪切之后引導初始轉錄本中二級結構的形成。如果沒有關聯的帶電荷tRNA,則會形成抗終止子結構,從而抑制終止子中發卡結構的形成和轉錄的終止[69]。抗終止元件能使RNA 多聚酶越過核糖體RNA操縱子中的rho依賴性終止子即boxA[70,71]。轉錄抗終止是有一個極其復雜的過程,其中包含許多已知和未知因子。有關這方面的知識已有詳盡的綜述。在此我們主要討論抗終止元件在E.coli中表達外源基因的應用。

在E.coli表達系統中作用比較強、應用較廣的一個啟動子是噬菌體T7晚期啟動子[72,73]。該系統的活性依賴于提供T7 RNA多聚酶的轉錄單元。RNA多聚酶的嚴格阻遏對防止T7啟動子的滲漏是必需的。有許多用于調節T7多聚酶表達的途徑,但每一種方法都有其各自的缺陷。Merten等通過構建一基于λPL調節的反轉衰減T7 RNA多聚酶表達盒闡明了這一問題。可以通過在啟動子和編碼T7多聚酶的基因之間插入三個串聯排列的轉錄終止子來削弱T7多聚酶的基礎表達水平。在誘導的情況下,噬菌體λ來源的nutL依賴的抗終止功能也可以協同來阻止轉錄終止[74]。來源于E.colirrnB rRNA操縱子的轉錄抗終止區已被用于某些表達載體如pSE420。該載體應用trc啟動子[75]。其基本原理是使得轉錄通過重度二級結構區,從而減少宿主RNA 多聚酶引起的轉錄提前終止的可能性。但是rrnB抗終止子在這種情況下似乎并不十分有效。

4.嚴緊型調節表達系統

可嚴緊調節的啟動子的優點使得我們能夠設計許多巧妙、可高度抑制的表達系統。這在表達那些產物對宿主的生長不利的基因時尤其有用。所用的策略包括“鋪平板”法[76];提高抑制基因和操縱基因的比例[77];用突變的噬菌體感染誘導[28 ];致弱高拷貝數載體上的啟動子活性[78];利用轉錄終止子和抗終止子[79];在拷貝數可控的質粒中使用可誘導的啟動子[80];使用“交叉調節”系統[81];共轉導使用SP6 RNA多聚酶的質粒[82];利用與克隆基因mRNA互補的反義RNA[31]。最后一個巧妙的方法是反轉啟動子:在啟動子兩側為兩個λ整合位點,啟動子的方向與基因的表達方向相反,而且只通過由λ整合酶介導的誘導位點特意性遺傳重組來完成反轉[83,84]。

上述這些系統也各有其優缺點。即依賴固體培養基的方法不適用于大批量表達,高水平抑制系統常造成蛋白質產量的下降[85],這就有必要優化抑制基因和操縱基因的比例[86]。由λ噬菌體介導的誘導更增加了系統的復雜性,利用反轉啟動子迂回方法又引入了復雜的載體結構。盡管這些表達系統大多數尚未用于蛋白質的大規模、高產量生產,但是它們為基因表達提供了重要的工具。

翻譯水平的調控

1.mRNA翻譯起始

有關轉錄過程的大量知識使得能夠在不被附近核苷酸序列影響的情況下,在表達盒中使用原核啟動子[87]。對于決定蛋白質合成的起始因素,雖然尚不能完全弄清楚,但目前已經明白,mRNA轉錄本5’末端的獨特結構是mRNA翻譯起始效率的最主要決定因素。至今還沒有發現通用的有效起始翻譯的共同序列。已知序列的絕大部分(91%)E.coli基因的翻譯起始區均含有起始密碼子AUG,GUG的利用率為8%,而UUG的利用率則為1%[88,89]。Shine-Dalgarno(SD)位點在翻譯起始階段與16S rRNA的3’端相互作用。SD與起始密碼子間的距離約為5-13bp,這一距離影響翻譯起始的效率[90]。人們對此進行了深入的研究,以確定最佳的SD區序列和SD與起始密碼子之間的最有效間隔[91,92]。Ringquist等[93]研究了RBS的翻譯功能,得出了以下結論:(1)在間隔相同的情況下,UAAGGAGG的SD序列比AAGGA的SD序列能使蛋白質的產量提高3­­-6倍;(2)對于同一SD序列,存在一最佳的間隔。AAGGA的間隔為5-7個核苷酸,而UAAGGAGG的間隔為4-8個核苷酸;(3)對于同一SD序列,有一翻譯所必需的最小間隔。AAGGA的最小間隔為5個核苷酸,而UAAGGAGG的最小間隔為3-4個核苷酸。這些間隔提示,在16S rRNA的3’末端和結合于核糖體P位點的fMet-tRNAf的反義密碼子之間存在精確的物理關系。

在mRNA的翻譯起始區的二級結構在決定基因表達效率方面具有重要作用[94,95,96]。如用一發卡結構封閉SD區和/或AUG密碼子就會阻止其與30S核糖體亞單位的結合,從而抑制翻譯[97]。已經設計了幾種不同的策略以使mRNA形成二級結構的可能性最小。提高RBS中A、T殘基的豐度能增強某些基因的表達[98]。同樣地,突變SD區上游或下游的某些特定核苷酸就會抑制mRNA二級結構的形成和提高翻譯效率[99]。另一途徑得益于在E.coli中自然發生的一種翻譯偶聯現象[100]。翻譯偶聯的機制已被用來解釋來自多順反子mRNA的不同基因的并列表達。已經證明,當galK與上游基因偶聯翻譯時,經修飾的gal強啟動子能夠指導半乳糖激酶的高水平合成。這提示即使很弱的RBS,如果與核糖體結合也能非常有效。這種調節機制有可能在蛋白質超量生產生物技術中發揮重要作用。事實上,翻譯偶聯已經被廣泛用于不同基因的高效表達。

除了SD區與16S rRNA結合之外,mRNA和核糖體的其他相互作用也參與翻譯的起始。如核糖體S1蛋白直接參與30S亞基對mRNA的識別和結合[101]。

2.翻譯增強子

已經在細菌和噬菌體中鑒定了一些在E.coli中顯著增強異源基因表達的序列。Olins等從T7噬菌體基因10前導序列(g10-L)中鑒定了一9bp的序列,該序列似乎能替代有效的RBS。同SD共有序列相比,g10-L能使多種基因的表達水平提高40-340倍[102]。若將其置于合成SD序列的上游,按照β-半乳糖苷酶的活性與LacZ mRNA的水平來估計,g10-L序列能使 LacZ的翻譯水平提高110倍[103]。另外的研究小組在mRNA的5’非翻譯區(UTR)鑒定了一U富含序列,該序列同樣具有翻譯增強子活性。McCarthy等[104]在 E.coli atpE基因中緊接于SD位點下游鑒定一類似區域。有文獻用一30bp的序列超量產生IL-2和IFN-β[105]。另有人證明在編碼RNase D的rnd mRNA SD位點的上游,有一U8序列對該mRNA的有效翻譯是必需的。缺失這一區域會顯著降低翻譯,但不影響rnd mRNA的水平和轉錄起始位點[106]。研究證明這些類似序列的靶位是30S核糖體亞單位的S1蛋白[107]。在另一項有趣的研究中,研究者證明在緊接起始密碼子下游的序列在翻譯起始過程中發揮重要作用。位于T7基因0.3編碼區+15至+26之間或位于T7基因10編碼區+9至+21之間被稱做下游框(DB)的特定區域具有翻譯增強子的功能。DB區與16S rRNA的1469-1483核苷酸互補,這一區域稱做反下游框(ADB)。缺失DB將廢除翻譯活性。相反,如果優化DB和ADB之間的互補則會以最高水平表達dhfr融合基因。有趣的是,如果將DB從起始密碼子的上游移到SD序列的位置,DB則失去功能。DB序列存在于一些E.coli和噬菌體基因中[108,109]。

上述這些發現充分證明,除了SD位點和起始密碼子以外,mRNA中的其他序列對于有效的翻譯也是重要的。盡管其精確的機制還不太清楚,但有可能利用翻譯增強子來達到超量表達蛋白質的目的。

3.mRNA的穩定性

mRNA的快速降解勢必影響蛋白質的產生。因此在這一部分重點闡述決定mRNA穩定性的因素,這將在E.coli高效表達外源基因中有實際應用。在E.coli中有多種不同的RNase參與mRNA的降解,其中包括內切核酸酶(RNase E,RNase K和RNase III)和3’外切核酸酶(RNase II和多聚核苷酸磷酸化酶[PNPase]),目前尚未在原核細胞中發現5’外切核酸酶[110]。mRNA的降解并非由非特異性的外切核酸酶隨機剪切而引起,因為在mRNA的長度和半衰期之間并沒有反向相關性[111]。已經證明,在E.coli中有兩類保護性元件能夠穩定mRNA。一類由mRNA的5’UTRs中的序列組成[112];另一類由3’UTRs和多順反子間區的發卡結構組成[113]。其中一些元件與異源mRNA融合后起穩定劑作用,但只在嚴格的條件下如此。例如,噬菌體T4基因32的5’UTR在T4噬菌體感染的細胞中延長非穩定mRNA在E.coli中的半衰期[114]。革蘭氏陽性菌如金黃色葡萄球菌和枯草桿菌的紅霉素抗性基因(erm)編碼的mRNA 5’UTR含有穩定元件。但ermC和ermA 5’UTRs的穩定作用需要由抑制翻譯和引起核糖體失控的抗生素來誘導[115]。同樣,噬菌體λPL對于λPL-trp轉錄本的穩定作用需要λ噬菌體的感染[116]。與此相反,E.coli ompA轉錄本能夠在細胞快速增殖的正常情況下延長一系列異源mRNA在E.coli中的穩定性[117]。Emory等證明,在接近或緊接ompA 5’UTR的5’末端存在發卡結構對于其穩定效果是必需的。而且可以通過在5’末端添加發卡結構來延長在正常情況下不穩定的mRNA的半衰期[118]。這樣看來,對異源基因添加ompA 5’穩定元有可能提高E.coli中的基因表達。另一類由3’UTR組成的mRNA保護性元件能夠形成發卡結構,因而能夠阻斷外切核酸酶從3’末端對轉錄本的降解[113]。Wong和Chang[119]在蘇云金桿菌的晶體蛋白基因的轉錄終止子中鑒定了一個這樣的元件。將該“陽性反調節子”與地衣桿菌的青霉素酶基因(penP)的3’末端和人IL-2 cDNA融合,能夠延長mRNA的半衰期,且提高了相應多肽在枯草桿菌和E.coli中的產量。然而,同某些5’穩定元一樣,這類3’反向調節子不可能作為一個通用的mRNA穩定元。而且有證據表明,可以通過選用缺乏某些特定RNase如RNaseII或PNPase的宿主菌來提高基因的表達。這同樣并非一有效途徑。因為缺乏RNaseII或PNPase與RNase過量表達一樣,對于E.coli整體mRNA的平均半衰期并無多大影響。而且缺乏RNaseII或PNPase的菌株常常是不穩定的[120,121]。

4.翻譯終止

在mRNA中存在終止信號是翻譯終止過程必不可少的。除了三個終止密碼子UAA、UGA、

和UAG外,翻譯終止這一復雜事件還包括核糖體、mRNA和終止位點的幾種釋放因子的特異相互作用[122]。在E.coli中,RF-1在終止密碼子UGA處終止翻譯;RF-2在UAA密碼子處終止翻譯[123]。最近還克隆了另外一個因子RF-3[124]。

在設計表達載體時,通常插入三個終止密碼子以防止核糖體的跳躍。在E.coli中偏向于使用UAA密碼子[125]。一項對于2000多個E.coli基因的統計分析表明,在終止密碼子和緊接三聯體的核苷酸序列中存在局部非隨機性[126]。同時他們還利用體內終止試驗測定12個可能的四核苷酸“終止信號”(UAAN、UGAN、UAGN)的終止力量。在體內終止試驗中,通過其與框架移位的競爭測定其終止效率。轉錄效率依據終止密碼子和第四個核苷酸而有顯著的差異,這種差異從80%(UAAU)到7%(UGAC)不等。這些研究表明,緊接終止密碼子后的核苷酸特性強烈地影響E.coli中的翻譯終止效率[127]。UAAU是E.coli中最有效的轉錄終止序列。此外,終止密碼子5’末端的鄰近序列也影響終止的效率。因此,新生肽中倒數第二位(-2位)C-末端氨基酸殘基的電荷和疏水性能引起多達30倍不同的UGA終止效率,而在UAG位的終止對于-2位氨基酸殘基的特性不敏感[128]。對于-1位,α-螺旋、β-鏈和回轉傾向是UGA終止中的決定因素[129]。

蛋白質靶向

確定將目的蛋白表達在特定的細胞室,即細胞質、細胞間質或是培養基中,需要權衡各自的利弊。

1.細胞質表達

包涵體的形成仍然是在細胞質中進行基因表達的一個主要障礙。包涵體雖然具有多方面的好處,但這些優越之處與后期繁瑣的蛋白重新折疊工作、重疊蛋白的生物活性的未知性以及重疊和純化后蛋白的總產量降低相比,則顯得微不足道。至今尚不明了包涵體形成的精確機制。對于形成和不形成包涵體的81種蛋白質的統計學分析表明,有6個主要的理化指標與此有關。這6個指標是電荷平均數、轉變形成的殘基組分、半胱氨酸組分、脯氨酸組分、親水性和殘基總數。其中前兩個指標與包涵體形成密切相關。一種基于這些指標的模型可以根據某種蛋白質的氨基酸組成來預測包涵體形成的可能性。該模型曾成功地預測人T細胞受體Vβ5.3在E.coli中的可溶性[130] 。

已經建立了多種策略以幫助蛋白質天然空間結構的形成[131]。這些策略包括在較低溫度下培養細菌[132],選擇不同的E.coli菌株[133],替換某些氨基酸殘基[134],與分子伴侶共表達[135,136,137],利用高溶解性的多肽作為共表達分子[138],在山梨糖醇和甘氨酸三甲內鹽存在時,以低滲透壓培養和誘導細胞[139],改變培養基的pH值[140]。與分子伴侶共表達或許是一種有望提高蛋白質可溶性和折疊效率的途徑[141]。但這種策略似乎具有蛋白質特異性[142]。即便在分子伴侶存在的條件下,仍有多種因素使得過量表達的蛋白不能折疊成其天然構象。這些因素包括缺乏二硫鍵和/或翻譯后修飾;細胞質的氧化還原狀態妨礙了二硫鍵的形成。在E.coli中,有兩條途徑參與二硫鍵的還原。即硫氧還蛋白系統,該系統由硫氧還蛋白還原酶和硫氧還蛋白組成;谷氧還蛋白系統,該系統由谷胱甘肽還原酶、谷胱甘肽和三種谷氧還蛋白組成[143]。制造次還原細胞質環境,以利于二硫鍵形成的策略包括選用硫氧還蛋白還原酶(trxB)缺陷的E.coli菌株,這有助于巰基還原勢能。

蛋白質在細胞質中被降解的可能性比其他細胞室要大得多。因為在細胞質中含有大量的蛋白酶。另外,從細胞質蛋白混合物中純化目的蛋白相對比較困難,因為在此細胞室包含總細胞蛋白的絕大部分蛋白[144]。

2.細胞外周質表達

在細胞外周質進行蛋白質表達有許多優越之處。在外周質只有4%的總細胞蛋白,這顯然有利于目的蛋白的純化,外周質的氧化環境有利于蛋白質的正確折疊,在轉移到外周質的過程中,信號肽在細胞內剪切更有可能產生目的蛋白的天然N-末端。此外,外周質中的蛋白質降解也少得多[145]。蛋白質通過內膜轉運到外周質需要信號肽[146,147,148]。許多原核和真核細胞來源的信號肽已成功地用于Ecoli中蛋白質從內膜到外周質的轉運。如E.coli的PhoA信號[149]、OmpA[150]、OmpT[151]、LamB和OmpF[152]以及金黃色葡萄球菌的A蛋白[153],鼠RNase[154]和人生長激素信號肽[155]等。但是,蛋白質轉運到細菌外周質是一個特別復雜和尚未完全明了的過程,信號肽的存在并不總能保證有效的蛋白質通過內膜轉運[156]。改善蛋白質轉運到外周質的策略包括提供蛋白質轉運和加工所需的成分:過量表達信號肽酶I[157],利用prlF突變株[158],共表達參與膜轉運的幾種蛋白質,降低蛋白質的表達水平以防止轉運工具的過載[159]。

3. 細胞外分泌(外泌)

將蛋白質分泌到細胞外是人們最期望的一種策略。因為這樣容易純化目的蛋白質,減少細菌的蛋白酶對目的蛋白質的裂解。但是,E.coli在正常情況下只有很少量的蛋白質分泌到細胞外。要解決蛋白質外泌方面的難題,必須弄清E.coli的分泌途徑。Pugsley[160]對革蘭氏陰性菌的分泌途徑進行了詳細的研究。在E.coli中將蛋白質分泌到培養基中的方法大致分為兩類:(1)利用已有的“真正”的分泌蛋白所采用的途徑[161];(2)利用信號肽序列、融合伴侶和具有穿透能力的因子。第一種方法具有將目的蛋白質特異性分泌的優點,并最小限度地減少了非目的蛋白的污染。最突出的例子是溶血素基因,該基因曾被用于構建分泌的雜交蛋白[162,163];第二種方法依賴于有限滲透的誘導而導致蛋白質的分泌。例如應用pelB[164]、ompA[165]和A蛋白引導序列[153,166];與細菌素釋放蛋白的共表達[167];絲裂霉素誘導的細菌素釋放蛋白和在培養基中添加甘氨酸[168]以及與kil基因共表達而進行膜穿透[169]。但通常情況下,外泌蛋白質的產量是中等的。有文獻報道[170],在大腸桿菌表達系統中,金黃色葡萄球菌A蛋白的信號肽能引導帶有E結構域的A蛋白片段或融合產物從細胞質外泌到培養基中,蛋白的外泌表達發生于細胞生長后期。但所用的啟動子為A蛋白自身的啟動子,該啟動子在大腸桿菌中為非可控性的組成性表達,且強度較弱。如果能利用可控的強啟動子進行A蛋白信號肽引導的基因表達,則有望在蛋白質外泌方面有所突破。目前我們正在進行這方面的嘗試,且已經取得初步成效。

密碼子的使用

原核和真核生物的基因對同義密碼子的使用均表現非隨機性[171,172]。對E.coli中密碼子的使用頻率進行系統分析得到以下結論[173]:(1)對于絕大多數的簡并密碼子中的一個或兩個具有偏好;(2)某些密碼子對所有不同的基因都是最常用的,無論蛋白質的含量多少,例如CCG是脯氨酸最常用的密碼子;(3)高度表達的基因比低表達的基因表現更大程度的密碼子偏好;(4)同義密碼子的使用頻率與相應的tRNA含量有高度相關性。這些結果暗示,富含E.coli不常用密碼子(表1)的外源基因有可能在E.coli中得不到有效表達。已經證明[174],微精氨酸tRNAArg(AGG/AGA)是多種哺乳動物基因在細菌中表達的限制因子。因為AGA和AGG在E.coli中不常用。如果共表達編碼tRNAArg(AGG/AGA)的argU(dnaY)基因,就會高水平表達目的蛋白[174]。但利用同方法所進行的另外幾項研究的結果卻不一致[175,176]。其他的研究表明,通過用常用密碼子替換稀有密碼子或與“稀有”tRNA基因共表達可以提高外源基因在E.coli中的表達水平[177,178]。許多研究者對有關密碼子使用模式的進化意義和密碼子使用效果的機制進行了研究,但至今尚未找到協調密碼子的使用和轉錄本翻譯的精確規則。似乎在轉錄本5’末端附近存在稀有密碼子將會影響翻譯效率。另外,基因5’編碼區中GC含量似乎也影響其表達。這在人胸苷酸激酶(TS)中已經得到證明[179]。在不改變所編碼蛋白的前提下,將TS cDNA的第三、四、五密碼子的嘌呤堿基變成胸腺嘧啶,使得TS基因的表達占到E.coli中總蛋白量的25-30%。綜上所述,有許多可變因素可能影響實驗結果,如位置效應、稀有密碼子的群集和mRNA的二級結構等等。

在大腸桿菌中高效表達外源蛋白的全攻略

蛋白質的蛋白酶解

蛋白酶解是一個選擇性的、高度調節的過程,該過程參與許多代謝活動。E.coli在細胞質、細胞外周質、內膜和外膜有許多蛋白酶[180,181]。這些蛋白酶參與宿主的代謝活動,如選擇性地清除異常和錯誤折疊的蛋白。到目前為止,蛋白酶解的機制尚未完全明了,但已有一些策略和方法以減少E.coli中異源蛋白的降解。雖然使得蛋白質不穩定的精確結構特點還不清楚,但是通過系統研究已經明確了一些蛋白不穩定的決定因素。蛋白酶解途徑的“N-末端規則”在E.coli中能夠發揮作用,即蛋白質的穩定性與其氨基端的殘基有關[182]。在E.coli中,N-末端Arg、Lys、Leu、Phe、Tyr和Trp的半衰期為2分鐘,而除脯氨酸外的其他氨基酸的半衰期均超過10小時。有研究表明,在多肽的第二位帶有較小側鏈的氨基酸有利于甲硫氨酸氨肽酶催化的N-末端甲硫氨酸的去除,從而暴露出位于第二位的亮氨酸,使得該蛋白不穩定[183]。蛋白質的第二個決定因素是位于近氨基端的特異性內源賴氨酸殘基[142,143]。該殘基是多遍在蛋白鏈的受體,多遍在蛋白鏈在真核細胞中有利于遍在蛋白依賴的蛋白酶對蛋白質的降解。有趣的是在一個多遍在蛋白中,它的兩個決定簇可以位于不同的亞基上,卻能靶向同一個蛋白進行加工[184]。氨基酸成分和蛋白質不穩定性的另一個關系體現在PEST假說中[185]。根據對短壽命真核蛋白的統計分析,蛋白質如果富含Pro、Glu、Ser和Thr的區域,且在該區域附近有某些特定的氨基酸,則該蛋白就會不穩定。這些PEST結構域的磷酸化導致鈣的結合能力提高,從而利于鈣依賴性蛋白酶對蛋白質的降解。這提示可以在缺乏PEST蛋白裂解系統的E.coli中表達PEST富含蛋白。

減少E.coli中重組蛋白裂解的策略有以下幾種:(1)將蛋白質靶向細胞周質或培養基[145,186];(2)在較低的溫度下培養細菌[187];(3)選用蛋白酶缺陷的菌株[188];(4)構建N-末端或C-末端融合蛋白[186];(5)將目的基因多拷貝串聯[188];(6)與分子伴侶共表達[189];(7)與T4 pin基因共表達[190];(8)替換特定的氨基酸殘基以消除蛋白酶裂解位點[191];(9)改善蛋白質的親水性[192];(10)優化培養條件[193]

融合蛋白表達

在E.coli中表達外源蛋白,尤其是真核蛋白時,蛋白質的穩定性是經常遇到的問題。最近幾年,眾多巧妙的蛋白質——融合系統的發展,為E.coli中高效表達和純化重組蛋白提供了極大方便。融合表達具有多方面的優點:如防止包涵體的形成,促進蛋白質的正確折疊,限制蛋白酶解和利于純化[159,194]。

Uhlen和其同事[195]利用葡萄球菌A蛋白和合成的結構域(Z)開發了一種多功能的融合伴侶,除了能夠作為純化標記外,A蛋白組分還作為一種可溶性伴侶促進蛋白質的折疊,A蛋白信號肽的存在可使表達蛋白分泌到培養基中。另一個融合伴侶是鏈球菌G蛋白(SPG),它是一種細菌胞壁蛋白,在其氨基端具有分離的白蛋白結合區,在OH端具有免疫球蛋白IgG結合區[196]。最小的白蛋白結合區由來源于SPG的46個氨基酸殘基組成,作為親和純化標記純化cDNA編碼的蛋白。如果將A蛋白和SPG結構域聯合組成三聯融合蛋白,則為純化提供了更為廣泛的選擇,可以更進一步防止蛋白酶解。SPG-白蛋白的一個重要應用是其能夠穩定哺乳動物外周循環中的短壽命蛋白,這一效應是通過SPG結構域與一種長壽命蛋白——血清白蛋白的結合來介導的[197]。

最近又建立了一種更為復雜和巧妙的親和系統[198]。這種多元系統利用了七種不同的親和標記,從而允許使用多種結合和洗脫條件,為重組蛋白的生產、檢測和純化提供了一個有力的工具。

使用基因融合表達系統在E.coli中表達外源基因已經越來越受歡迎。這在很大程度上歸因于融合系統能夠產生大量的可溶性的融合蛋白。谷胱甘肽S-轉移酶(GST)、麥芽糖結合蛋白(MBP)以及硫氧還蛋白(Trx)均已經被證實能非常成功地生產正確折疊、有生物活性的蛋白質,能明顯提高在E.coli細胞質中產生的融合蛋白的可溶性,并能抑制包涵體的形成[159,194]。其中每一種都備有方便的純化方法,可將融合蛋白與細胞污染物分開。已經建立了多種對融合蛋白進行位點特異性裂解的方法,方法的選擇通常由特定蛋白的組成、序列及物理性質決定[199]。可采用諸如溴化氰(Met↓)、羥胺(Asn↓Gly)、等試劑或低pH(Asp↓Pro)來進行融合蛋白的化學裂解。化學裂解的方法較便宜而且有效,甚至常常可以在變性的條件下裂解非變性不能溶解的蛋白質。但有時目的蛋白中存在裂解位點,或因發生副反應而導致對蛋白質進行不必要的修飾,從而阻礙了它們的應用。作為一個備選方案,酶解的方法相對來說其反映條件較溫和,更重要的是,普遍用于此用途的蛋白酶都具有高度的特異性。其中常用的酶有:Xa因子、凝血酶、腸激酶、凝乳酶和膠原酶。所有這些酶都具有較長的底物識別序列,從而降低了蛋白質中其他無關部位發生斷裂的可能性。在上述提及的各種酶中,Xa因子和腸激酶應用最多,因為它們切割各自的識別序列的羧基端,使帶有天然氨基酸的被融合部分得以釋放。