專利名稱:Msp納米微孔和相關方法
MSP納米微孔和相關方法交叉參考相關申請本申請要求2008年9月22日提交的美國臨時申請系列案61/098,938的權益,所述臨時申請系列案以其全文通過引用合并入本文。政府許可權利的聲明本發明是利用在由國立衛生研究院授予的基金號5R21HG004145下的政府資助進行的。政府在本發明中具有某些權利。背景已建立的DNA測序技術需要大量DNA和若干冗長的步驟來僅構建全長序列的數十個堿基。然后必須以“鳥槍法”方式(非線性地依賴于基因組的大小和依賴于從其構建全長基因組的片段的長度的工作)裝配該信息。這些步驟很昂貴且費時,尤其當測定哺乳動物基因組的序列時。概述本文中提供了包括對具有界定通道(tunnel)的前廳(vestibule)和縊縮區 (constriction zone)的耳止柜分枝桿菌(Mycobacteriumsmegmatis)孑L蛋白(Msp)孑L蛋白施加電場的方法,其中Msp孔蛋白位于第一導電液體介質與第二導電液體介質之間。還提供了改進通過Msp孔蛋白的通道(tunnel)的電導的方法,包括除去、添加或置換野生型Msp孔蛋白的前廳或縊縮區中的至少一個氨基酸。還提供了包括具有界定通道的前廳和縊縮區的Msp孔蛋白的系統,其中所述通道位于第一液體介質與第二液體介質之間,其中至少一種液體介質包含分析物,以及其中系統對于檢測分析物的性質是有效的。還提供了包括具有界定通道的前廳和縊縮區的Msp孔蛋白的系統,其中所述通道位于第一液體介質與第二液體介質之間的脂雙層中,并且其中第一與第二液體介質之間的液體連通的唯一點存在于通道中。還提供了突變的Msp孔蛋白。例如,提供了突變的恥垢分枝桿菌孔蛋白A(MspA), 其包含界定通道的前廳和縊縮區,以及至少第一突變MspA單體,所述單體包含位置93上的突變和位置90、位置91或位置90及91上的突變。還提供了突變的MspA孔蛋白,其包含具有約2至約6nm的長度和約2至約6nm的直徑的前廳,和具有約0. 3至約3nm的長度和約0. 3至約3nm的直徑的縊縮區,其中所述前廳和縊縮區一起界定了通道,以及還包含至少第一突變MspA旁系同源物或(paralog)同系物(homolog)單體。還提供了突變MspA旁系同源物或同系物,其包含具有約2至約6nm的長度和約2至約6nm的直徑的前廳,和具有約 0. 3至約3nm的長度和約0. 3至約3nm的直徑的縊縮區,其中所述前廳和縊縮區一起界定了通道。描述了產生突變的Msp孔蛋白的方法。例如,本文中提供了產生突變的MspA孔蛋白的方法,包括在位置93上和位置90、位置91或位置90及91上修飾野生型MspA單體。 還提供了產生具有界定了通道的前廳和縊縮區的突變MspA孔蛋白的方法,包括在野生型 MspA旁系同源物或同系物單體的前廳或縊縮區中缺失、添加或置換任何氨基酸以便所得的突變MspA孔蛋白能夠在施加電場后將分析物轉位通過通道。還提供了一種方法,所述方法包括在不使用電場的情況下使分析物轉位通過恥垢分枝桿菌孔蛋白(Msp)孔蛋白的通道。本文中提供了核酸序列。任選地,核酸序列可包含第一和第二核苷酸序列,其中所述第一核苷酸序列編碼第一 Msp單體序列并且第二核苷酸序列編碼第二 Msp單體序列。該核酸序列還可包含編碼氨基酸連接體序列的第三核苷酸序列。任選地,該核酸序列還包含編碼第三或更多Msp單體序列的第三或更多核苷酸序列。例如,所述核酸序列還可包含第 3、第4、第5、第6、第7和第8核苷酸序列。所述第1、第2、第3、第4、第5、第6、第7和第8 核苷酸序列編碼第1、第2、第3、第4、第5、第6、第7和第SMsp單體序列,并且該核酸序列還包含編碼氨基酸連接體序列的第9核苷酸序列。還提供了包含兩個或更多個單鏈Msp的 Msp孔蛋白。還提供了由本文中所述的核酸編碼的多肽。還提供了包含本文中描述的多肽的載體。還提供了用本文中描述的任何載體轉染的培養細胞或其后代,其中所述細胞能夠表達 Msp孔蛋白或Msp孔蛋白單體。還提供了包含本文中描述的任何載體的恥垢分枝桿菌菌株。還提供了能夠誘導Msp單體表達的突變的細菌菌株,所述細菌菌株包含(a)野生型MspA的缺失;(b)野生型MspC的缺失;(c)野生型MspD的缺失;和(d)包含有效地連接于Msp單體核酸序列的誘導型啟動子的載體。還提供了產生單鏈Msp孔蛋白的方法,所述方法包括(a)用包含能夠編碼單鏈 Msp孔蛋白的核酸序列的載體轉化突變的細菌菌株;和任選地(b)從所述細菌純化單鏈Msp 孔蛋白。該突變的菌株可包含野生型MspA、野生型MspB、野生型MspC和野生型MspD的缺失,以及包含有效地連接于Msp核酸序列的誘導型啟動子的載體。可用包含能夠編碼單鏈 Msp孔蛋白的核酸序列的載體轉化該突變的菌株。還提供了使用Mps孔蛋白例如單鏈Msp孔蛋白的方法。例如,所述方法可包括產生具有第一側面和第二側面的脂雙層,向脂雙層的第一側面加入Msp孔蛋白例如純化的單鏈Msp孔蛋白,對雙分子層的第二側面施加正電位,使實驗性核酸序列或多肽序列轉位通過Msp孔蛋白,測量使序列轉位通過Msp孔蛋白的阻塞電流,以及將該實驗性阻塞電流與阻塞電流標準相比較,確定該實驗性序列。附圖概述上述方面和許多附帶的有利方面將變得更容易理解,因為當與下列附圖結合,參考下列詳述,上述方面和許多附帶的有利方面可得到更好地理解。
圖1顯示野生型MspA(WTMspA)孔蛋白的結構和電荷分布。在pH 8時,預期酸性殘基主要帶負電荷并且堿性殘基主要帶正電荷。突變的位置和殘基由箭頭和標記指示。參見 Faller 等人,Science, 303 :1189(2004)。圖 2 顯示 WTMspA、突變體 D90N/D91N/D93N (MlMspA,也稱為 M1-NNN)和突變體 D90N/D91N/D93N/D118R/E139K/D134R(M2MspA,也稱為 M2-NNN)孔蛋白的通道形成活性和單通道電導的測定結果。左圖顯示當MspA孔蛋白存在于水浴雙分子層的溶液(1MKC1, 20V )中時,雙分子層的電導隨時間的變化。電導的逐步增加被解釋為MspA孔蛋白至雙分子層內的插入。右邊是這些電導步長(conductance step)的大小的直方圖。WTMspA、 MlMspA和M2MspA孔蛋白的直方圖分別概括了來自3個重復實驗的40個插入、來自3個重復實驗的144個插入和來自5個重復實驗的169個插入。圖3A和;3B顯示了 WTMspA孔蛋白的自發阻塞行為。圖3A是實驗的示意圖。圖顯示在DNA不存在的情況下在60mV (左)和IOOmV (右)下對于WTMspA孔蛋白觀察到的代表性離子電流信號。負電流的間隔時間相應于施加的電壓的反轉,這通常是重建未被阻塞的離子電流水平所需的。圖4顯示電泳凝膠中突變的MspA單體的表達。向各泳道中加入粗制提取物 (13μυ。用考馬斯藍染色凝膠。泳道1:蛋白質分子量標準;泳道2 =WTMspA ;泳道3:無 MspA ;泳道4 突變體MlMspA ;泳道5 突變體D90N/D91N/D93N/D118R ;泳道6 突變體D90N/ D91N/D93N/D118R/E139R ;泳道 7 突變體 D90N/D91N/D93N/D118R/E139K ;泳道 8 突變體 M2MspA。構建、提取和測定泳道5至7中的突變體以確保對于每一個連續氨基酸置換保持表達和通道形成活性。凝膠上方的簡圖示意性顯示在該實驗中突變的氨基酸的大致位置和極性。圖5A-5C顯示利用MlMspA孔蛋白進行的ssDNA發夾構建體的檢測。圖5A是實驗的示意圖。圖5B顯示在180和140mV下在DNA不存在和在8 μ M hp08 (SEQ ID NO :4)發夾 DNA存在的情況下對于MlMspA孔蛋白觀察到的代表性離子電流信號。圖5C顯示在放大的時標(expanded time scale)上來自圖5B中的描記線的已編號的阻塞。圖6顯示MlMspA孔蛋白中來自發夾構建體的深度阻塞的特征。每一個點的坐標給出了 1個深度阻塞的持續時間和平均電流。分別在140和ISOmV獲得黑色和灰色數據。對于每一個數據集,標出深度阻塞駐留時間tD的IoglO模式。右邊的簡圖顯示每一個發夾構建體的序列hp08(5 ‘ GCTGTTGC TCTCTC GCAACAGC Am3 ’ ) (SEQ IDNO :4)、hpl0(5 ‘ GCTCTGTTGC TCTCTC GCAACAGAGC A503 ‘ ) (SEQ ID NO 5)和 hp12(5' GCTGTCTGTTGC TCTCTCGCAACAGACAGC A50-3‘ )(SEQ ID NO :6)。圖7是顯示MlMspA孔蛋白中針對hp08 (SEQ ID NO :4)的部分阻塞駐留時間分布的圖。分布十分擬合單指數模式。在ISOmV下的部分阻塞具有約比在140mV上長3倍的時間常數。圖8提供了 MlMspA孔蛋白中發夾構建體深度阻塞的駐留時間分布的詳細外觀。左邊的圖框顯示具有駐留時間(X)的IoglO的概率分布的對數二進制圖(階梯圖)和相應核平滑密度估計的駐留時間直方圖。將這些平滑的密度估計值的最大值tD用于參數化駐留時間分布。垂直線顯示tD值。右邊的圖框顯示來源于駐留時間數據(實線)和單衰減指數 (single decaying exponential)的存活概率曲線,時間常數設置為每一個數據組的tD值 (虛線)。數據明顯偏離單指數變動形態(simpleexponential behavior)。然而,進行tD值與用于其他觀察的指數時間常數之間的定性比較是合理的(Kasianowicz等人,Proc. Natl Acad. Sci. USA, 93 13770 (1996)),因為這兩個參數均反映了駐留時間分布的相似方面。圖9A-9G顯示獲自跨雙層探針實驗(transbilayer probeexperiment)的數據。圖 9A顯示分子構型的動畫(animation) :(1)未被阻塞的孔;(2)具有阻止nA_ssDNA復合物轉位的neutravidin(nA)的絲狀ssDNA ; (3)與nA_ssDNA雜交的靶DNA在負電壓下分離;和 (4)nA-SSDNA復合物在某一電壓下(依賴于靶DNA的雜交)從孔排出。圖9B是外施電壓的時間序列。電流阻塞在約200ms的延遲后觸發從ISOmV捕捉電壓至40mV的維持電壓的變化。維持電壓維持5秒以允許雜交,然后向負電壓下降。圖9C和9D各自顯示表明nA-ssDNA分別在負和正電壓下排出的電流時間序列。由于瞬間電壓改變和在大的負電壓下自發的孔關閉,大電流尖脈沖產生。圖9E-9G是排出電壓(exit voltage) (Vexit)直方圖。圖9E顯示一個實驗,在該實驗中,探針 5' -C6A54-CTCTATTCTTATCTC-3 ‘ (SEQ ID NO :7)與靶 ssDNA分子5' -GAGATAAGAATAGAG-3‘ (SEQ ID NO 9)互補。圖9F顯示與圖9E中相同的孔,但其使用不與靶 DNA 互補的探針 5' -C6A54-CACACACACACACAC-3 ‘ (SEQ ID NO 8)。圖 9G 顯示來自使用與圖9E中的探針相同的探針(SEQ ID NO 7)但在反面區室(transcompartment) 中不存在靶DNA的單獨的對照的結果。只在圖9E中觀察到大量負Vexit事件,其中探針(SEQ ID NO 7)與靶互補。圖9F和9G中負Vexit事件的極少發生排除了圖9E中的大部分負Vexit 是由非特異性探針-靶結合或由探針對孔的結合所引起這種可能性。圖 10A-10C 比較了 MlMspA 與 M2MspA 孔蛋白的 dT50(SEQ IDNO :32)均聚物阻塞。 圖IOA是實驗的示意圖。圖IOB顯示了對于利用8μ M dT5Q(左)的MlMspA孔蛋白和利用 2μΜ dT5(1(右)的M2MspA孔蛋白觀察到的代表性離子電流信號。圖IOC顯示在放大的時標上來自圖IOB中的描記線的已編號的阻塞。圖11顯示M2MspA孔蛋白中dT5Q(SEQ ID NO :32)阻塞的統計學特征。在阻塞開始和結束時平均結構的比較。通過重疊事件開始時(左)和事件結束時(右)對齊的數據文件中的事件來產生圖。顯示了阻塞以離子電流的短暫向下偏轉終止的趨勢以及該趨勢隨電壓升高而增加。圖12A顯示被DNA構建體阻塞的MlMspA孔蛋白中阻塞電流水平的直方圖。 DNA 構建體從上至下為3 ‘ -A47AAC-hp-5 ‘ (SEQ IDNO 14) ;3 ‘ -A47ACA_hp-5 ‘ (SEQ ID NO 33) ;3 ‘ -A47CAA-hp-5 ‘ (SEQ IDNO 13) ;3 ‘ -C50_hp-5 ‘ (SEQ ID NO 16); 3' -A50-hp-5‘ (SEQ ID NO :10)。圖 12B 顯示針對 poly-C( = 1. 0)與 poly-A( = 0. 0)水平之間的差異標度的電流水平對單個C的位置的曲線。高斯擬合表明對于單個C的識別位置距離發夾末端1. 7 士0. 8個核苷酸(nt)。圖13顯示許多阻塞Ml-NNN MspA (也稱為MlMspA)孔蛋白的DNA的電流直方圖。DNA 構建體從上到下為3 ‘ -C50-hp-5 ‘ (SEQ IDNO 16) ;3 ‘ -A50-hp-5 ‘ (SEQ ID NO 10) ;3 ‘ -T47TTT-hp-5 ‘ (SEQ IDNO 17) ;3 ‘ -A47AAT_hp-5 ‘ (SEQ ID NO 34) ;3 ‘ -A47ATA-hp-5 ‘ (SEQ IDNO 35) ;3 ‘ -A47TAA_hp-5 ‘ (SEQ ID NO 36) ;3 ‘ -C47CCA-hp-5 ‘ (SEQ IDNO 37) ;3 ‘ -C47CAC_hp-5 ‘ (SEQ ID NO 38); 3' -C47ACC-hp-5' (SEQ IDNO :39)。每一個構建體或混合物示于左邊。每一個直方圖中事件的數量示于右邊。上圖“校準混合物〃(poly-A-hp和poly-C-hp)。圖2-5 :Poly-T-hp 和poly-A背景中的單個T堿基。下方三個圖poly-A背景中的單個A堿基。Poly-A-hp包含在用于參照的混合物中(小峰值在19. 5%上)。全部數據采用180mV。圖14顯示DNA尾不影響識別性質。圖例是關于圖13的。兩個非均質尾 C rani' (SEQ ID NO 51)、‘ ran2' (SEQ ID NO :52),各自 47 個堿基)連接至三核苷酸和發夾。中間的圖顯示當將A5Q-hp DNA(SEQ ID NO :10)與ranl-C3-hp DNA的混合物用于孔時產生的電流直方圖,其為其他圖的參照點。電流水平與A5tl或C5tl尾的電流水平相同。 全部數據采用180mV。圖15A和15B顯示M2-QQN孔蛋白(另一種突變的MspA孔蛋白)的表征數據。圖 15A顯示了該突變體的表達水平。全部蛋白質在ML16恥垢分枝桿菌中表達。將10 μ 1 0. 5%辛基聚氧乙烯(octylpolyoxyethylene)粗制提取物加入每一個孔。泳道1 =WTMspA ;泳道 2 背景(pMS2,空載體);泳道3 :M2-QQN(pML866)。圖15B顯示在IM KCl中記錄的二植烷酰磷脂酰膽堿(diphytanoylphosphatidylcholine)脂雙層中的M2-QQN孔蛋白的電流描記線。將大約70pg的蛋白質加入至雙層小室。在脂雙層實驗中分析4個膜的約100個孔。 M2-QQN 孔蛋白的主電導(mainconductance)為 2. 4 納秒(nS)。圖 16 顯示關于暴露于 hp-T50 (SEQ ID NO 17)、hp_C50 (SEQ IDNO 16)和 hp_A50 (SEQ ID NO 10)的發夾DNA混合物的3種不同突變MspA孔蛋白的阻塞電流直方圖。在每一種情況下,對于每一個突變體,將電流針對右邊顯示的開放態電流(open state current)進行標準化。將hp-C5(1和hp-A5(1作為混合物使用,而T5tl單獨使用。圖17是顯示兩種突變MspA孔蛋白的深度電流阻塞的存在概率。顯示了比t持續更長的事件的概率。圓圈表示M2-QQN孔蛋白,十字形表示M2-NNN孔蛋白。雙層兩側施加的電壓是100、120和140mV。將數據針對每一個記錄中的事件總數標準化。圖18顯示恥垢分枝桿菌的MspA、MspB, MspC和MspD單體的比對。開放閱讀框架的第一 ATG或GTG密碼子被當作假定的起始密碼子。蛋白質的編號始于成熟部分的第一個氨基酸。MspA單體氨基酸序列是SEQ ID NO :28,MspB單體氨基酸是SEQ ID NO :29,MspC 單體氨基酸是SEQ ID NO 30,以及MspD單體氨基酸序列是SEQ ID NO :31。圖19是顯示恥垢分枝桿菌孔蛋白-四重突變體(quadruplemutant)ML59中每一個孔蛋白基因的缺失的凝膠圖像。圖20顯示顯示Msp孔蛋白在恥垢分枝桿菌中表達和恥垢分枝桿菌孔蛋白突變體的Western印跡。泳道1是1 10稀釋的野生型恥垢分枝桿菌的蛋白質提取物,泳道2是突變體MNOl ( Δ mspA),泳道3是突變體MLlO ( Δ mspAC),泳道4是突變體ML16 ( Δ mspACD), 以及泳道5是突變體ML180 ( Δ mspABCD)。圖21A和21B顯示用于四重孔蛋白突變體的構建的質粒圖譜。Hyg 潮霉素抗性基因;ColEl 大腸桿菌(E. coli)復制起始點。圖21A是用于MspA表達的整合質粒圖譜。AmiC、 A、D、S是MspA的乙酰胺誘導型表達所必需的。attP 噬菌體L5的染色體附著位點;int L5整合酶;FRT =Flp重組酶位點。圖21B是MspB缺失載體的質粒圖譜。MspBup,MspBdown MspB的上游和下游區域;IoxP =Cre重組位點;SacB 蔗糖6-果糖基轉移酶;XylE 兒茶酚-2,3-雙加氧酶;Gfp2+ 綠色熒光蛋白;tsPAL5000 分枝桿菌的溫度敏感型復制起點。圖22是顯示恥垢分枝桿菌中MspA單體的誘導型表達的考馬斯藍染色凝膠的圖像。圖23是顯示Msp四重突變體ML705在Middlebrook 7H10瓊脂板上生長的圖像。圖M是顯示ML705在豐富液體培養中的生長率的照片。圖25是顯示在用乙酰胺誘導后MspA單體在四重突變體ML705中的表達的 Western印跡圖像。泳道1是野生型恥垢分枝桿菌,泳道2是利用乙酰胺的四重突變菌株ML705,泳道3是不使用乙酰胺的四重msp突變菌株ML705,以及泳道4是三重突變菌株 ML16。使用針對MspA的多克隆抗體檢測蛋白質。圖^A_26D顯示單鏈MspA納米孔二聚體的結構和通道活性。圖26A是單鏈納米孔MspA 二聚體的分子模型的圖像。圖26B顯示單鏈MspA納米孔二聚體(scMspA)基因構建體的示意圖。氨基酸連接體區域(GGGGS)3(SEQ ID NO 3)被放大。還顯示了氨基酸連接體的 DNA 序列(5 ‘ -GGCGGTGGCGGTAGCGGCGGTGGCGGTAGCGGCGGTGGCGGTAGC-3 ‘ ) (SEQ ID NO 19)。圖26C是顯示scMspA納米孔二聚體在恥垢分枝桿菌中表達的Western印跡的圖像。 泳道1是分子量標準(M),泳道2是野生型恥垢分枝桿菌(WT Msmeg),泳道3是無scMspA 基因構建體(ML16)的ML16菌株,泳道4是具有野生型MspA基因構建體(WTMspA)的ML16 菌株,泳道5是具有scMspA納米孔二聚體基因構建體(scMspA)的ML16菌株。圖26D顯示 scMspA納米孔二聚體的電流描記線。圖27顯示運輸dC58 (SEQ ID NO :40) ssDNA通過野生型MspA孔蛋白的示意圖。DNA 運輸由下列步驟組成a)開始模擬;b)和c)在快速前進之前和之后DNA構象改變;和d) DNA附著至MspA孔蛋白的表面。圖觀是顯示圖27的dC58(SEQ ID NO :40) ssDNA運輸的累積離子電流的圖。在1. 2V 的跨膜偏壓下進行運輸。圖四顯示單鏈MspA (scMspA)納米孔八聚體序列的設計。scMspA八聚體由下述組成野生型MspA基因單體、MspAl單體、MspA2單體、MspA3單體、MspA4單體、MspA5單體、 MspA6單體和MspA7單體組成。I^acI和HindIII限制性位點側翼連接scMspA納米孔八聚體序列。X1-X14是側翼連接單個單體序列的唯一限制性位點。連接每一個單體的黑線表示 (GGGGS)3(SEQ ID NO 3)連接體。圖30顯示野生型MspA單體和多種MspA旁系同源物和同系物單體的縊縮區(矩形框)。圖31顯示被DNA構建體阻塞的MlMspA中的阻I■電流水平的直方圖。DNA構建體從上至下為3'-A40AAAAAAAAAA-hp-5‘(SEQID NO 10);3'-A40CCCCAAAAAA-hp-5 ‘(SEQID NO11) ;3'-A40AAACCCCAAA-hp-5 ‘(SEQ ID NO12);3'-A40AAAAAAACAA-hp-5 ‘(SEQID NO13) ;3'-A40AAAAAAAAAC-hp-5 ‘(SEQ ID NO14);3'-A40AAAAAACCCC-hp-5 ‘(SEQID NO15) ;3'-C40CCCCCCCCCC-hp-5 ‘(SEQ ID NO16);3'-T40TTTTTTTTTT-hp-5 ‘(SEQID NO17) ;3'-A40AAAAAAAGGG-hp-5 ‘(SEQ ID NO18)O 發明詳述本文中提供了方法,其包括對具有界定通道的前廳和縊縮區的恥垢分枝桿菌孔蛋白(Msp)孔蛋白施加電場,其中所述Msp孔蛋白位于第一導電液體介質與第二導電液體介質之間。任選地,所述第一和第二液體導電介質相同。任選地,所述第一和第二液體導電介質不同。Msp孔蛋白可以是本文中描述的任何Msp孔蛋白。例如,Msp孔蛋白可選自野生型MspA孔蛋白、突變的MspA孔蛋白、野生型MspA旁系同源物或同系物孔蛋白以及突變的 MspA旁系同源物或同系物孔蛋白。在本文中的任何實施方案中,Msp孔蛋白還可包含分子發動機(motor)。所述分子發動機可以能夠以這樣的轉位速度或平均轉位速度將分析物移入或穿過通道,所述速率小于分析物在分子發動機不存在的情況下通過電泳轉位入或穿過通道時的轉位速度或平均轉位速度。因此,在本文中的包括施加電場的任何實施方案中,電場可能足以使分析物通過電泳轉位通過通道。本文中所述的任何液體介質例如導電液體介質可包含分析物。分析物可以是本文中所述的任何分析物。本文中的實施方案還可包括在例如下述方法中檢測分析物,所述方法包括當分析物與Msp孔蛋白通道相互作用時測量離子電流以提供電流模式,其中電流模式中阻塞的出現標示著分析物的存在。任選地,Msp孔蛋白是突變的MspA或突變的MspA旁系同源物或同系物孔蛋白, 并且分析物的穿過孔蛋白通道的轉位速度或平均轉位速度小于或大于分析物穿過野生型 MspA或野生型MspA旁系同源物或同系物孔蛋白的通道的轉位速度或平均轉位速度。在本文中的任何實施方案中,分析物可具有小于0. 5nm/ μ s的穿過通道的轉位速度或平均轉位速度。任選地,分析物可具有小于0. 05nm/ys的穿過通道的轉位速度或平均轉位速度。本文中所述的任何Msp孔蛋白可包含在脂雙層中。在本文中的這類實施方案或任何其他實施方案中,Msp孔蛋白可具有順面(cis side)和反面(trans side)。任選地,分析物通過電泳或其他方式從順面轉位通過通道至反面。任選地,分析物通過電泳或其他方式從反面轉位通過通道至順面。任選地,分析物通過電泳或其他方式被驅動從順面或反面進入通道并且停留在通道中或接著分別退回順面或反面。本文中的任何實施方案還可包括鑒定分析物。此類方法可包括將針對未知的分析物獲得的電流模式與在相同的條件下使用已知的分析物獲得的已知的電流模式相比較。在本文中的任何實施方案中,分析物可以是核苷酸、核酸、氨基酸、肽、蛋白質、聚合物、藥物、離子、污染物、納米級物體或生物戰劑。任選地,分析物是聚合物例如蛋白質、肽或核酸。任選地,分析物是核酸。任選地,核酸具有小于ι個核苷酸/μ S的穿過通道的平均轉位速度。任選地,核酸具有小于0. 1個核苷酸/ μ s的穿過通道的轉位速度或平均轉位速度。核酸可以是ssDNA、dsDNA、RNA或其組合。本文中的實施方案可包括區分聚合物內的至少第一單元與聚合物內的至少第二單元。所述區分可包括測量第一和第二單元分別地轉位通過通道時產生的離子電流,以分別產生第一和第二電流模式,其中第一和第二電流模式彼此不同。本文中的任何實施方案還可包括測定聚合物的序列。測序可包括當聚合物的每一個單元分別轉位通過通道時測量離子電流模式或光信號,以提供與每一個單元關聯的電流模式,和將每一個電流模式與在相同條件下獲得的已知單元的電流模式相比較,以便測定聚合物的序列。本文中的任何實施方案還可包括測定分析物的濃度、大小、分子量、形狀或取向或其任何組合。本文中所述的任何液體介質例如導電液體介質可包含多種分析物。本文中描述的任何分析物可包括光學珠粒或磁性珠粒。本文中論述的任何Msp孔蛋白還可被進一步確定為突變的MspA孔蛋白。突變的 MspA孔蛋白可包括界定通道的前廳和縊縮區,和至少第一突變的MspA單體,其包含位置 93、位置91、位置90上的突變或其任何組合。突變的MspA孔蛋白可包含位置93和91、位置93和90上、位置91和90上或位置93、90和91上的突變。任選地,突變的MspA孔蛋白在下列氨基酸位置88、105、108、118、134或139的任何位置上的一個或多個突變或本文中描述的任何其他突變。在本文中的任何實施方案中,突變的MspA孔蛋白或突變的MspA旁系同源物或同系物的直徑可能小于相應的野生型MspA孔蛋白或野生型MspA旁系同源物或同系物的縊縮區的直徑。突變的MspA孔蛋白或突變的MspA旁系同源物或同系物可在前廳或縊縮區具有突變,所述突變允許分析物電泳轉位或以其他方式穿過突變的MspA孔蛋白或突變MspA旁系同源物或同系物的通道的轉位速度或平均轉位速度小于該分析物轉位通過野生型Msp 孔蛋白或野生型MspA旁系同源物或同系物的通道時的轉位速度或平均轉位速度。突變的Msp孔蛋白例如突變的MspA孔蛋白或突變的MspA旁系同源物或同系物孔蛋白可包含中性縊縮區。突變的Msp孔蛋白,例如突變的MspA孔蛋白或突變的MspA旁系同源物或同系物孔蛋白,其通過通道的電導可以比通過其相應的野生型Msp孔蛋白的通道的電導更高(例如高2倍)。突變的Msp孔蛋白(例如突變的MspA孔蛋白或突變的MspA 旁系同源物或突變的孔蛋白)可包括比通過其相應的野生型Msp孔蛋白的通道的電導更小的通過通道的電導。本文中論述的任何Msp孔蛋白可包含具有約2至約6nm的長度和約2至約6nm的直徑的前廳,和具有約0. 3至約3nm的長度和約0. 3至約3nm的直徑的縊縮區,其中所述前廳和縊縮區一起界定了通道。本文中還提供了突變的MspA孔蛋白,其包含具有約2至約6nm 的長度和約2至約6nm的直徑的前廳以及具有約0. 3至約3nm的長度和約0. 3至約3nm的直徑的縊縮區(其中所述前廳和縊縮區一起界定了通道),并且還包含至少第一突變MspA 旁系同源物或同系物單體。突變的Msp孔蛋白(例如突變的MspA孔蛋白或突變的MspA旁系同源物或同系物)的縊縮區的直徑可以小于其相應的野生型Msp孔蛋白(例如野生型MspA孔蛋白或野生型MspA旁系同源物或同系物)的縊縮區的直徑。突變的Msp孔蛋白(例如突變的MspA 孔蛋白或突變的MspA旁系同源物或同系物)可在前廳或縊縮區包含突變,所述突變允許分析物通過電泳或其他方式轉位通過孔蛋白的通道的轉位速度或平均轉位速度小于該分析物轉位通過其相應的野生型Msp孔蛋白(例如,野生型MspA孔蛋白、野生型MspA旁系同源物或同系物)的通道時的轉位速度或平均轉位速度。任選地,Msp孔蛋白完全或部分地由編碼部分或完整單鏈Msp孔蛋白的核酸序列編碼,其中核酸序列包含(a)第一和第二核苷酸序列,其中所述第一核苷酸序列編碼第一 Msp單體序列并且第二核苷酸序列編碼第二 Msp單體序列;和(b)編碼氨基酸連接體序列的第三核苷酸序列。單體序列可以是本文中描述的任何單體序列。任選地,所述第一和第二 Msp單體序列獨立地選自野生型MspA單體、野生型MspB單體、野生型MspC單體、野生型 MspD單體和其突變體。任選地,所述第一 Msp單體序列包含野生型MspA單體或其突變體。 任選地,所述第一 Msp單體序列包含突變的MspA單體。在本文中的任何實施方案中,Msp孔蛋白可完全或部分由編碼部分或完整單鏈 Msp孔蛋白的核酸序列編碼,其中所述核酸序列包含(a)第1、第2、第3、第4、第5、第6、第 7和第8核苷酸序列或其任何亞組(subset),其中所述第1、第2、第3、第4、第5、第6、第7 和第8核苷酸序列分別編碼第1、第2、第3、第4、第5、第6、第7和第SMsp單體序列;和(b) 編碼氨基酸連接體序列的第9核苷酸序列。因此,所述孔蛋白可包含與其他Msp單體或其他部分單鏈Msp孔蛋白雜交、二聚化、三聚化等的一個或多個部分單鏈Msp孔蛋白。可選擇地,完整單鏈Msp孔蛋白可形成孔蛋白而無需與其他Msp元件結合。在本文中的任何實施方案中,例如,Msp孔蛋白可由編碼完整單鏈Msp孔蛋白的核酸序列編碼,其中所述核酸序列包含(a)第1、第2、第3、第4、第5、第6、第7和第8核苷酸序列,其中所述第1、第2、第 3、第4、第5、第6、第7和第8核苷酸序列分別編碼第1、第2、第3、第4、第5、第6、第7和第 8Msp單體序歹Ij ;禾口 (b)
編碼氨基酸連接體序列的第9核苷酸序列。每一個Msp單體可包含野生型MspA 單體或其突變體。任選地,至少一個Msp單體包含野生型MspA單體或其突變體。因此,可完整地編碼孔蛋白。在本文中的任何實施方案中,Msp單體可以是野生型MspA旁系同源物或同系物, 例如 MspA/Msmeg0965、MspB/Msmeg0520、MspC/Msmeg5483、MspD/Msmeg6057、MppA> PorMl、 PorM2、PorMl、Mmcs4296、Mmcs4297、Mmcs3857、Mmcs4382、Mmcs4383、Mjls3843、Mjls3857、 Mjls3931 Mjls4674、Mjls4675、Mjls4677、Map3123c、Mav3943、Mvanl836、Mvan4117、 Mvan4839、Mvan4840、Mvan5016、Mvan5017、Mvan5768、MUL_2391、Mflvl734、Mflvl735、 Mflv2295、Mflvl89U MCH4691c、MCH4689c、MCH4690c、MAB1080, MAB1081、MAB2800、RHAl ro0856URHAl ro04074 和 RHAlro03127。本文中還提供了修飾通過Msp孔蛋白的通道的電導的方法,其包括在野生型Msp 孔蛋白的前廳或縊縮區中除去、添加或置換至少一個氨基酸。例如,所述方法可包括增加電導。所述方法可包括減小電導。還提供了包括使分析物轉位通過Msp孔蛋白的通道而不施加電場的方法。在該實施方案或本文中的任何其他實施方案中,Msp孔蛋白還可包含分子發動機。Msp孔蛋白可以是本文中描述的任何Msp孔蛋白,例如野生型MspA孔蛋白、突變的MspA孔蛋白、野生型 MspA旁系同源物或同系物孔蛋白以及突變的MspA旁系同源物或同系物孔蛋白。Msp孔蛋白可由編碼單鏈Msp孔蛋白的核酸序列編碼。還提供了包括具有界定通道的前廳和縊縮區的Msp孔蛋白的系統,其中所述通道位于第一液體介質與第二液體介質之間,其中至少一種液體介質包含分析物,并且其中所述系統對于檢測分析物的性質是有效的。系統可以對于檢測任何分析物的性質均是有效的,包括將Msp孔蛋白經受電場以便分析物與Msp孔蛋白相互作用。系統對于檢測分析物的性質是有效的,包括將Msp孔蛋白經受電場以便分析物通過電泳轉位通過Msp孔蛋白的通道。還提供了包括具有界定通道的前廳和縊縮區的Msp孔蛋白的系統,其中所述通道位于第一液體介質與第二液體介質之間的脂雙層中,并且其中第一和第二液體介質之間的液體連通的唯一的點存在于通道中。此外,本文中描述的任何Msp孔蛋白可以包含在本文中描述的任何系統中。第一和第二液體介質可以相同或不同,并且任一種或兩種液體介質可包含如下的一種或多種鹽、去垢劑或緩沖劑。事實上,本文中描述的任何液體介質可包含如下的一種或多種鹽、去垢劑或緩沖劑。任選地,至少一種液體介質是導電的。任選地,至少一種液體介質是不導電的。本文中描述的任何液體介質可包含改變粘性的物質或改變速率的物質。 液體介質可包含本文中描述的任何分析物。分析物的性質可以是電性質、化學性質或物理性質。Msp孔蛋白可包含在本文中描述的系統或任何其他實施方案中的脂雙層中。系統可包含多個Msp孔蛋白。系統可包含本文中描述的任何Msp孔蛋白,例如野生型MspA孔蛋白、突變的MspA 孔蛋白、野生型MspA旁系同源物或同系物孔蛋白或突變的MspA旁系同源物或同系物孔蛋白。任選地,Msp孔蛋白被進一步確定為突變的MspA孔蛋白。系統可包含含有界定通道的前廳和縊縮區的突變Msp孔蛋白和至少第一突變的MspA單體(其包含位置93上的突變和位置90、位置91或位置90及91上的突變)。包括在系統中的突變的Msp孔蛋白可包含具有約2至約6nm的長度和約2至約6nm的直徑的前廳,和具有約0. 3至約3nm的長度和約 0. 3至約3nm的直徑的縊縮區,其中所述前廳和縊縮區一起界定了通道。突變的MspA孔蛋白還可包含至少第一突變的MspA旁系同源物或同系物單體。包括在系統中的Msp孔蛋白可由編碼單鏈Msp孔蛋白的核酸序列編碼。包含在系統中的Msp孔蛋白還可包含分子發動機。本文中的系統或任何其他實施方案中的分子發動機可以能夠以這樣的轉位速度或平均轉位速度將分析物移入或穿過通道,所述轉位速度或平均轉位速度小于分析物在分子發動機不存在的情況下轉位入或通過通道時的轉位速度或平均轉位速度。本文中描述的任何系統還可包括膜片鉗放大器或數據獲取裝置。系統還可包括與第一液體介質、第二液體介質或兩者連通的一個或多個溫度調節裝置。本文中描述的任何系統對于使分析物通過電泳或其他方式轉位通過Msp孔蛋白通道是有效的。還提供了 Msp孔蛋白,其包含具有約2至約6nm的長度和約2至約6nm的直徑的前廳,和具有約0. 3至約3nm的長度和約0. 3至約3nm的直徑的縊縮區,其中所述前廳和縊縮區一起界定了通道。還提供了突變的Msp孔蛋白,其包含具有約2至約6nm的長度和約 2至約6nm的直徑的前廳,和具有約0. 3至約3nm的長度和約0. 3至約3nm的直徑的縊縮區,其中所述前廳和縊縮區一起界定了通道。還提供了突變的MspA孔蛋白,其包含具有約2 至約6nm的長度和約2至約6nm的直徑的前廳,和具有約0. 3至約3nm的長度和約0. 3至約3nm的直徑的縊縮區,其中所述前廳和縊縮區一起界定了通道。還提供了突變的MspA旁系同源物或同系物孔蛋白,其包含具有約2至約6nm的長度和約2至約6nm的直徑的前廳, 和具有約0. 3至約3nm的長度和約0. 3至約3nm的直徑的縊縮區,其中所述前廳和縊縮區一起界定了通道。本文中描述的任何突變的MspA旁系同源物或同系物還可包含至少第一突變的MspA旁系同源物或同系物單體。還提供了突變的MspA孔蛋白,其包含具有約2至約6nm的長度和約2至約6nm的直徑的前廳,和具有約0. 3至約3nm的長度和約0. 3至約 3nm的直徑的縊縮區,其中所述前廳和縊縮區一起界定了通道,并且還包含至少第一突變的 MspA旁系同源物或同系物單體。這些孔蛋白的任一個可用于本文中的任何實施方案。還提供了突變的MspA孔蛋白,其包含界定通道的前廳和縊縮區,和至少第一突變的MspA單體(其包含位置93上的突變和位置90、位置91或位置90及91上的突變)。該突變的MspA孔蛋白和本文中描述的任何其他突變的Msp孔蛋白或MspA孔蛋白可用于本文中描述的任何實施方案。突變的MspA孔蛋白可包含位置93和90上的突變。突變的MspA 孔蛋白可包含位置93和91上的突變。突變的MspA孔蛋白可包含位置93、91和90上的突變。突變的MspA孔蛋白可包含本文中描述的任何其他突變。突變的MspA孔蛋白的縊縮區的直徑可以小于相應的野生型MspA孔蛋白的縊縮區的直徑。MspA孔蛋白可在前廳或縊縮區中具有突變,所述突變允許分析物以這樣的轉位速度或平均轉位速度通過電泳或其他方式轉位通過突變體的通道,所述轉位速度或平均轉位速度小于分析物轉位通過野生型Msp孔蛋白的通道時的轉位速度或平均轉位速度。MspA 孔蛋白可在前廳或縊縮區中具有突變,所述突變允許分析物例如以小于0. 5nm/ys或小于 0. 05nm/ys的平均轉位速度通過電泳轉位通過通道。分析物可選自核苷酸、核酸、氨基酸、
23肽、蛋白質、聚合物、藥物、離子、生物戰劑、污染物、納米級物體或其組合或聚簇。任選地,分析物被進一步確定為核酸。核酸可以以小于1個核苷酸/ μ S或小于0. 1個核苷酸/ μ S的平均轉位速度通過電泳或其他方式轉位通過通道。核酸可被進一步確定為ssDNA、dsDNA、 RNA或其組合。本文中的任何實施方案中的分析物還可包括磁性珠粒。磁性珠粒可被進一步確定為鏈霉抗生物素蛋白包被的磁性珠粒。分析物還可包括光學珠粒。本文中描述的任何分析物可以是離子或可以是中性的。分析物可包括生物素。本文中描述的任何Msp孔蛋白,例如突變的MspA孔蛋白,可包含2至15個相同或不同的Msp單體。任選地,Msp孔蛋白,例如突變的MspA孔蛋白,包含為相同或不同的7至 9個Msp單體。任選地,至少第二單體選自野生型MspA單體、第二突變的MspA單體、野生型MspA旁系同源物或同系物單體以及突變的MspA旁系同源物或同系物單體,其中所述第二突變的MspA單體可以與所述第一突變的MspA單體相同或不同。任選地,所述第二單體是野生型MspA旁系同源物或同系物單體。野生型MspA旁系同源物或同系物單體可以是野生型MspB單體。MspA單體可在任何下列氨基酸位置88、105、108、118、1;34或139上包含一個或多個突變。MspA單體可包含一個或多個下列突變L88W、D90K/N/Q/R、D91N/Q、D93N、 I105W、N108W、D118R、D134R或E139K。MspA 單體可包含下列突變:D90N/D91N/D93N。MspA 單體可包含下列突變D90N/D91N/D93N/D118R/Di;34R/E139K。MspA單體可包含下列突變 D90Q/D91Q/D93N。MspA 單體可包含下列突變D90Q/D91Q/D93N/D118R/D134R/E139K MspA 單體可包含下列突變D90(K,R)/D91N/D93N。MspA單體可包含下列突變(L88,1105)W/ D91Q/D93N。MspA單體可包含下列突變I105W/m08W。此外,MspA單體可包含本文中描述的任何其他突變。在本文中的任何實施方案中,突變的Msp孔蛋白,例如突變的MspA孔蛋白或突變的MspA旁系同源物或同系物,與野生型Msp孔蛋白的前廳或縊縮區相比較,可分別包含至少一個額外的帶正電荷的氨基酸;與野生型MspA孔蛋白的前廳或縊縮區相比較,可分別包含至少一個額外的帶負電荷的氨基酸;與野生型MspA孔蛋白的前廳或縊縮區相比較,可分別少包含至少一個帶正電荷的氨基酸;或與野生型MspA孔蛋白的前廳或縊縮區相比較,可分別少包含至少一個帶負電荷的氨基酸。任選地,可用帶負電荷的氨基酸置換野生型Msp孔蛋白的前廳和縊縮區中每一個帶正電荷的氨基酸,并且每一個帶負電荷的氨基酸是相同的或不同的;或野生型Msp孔蛋白的前廳和縊縮區中每一個帶負電荷的氨基酸可用帶正電荷的氨基酸置換,并且每一個帶正電荷的氨基酸是相同的或不同的。任選地,突變的Msp孔蛋白的前廳或縊縮區分別包含比野生型Msp孔蛋白的前廳或縊縮區的帶正電荷殘基更大量的帶正電荷殘基;或者前廳或縊縮區分別包含比野生型 Msp孔蛋白的前廳或縊縮區的帶負電荷殘基更大量的帶負電荷殘基;或者野生型Msp孔蛋白(例如野生型MspA孔蛋白或野生型MspA旁系同源物或同系物孔蛋白)的前廳或縊縮區中至少一個帶正電荷的氨基酸缺失或被帶負電荷的氨基酸置換;或者野生型Msp孔蛋白的前廳或縊縮區中至少一個帶負電荷的氨基酸缺失或被帶正電荷的氨基酸置換。野生型Msp孔蛋白(例如野生型MspA孔蛋白或野生型MspA旁系同源物或同系物孔蛋白)的前廳或縊縮區中至少一個氨基酸可被具有空間上更大的側鏈的氨基酸、具有空間上更小的側鏈的氨基酸、具有更大極性的側鏈的氨基酸、具有更小極性的側鏈的氨基酸或具有更大疏水性的側鏈的氨基酸、具有更小疏水性的側鏈的氨基酸置換。在本文中的任何實施方案中,突變的Msp孔蛋白的前廳或縊縮區中至少一個氨基酸可包括非天然氨基酸或化學修飾的氨基酸。本文中描述的任何Msp孔蛋白可包含一個或多個周質環的缺失、添加或置換。如本文中所描述的,任何Msp孔蛋白例如突變的MspA孔蛋白還可包含分子發動機。本文中描述的任何分子發動機可以能夠以這樣的轉位速度或平均轉位速度將分析物移入或通過通道,所述轉位速度或平均轉位速度小于分析物在分子發動機不存在的情況下轉位進入或穿過通道時的轉位速度或平均轉位速度。在本文中的任何實施方案中,分子發動機可以是酶,例如聚合酶、外切核酸酶或Klenow片段。還提供了產生本文中描述的Msp孔蛋白的方法。因此,提供了產生包含至少一個突變MspA單體的突變MspA孔蛋白的方法,所述方法包括在位置93和位置90、位置91或位置90及91上修飾野生型MspA單體的方法。該方法可包括在位置93和90上修飾野生型 MspA單體。該方法可包括在位置93和91上修飾野生型MspA單體。該方法可包括在位置 93,91和90上修飾野生型MspA單體。該方法可包括進一步地或可變通地在下列位置88、 105、108、118、134或139的任何一個或多個位置上修飾野生型MspA單體,或進行本文中描述的任何其他修飾。可由本文中描述的方法產生的突變MspA孔蛋白可包括本文中描述的任何突變或孔蛋白性質。例如,突變MspA可包括中性縊縮區。突變MspA孔蛋白還可包括至少一個Msp單體,例如野生型MspA單體、突變的MspA單體、野生型MspA旁系同源物或同系物或第二突變的MspA旁系同源物或同系物單體。突變的MspA孔蛋白的通過通道的電導可比其相應的野生型MspA孔蛋白的通過通道的電導更高,例如高1倍。本文中描述的任何突變Msp孔蛋白,例如突變的MspA孔蛋白或突變的MspA旁系同源物或同系物孔蛋白,可包含一個或多個突變的MspB、突變的MspC或突變的MspD單體或其組合。還提供了產生具有界定通道的前廳和縊縮區的突變MspA孔蛋白的方法,包括缺失、添加或置換野生型MspA旁系同源物或同系物單體的前廳和縊縮區內的任何氨基酸,以便所得的突變MspA孔蛋白能夠在施加電場后使分析物轉位通過通道。該突變的MspA孔蛋白可以是本文中描述的任何類型。還提供了編碼本文中描述的Msp孔蛋白的核酸序列。例如,提供了編碼突變MspA 孔蛋白或者突變MspA旁系同源物或同系物的核酸序列。還涉及包含本文中描述的核酸序列的載體,例如包含編碼突變MspA孔蛋白或突變MspA旁系同源物或同系物的核酸序列的載體。本文中描述的任何載體還可包含啟動子序列。本文中描述的任何載體還可包含組成型啟動子。組成型啟動子可包括Psmy。啟動子。啟動子可包括誘導型啟動子。誘導型啟動子可包括乙酰胺誘導型啟動子。還提供了用本文中描述的任何載體轉染的培養細胞,或其后代,其中所述細胞能夠表達Msp孔蛋,白例如突變的MspA孔蛋白或突變的MspA旁系同源物或同系物。還提供了包含本文中描述的任何載體的恥垢分枝桿菌菌株。還涉及不含內源孔蛋白的恥垢分枝桿菌菌株,其可包含本文中描述的任何載體。“不含”意指當使用適當的 Msp-特異性抗血清時不能在免疫印跡上檢測到內源孔蛋白,或包含少于的內源孔蛋
25白。還提供了包含編碼野生型Msp單體的核酸序列的載體,其中所述核酸序列有效地受誘導型啟動子控制。載體可以是整合載體。還提供了用該載體轉染的培養細胞或其后代, 其中所述細胞能夠表達野生型Msp孔蛋白。還涉及包含該載體的恥垢分枝桿菌菌株。還提供了編碼本文中描述的部分或完整單鏈Msp孔蛋白的核酸序列。所述核酸序列可包括例如(a)第一和第二核苷酸序列,其中所述第一核苷酸序列編碼第一Msp單體序列并且第二核苷酸序列編碼第二 Msp單體序列;和(b)編碼氨基酸連接體序列的第三核苷酸序列。所述第一和第二 Msp單體序列可獨立地選自野生型MspA單體、突變的MspA單體、 野生型MspA旁系同源物或同系物單體以及突變的MspA旁系同源物或同系物單體。所述第
一Msp單體序列包含野生型MspA單體或其突變體。任選地,所述第一 Msp單體序列包含突變的MspA單體。所述第一 Msp單體序列可包含一個或多個突變,所述突變選自氨基酸138 上的A至P置換、氨基酸139上的E至A或K置換、氨基酸90上的D至K或R或Q置換、氨基酸91上的D至N或Q置換、氨基酸93上的D至N置換、氨基酸88上的L至W置換、氨基酸105上的I至W置換、氨基酸108上的N至W置換、氨基酸118上的D至R置換和氨基酸 134上的D至R置換。事實上,本文中描述的任何Msp單體可包含任何此類置換。任選地,所述突變的MspA單體包含氨基酸138上的A至P置換、氨基酸139上的E 至A置換或其組合;氨基酸90上的D至K或R置換、氨基酸91上的D至N置換、氨基酸93 上的D至N置換或其任何組合;氨基酸90上的D至Q置換、氨基酸91上的D至Q置換、氨基酸93上的D至N置換或其任何組合;氨基酸88上的L至W置換、氨基酸105上的I至W 置換、氨基酸91上的D至Q置換、氨基酸93上的D至N置換或其任何組合;氨基酸105上的I至W置換、氨基酸108上的N至W置換或其組合;或氨基酸118上的D至R置換、氨基酸139上的E至K置換、氨基酸134上的D至R置換或其任何組合。任何Msp孔蛋白可包含第一、第二或更多Msp單體序列,包括野生型MspA旁系同源物或其突變體,其中旁系同源物或其突變體是野生型MspB單體或其突變體。一個或多個 Msp單體序列可包含SEQID NO :1、SEQ ID NO 2或其組合。任選地,第二 Msp單體序列包括突變的MspB單體。任選地,第一 Msp單體序列包括野生型MspA單體或其突變體并且第
二Msp單體序列包括野生型MspB單體或其突變體。任選地,第一 Msp單體序列包含SEQ ID NO 1并且第二 Msp單體序列包含SEQ ID NO :2。本文中描述了氨基酸連接體序列。在本文中的任何實施方案中,氨基酸連接體序列可以例如包含10至20個氨基酸。例如,氨基酸連接體包含15個氨基酸。任選地,氨基酸連接體序列包括(GGGGQ3 (SEQ ID NO 3)肽序列。本發明還涵蓋由本文中描述的任何核酸序列編碼的多肽。還提供了編碼部分或完整單鏈Msp孔蛋白的核酸序列,其中所述核酸序列包含 (a)第1、第2、第3、第4、第5、第6、第7和第8核苷酸序列或其任何亞組,其中所述第1、第 2、第3、第4、第5、第6、第7和第8核苷酸序列分別編碼第1、第2、第3、第4、第5、第6、第 7和第SMsp單體序列;和(b)編碼氨基酸連接體序列的第9核苷酸序列。第一和第二 Msp 單體序列可獨立地選自野生型Msp單體、突變的Msp單體、野生型MspA旁系同源物或同系物單體以及突變MspA旁系同源物或同系物單體。各Msp單體可包含野生型MspA單體或其突變體。任選地,至少一個Msp單體包含野生型MspA單體或其突變體。任選地,至少一個Msp單體包括突變的MspA單體。突變的Msp單體序列可包含本文中描述的任何突變。例如,一個或多個所述突變選自氨基酸138上的A至P置換、氨基酸139上的E至A或K置換、氨基酸90上的D至K或R或Q置換、氨基酸91上的D至N或Q置換、氨基酸93上的D 至N置換、氨基酸88上的L至W置換、氨基酸105上的I至W置換、氨基酸108上的N至W 置換、氨基酸118上的D至R置換和氨基酸1;34上的D至R置換。每一個Msp單體序列可包含SEQ ID NO :1。任選地,至少一個Msp單體序列包含SEQ ID NO :1。任選地,至少一個 Msp單體序列包含野生型MspA旁系同源物或其突變體,其中所述MspA旁系同源物或其突變體是野生型MspB單體或其突變體。任選地,至少一個Msp單體序列包含SEQ ID NO :2。 任選地,至少一個Msp單體序列包含突變的MspB單體。任選地,至少一個Msp單體序列包含野生型MspA單體或其突變體并且至少一個Msp單體序列包含野生型MspB單體或其突變體。任選地,至少一個Msp單體序列包含EQ ID NO 1并且至少一個Msp單體序列包含SEQ ID NO :2。還提供了由前述核酸序列的任一個編碼的多肽。還提供了包含任何前述核酸序列的載體。所述載體還可包含啟動子序列。所述啟動子可包括組成型啟動子。該組成型啟動子可包括Psmy。啟動子。該啟動子可包括誘導型啟動子。該誘導型啟動子可包括乙酰胺誘導型啟動子。還提供了能夠誘導型表達Msp的突變的細菌菌株,所述細菌菌株包含(a)野生型 MspA的缺失;(b)野生型MspC的缺失;(c)野生型MspD的缺失;和(d)包含有效地連接于 Msp單體核酸序列的誘導型啟動子的載體。該細菌菌株還可包括恥垢分枝桿菌菌株ML16。 Msp核酸可編碼野生型MspA單體或野生型MspA旁系同源物或同系物單體。Msp核酸可編碼選自野生型MspA單體、野生型MspC單體和野生型MspD單體的Msp單體。任選地,Msp核酸編碼野生型MspA單體。誘導型啟動子可包含乙酰胺誘導型啟動子。所述細菌菌株還可包含野生型MspB的缺失。細菌菌株還可包含本文中描述的載體,例如包含有效地連接于編碼Msp孔蛋白或單體的核酸序列的組成型啟動子的載體。Msp可以是野生型MspA孔蛋白或單體或者野生型MspA旁系同源物或同系物孔蛋白或單體。Msp孔蛋白或單體可選自野生型MspA孔蛋白或單體、野生型MspB孔蛋白或單體、野生型MspC孔蛋白或單體以及野生型 MspD孔蛋白或單體。任選地,Msp孔蛋白或單體是野生型MspA孔蛋白或單體。細菌菌株還可包含含有編碼完整或部分單鏈Msp孔蛋白的核酸的載體,其中所述核酸包含(a)第一和第二核苷酸序列,其中所述第一核苷酸序列編碼第一Msp單體序列并且第二核苷酸序列編碼第二 Msp單體序列;和(b)編碼氨基酸連接體序列的第三核苷酸序列。細菌菌株還可包含含有編碼完整或部分單鏈Msp孔蛋白的核酸的載體,其中所述核酸包含(a)第1、第2、第3、第4、第5、第6、第7和第8核苷酸序列或其任何亞組,其中所述第1、第2、第3、第4、第5、第6、第7和第8核苷酸序列分別編碼第1、第2、第3、第4、第5、 第6、第7和第SMsp單體序列;和(b)編碼氨基酸連接體序列的第9核苷酸序列。還提供了產生完整或部分單鏈Msp孔蛋白的方法,所述方法包括(a)用含有能夠編碼完整或部分單鏈Msp孔蛋白的核酸序列的載體轉化本文中描述的細菌菌株;和(b)從細菌純化完整或部分單鏈Msp孔蛋白。所述載體可包含編碼完整或部分單鏈Msp孔蛋白的核酸序列,其中所述核酸序列包含(a)第一和第二核苷酸序列,其中所述第一核苷酸序列編碼第一 Msp單體序列并且第二核苷酸序列編碼第二 Msp單體序列;和(b)編碼氨基酸連接體序列的第三核苷酸序列。所述載體可包含編碼完整或部分單鏈Msp孔蛋白的核酸序列,其中所述核酸序列包含(a)第1、第2、第3、第4、第5、第6、第7和第8核苷酸序列或其任意亞組,其中所述第1、第2、第3、第4、第5、第6、第7和第8核苷酸序列分別編碼第1、 第2、第3、第4、第5、第6、第7和第SMsp單體序列;和(b)編碼氨基酸連接體序列的第9 核苷酸序列。Msp單體序列可獨立地選自野生型MspA單體、突變的MspA單體、野生型MspA 旁系同源物或同系物單體以及突變的MspA旁系同源物或同系物單體。例如,Msp單體序列是野生型MspA單體。“恥垢分枝桿菌孔蛋白(Msp)"或"Msp孔蛋白"是指由兩個或更多個Msp單體組成的多聚體復合物。Msp單體由恥垢分枝桿菌中的基因編碼。恥垢分枝桿菌具有4個已鑒定的Msp基因,稱為MspA、MspB、MspC和MspD。Msp孔蛋白可以例如由野生型MspA單體、 突變的MspA單體、野生型MspA旁系同源物或同系物單體、或突變的MspA旁系同源物或同系物單體組成。任選地,Msp孔蛋白是單鏈Msp孔蛋白或是若干單鏈Msp孔蛋白的多聚體。 單鏈Msp孔蛋白可以例如包括由兩個或更多個Msp單體(例如,8個單體)通過一個或多個氨基酸連接體肽連接的多聚體。部分單鏈Msp孔蛋白是指必需二聚化、三聚化等來形成孔蛋白的單鏈多聚體復合物。完全單鏈Msp孔蛋白是指形成孔蛋白而無需二聚化、三聚化等以形成孔蛋白的單鏈多聚體復合物。本文中任何實施方案中的Msp孔蛋白可以是本文中描述的任何Msp孔蛋白,例如野生型MspA孔蛋白、突變的MspA孔蛋白、野生型MspA旁系同源物或同系物孔蛋白或者突變的MspA旁系同源物或同系物孔蛋白。Msp孔蛋白可以由編碼單鏈Msp孔蛋白的核酸序列編碼。此處的任何Msp孔蛋白可包含本文中描述的任何Msp單體,例如突變的Msp單體。營養物在分枝桿菌(mycobacteria)中通過野生型孔蛋白。野生型MspA孔蛋白、 野生型MspB孔蛋白、野生型MspC孔蛋白和野生型MspD孔蛋白是野生型通道形成孔蛋白的實例。Msp孔蛋白可被進一步確定為本文中描述的任何Msp孔蛋白,包括旁系同源物、同系物、突變體和單鏈孔蛋白。“突變的MspA孔蛋白〃是與其相應的野生型MspA孔蛋白具有至少或至多70、75、 80、85、90、95、98或99%或更多、或可來自其間的任何范圍、但小于100%的同一性并且保持通道形成能力的多聚體復合物。突變的MspA孔蛋白可以是重組蛋白質。任選地,突變的 MspA孔蛋白是在野生型MspA孔蛋白的縊縮區或前廳具有突變的孔蛋白。任選地,突變可存在于野生型MspA孔蛋白的周質環的邊緣或外部。突變的MspA孔蛋白可用于本文中描述的任何實施方案。表1中提供了示例性野生型MspA旁系同源物和同源物。提供了野生型MspA旁系同源物,其包括野生型MspB、野生型MspC和野生型MspD。“旁系同源物”,如本文中定義的, 是來自相同細菌種類的具有相似結構和功能的基因。“同源物",如本文中定義的,是來自另一細菌種類的具有相似結構和進化來源的基因。例如,提供了野生型MspA同源物,其包括 MppA> PorMl、PorM2、PorMl 禾口 Mmcs4296。“突變的MspA旁系同源物或同系物孔蛋白"是與其相應的野生型MspA旁系同源物或同系物孔蛋白具有至少或至多70、75、80、85、90、95、98或99%或更多、或來自其間的任何范圍、但小于100%的同一性并且保持通道形成能力的多聚復合物。突變的MspA旁系同源物或同系物孔蛋白可以是重組蛋白質。任選地,突變的MspA旁系同源物或同系物孔蛋白是在野生型MspA旁系同源物或同系物孔蛋白的縊縮區或前廳中具有突變的孔蛋白。任選地,突變可存在于野生型MspA旁系同源物或同系物孔蛋白的周質環的邊緣或外部。任何突變的MspA旁系同源物或同系物孔蛋白可用于本文中描述的任何實施方案,并且可包含本文中描述的任何突變。Msp孔蛋白可包含兩個或更多個Msp單體。‘‘Msp單體〃是為野生型MspA單體、 突變的MspA單體、野生型MspA旁系同源物或同系物單體或者突變的MspA旁系同源物或同系物單體的蛋白質單體,并且當與一個或多個其他Msp單體結合時保持通道形成能力。本文中描述的任何Msp孔蛋白可包含一個或多個本文中描述的任何Msp單體。任何Msp孔蛋白可以包含例如2至15個Msp單體,其中每一個單體可以是相同的或不同的。“突變的MspA單體〃是指與野生型MspA單體具有至少或至多70、75、80、85、90、 95、98或99%或更多、或可來自其間的任何范圍、但小于100%的同一性并且當與一個或多個其他Msp單體結合時保持形成通道的能力的Msp單體。任選地,突變的MspA單體被進一步確定為在促進完全形成的通道形成孔蛋白的前廳或縊縮區的形成的序列部分中包含突變。突變的Msp單體可以是例如重組蛋白。突變的MspA單體可包含本文中描述的任何突變。“突變的MspA旁系同源物或同系物單體“是指與野生型MspA旁系同源物或同系物單體具有至少或至多70、75、80、85、90、95、98或99%或更多,或可來自其間的任何范圍, 但小于100%的同一性并且保持通道形成能力的MspA旁系同源物或同系物單體。任選地, 突變的MspA旁系同源物或同系物單體被進一步確定為在序列的該部分包含突變,所述部分促進完全形成的通道形成孔蛋白的前廳和/或縊縮區的形成。突變的MspA旁系同源物或同系物單體可以例如是重組蛋白質。任何突變的MspA旁系同源物或同系物單體可以任選地用于本文中的任何實施方案。Msp孔蛋白可表達為兩個或更多個野生型MspA單體、突變的MspA單體、野生型 MspA旁系同源物或同系物單體或突變的MspA旁系同源物或同系物單體的組合。這樣,Msp 孔蛋白可以是或可包括二聚體、三聚體、四聚體、五聚體、六聚體、七聚體、八聚體、九聚體等。例如,Msp孔蛋白可包括野生型MspA單體和野生型MspB單體的組合。Msp孔蛋白可包括1至15個單體,其中每一個單體是相同的或不同的。事實上,本文中描述的任何Msp孔蛋白可包含至少或至多1、2、3、4、5、6、7、8、9、10、11、12、13、14或15個或可來自其間的任何范圍內的個數的單體,其中每一個單體是相同的或不同的。例如,Msp孔蛋白可包含一個或多個相同的或不同的突變MspA單體。作為另一個實例,Msp孔蛋白可包含至少一個突變的 MspA單體和至少一個MspA旁系同源物或同系物單體。如上文中定義的,單鏈Msp孔蛋白包含兩個或更多個通過一個或多個氨基酸連接體肽連接的Msp單體。包含2個Msp單體的單鏈Msp孔蛋白(其中所述Msp單體由氨基酸連接體序列連接)可稱為單鏈Msp孔蛋白二聚體。包含8個Msp單體(其中所述Msp單體由氨基酸連接體序列連接)的單鏈Msp孔蛋白可稱為單鏈Msp孔蛋白八聚體。單鏈Msp孔蛋白可包含通過氨基酸連接體序列連接的2、3、4、5、6、7、8、9、10、11、12、13、14、15或更多個Msp單體或可來自其間的任何范圍內的Msp單體。任選地,單鏈Msp孔蛋白可以例如包括兩個或更多個單鏈Msp孔蛋白二聚體、兩個或更多個單鏈Msp孔蛋白三聚體、兩個或更多個單鏈Msp孔蛋白四聚體、兩個或更多個單鏈Msp孔蛋白五聚體、一個或多個單鏈Msp孔蛋白六聚體、一個或多個單鏈Msp孔蛋白七聚體、一個或多單鏈Msp孔蛋白八聚體或其組合。例
29如,單鏈Msp孔蛋白可包括一個單鏈Msp孔蛋白二聚體和兩個單鏈Msp孔蛋白三聚體。作為另一個實例,單鏈Msp孔蛋白可包括一個單鏈Msp孔蛋白四聚體和兩個單鏈Msp孔蛋白
二聚體。野生型單鏈Msp孔蛋白由野生型Msp單體組成。任選地,單鏈Msp孔蛋白中的一個或多個突變存在于單鏈Msp孔蛋白的前廳或縊縮區中。突變的單鏈Msp孔蛋白例如與野生型單鏈Msp相比較在周質環、前廳或縊縮區的氨基酸序列中具有至少一個突變(例如,缺失、置換或添加)。單鏈的多聚體也可形成孔蛋白,其中每一個單鏈包括2、3、4、5、6、7或更多個Msp單體。本文中提供了編碼Msp單體序列和其突變體的核酸序列。對于上文列出的突變的 MspA單體序列,參照MspA序列是成熟野生型MspA單體序列(SEQ ID NO :1)。本文中提供的核酸序列中的每一個核苷酸序列可以例如包含突變的MspA單體序列。表7中提供了突變的MspA序列的非限制性實例。任選地,突變的MspA包含氨基酸138上的A至P置換、氨基酸139上的E至A置換或其組合。任選地,突變的MspA包含氨基酸90上的D至K或R 置換、氨基酸91上的D至N置換、氨基酸93上的D至N置換或其任何組合。任選地,突變的MspA包含氨基酸90上的D至Q的置換、氨基酸91上的D至Q的置換、氨基酸93上的D 至N的置換或其任何組合。任選地,突變的MspA包含氨基酸88上的L至W的置換、氨基酸 105上的I至W的置換、氨基酸91上的D至Q的置換、氨基酸93上的D至N的置換或其任何組合。任選地,突變的MspA包含氨基酸105上的I至W的置換、氨基酸108上的N至W的置換或其組合;任選地,突變的MspA包含氨基酸118上的D至R的置換、氨基酸139上的E 至K的置換、氨基酸134上的D至R的置換或其任何組合。對于下面所列的突變的MspB單體序列,參照MspB序列是成熟野生型MspB單體序列(SEQID NO :2)。任選地,突變的MspB 包含氨基酸90上的D至K或R的置換、氨基酸91上的D至N的置換、氨基酸93上的D至 N的置換或其任何組合。本文中論述的野生型Msp單體的序列在萬維網上公開于位于pubmed. gov的 GenBank中,并且這類序列和其他序列以及其中包含的各個亞序列或片段以其全文通過引用合并入本文。例如,野生型MspA單體的核苷酸和氨基酸序列可分別見于GenBank登錄號 AJ001442和CAB56052。野生型MspB單體的核苷酸和氨基酸序列可以例如分別見于GenBank 登錄號NC 008596. 1(從核苷酸600086至600730)和YP 884932. 1。野生型MspC單體的核苷酸和氨基酸序列可以例如分別見于GenBank登錄號AE99735和CAC82509。野生型MspD 單體的核苷酸和氨基酸序列可以例如分別見于GenBank登錄號AJ300774和CAC836^。因此提供了 MspA、MSpB、MSpC和MspD單體的核苷酸序列,所述核苷酸包含與前述核苷酸GenBank 登錄號的核苷酸序列至少約70、75、80、85、90、95、98、99%或更大、或可來自其間的任何范圍內的同一性的核苷酸序列。還提供了 MspA、MspB, MspC和MspD單體的氨基酸序列(圖 18),所述序列包含與前述氨基酸序列GenBank登錄號的序列至少約70、75、80、85、90、95、 98、99%或更大或可來自其間的任何范圍內的同一性的氨基酸序列。還提供了 MspA旁系同源物和同源單體的氨基酸序列,所述MspA旁系同源物和同源單體包含與野生型MspA旁系同源物或是同源單體至少約70、75、80、85、90、95、98、99% 或更大,或可來源于其的任何范圍內的同一性的氨基酸序列。野生型MspA旁系同源物和同源單體在本領域內是公知的。表1提供了這類旁系同源物和同源物的非限定性列表
表1.野生型MspA和野生型MspA旁系同源物和同源單體
權利要求
1.包括對具有界定通道的前廳和縊縮區的恥垢分枝桿菌孔蛋白(Msp)施加電場的方法,其中Msp孔蛋白位于第一導電液體介質與第二導電液體介質之間。
2.權利要求1的方法,其中所述Msp孔蛋白選自野生型MspA孔蛋白、突變MspA孔蛋白、野生型MspA旁系同源物或同系物孔蛋白和突變MspA旁系同源物或同系物孔蛋白。
3.權利要求1或權利要求2的方法,其中所述Msp孔蛋白還包括分子發動機,其中所述分子發動機能夠以這樣的平均轉位速度將分析物移入或穿過通道,所述平均轉位速度小于分析物在分子發動機不存在的情況下通過電泳轉位入或穿過通道時的平均轉位速度。
4.權利要求1至3之一中的方法,其中至少一種導電液體介質包含分析物。
5.權利要求3或權利要求4的方法,其還包括在方法中檢測分析物,所述方法包括當分析物與通道相互作用時測量離子電流以提供電流模式,其中電流模式中阻塞的出現標示著分析物的存在。
6.權利要求3至5之一中的方法,其中施加電場足以引起分析物穿過電泳轉移通過通道。
7.權利要求3至6之一中的方法,其中所述Msp孔蛋白是突變MspA或者突變MspA旁系同源物或同系物孔蛋白,并且分析物穿過通道的平均轉位速度小于分析物穿過野生型MspA 或者野生型MspA旁系同源物或同系物孔蛋白的通道的平均轉位速度。
8.權利要求3至6之一中的方法,其中所述Msp孔蛋白是突變MspA或者突變MspA旁系同源物或同系物孔蛋白,并且分析物穿過通道的平均轉位速度大于分析物穿過野生型MspA 或者野生型MspA旁系同源物或同系物孔蛋白的通道的平均轉位速度。
9.權利要求3至8之一中的方法,其中分析物穿過通道的平均轉位速度小于0.5nm/μ S。
10.權利要求3至9之一中的方法,其還包括鑒定分析物。
11.權利要求10的方法,其中鑒定分析物包括將電流模式與在相同的條件下使用已知的分析物獲得的已知電流模式相比較。
12.權利要求3至11之一中的方法,其中分析物是核苷酸、核酸、氨基酸、肽、蛋白質、聚合物、藥物、離子、污染物、納米級物體或生物戰劑。
13.權利要求3至12之一中的方法,其中分析物是聚合物。
14.權利要求13的方法,其中聚合物是蛋白質、肽或核酸。
15.權利要求14的方法,其中聚合物是核酸。
16.權利要求15的方法,其中核酸穿過通道的平均轉位速度小于1個核苷酸/P S。
17.權利要求15或權利要求16的方法,其中核酸是ssDNA、dsDNA、RNA或其組合。
18.權利要求13至17之一中的方法,其還包括區分聚合物內的至少第一單元與聚合物內的至少第二單元,所述區分包括測量當第一和第二單元分別地轉位通過通道時產生的離子電流,以分別產生第一和第二電流模式,其中第一和第二電流模式彼此不同。
19.權利要求13至18之一中的方法,其還包括測定聚合物的序列。
20.權利要求19的方法,其中測序包括當聚合物的每一個單元分別地轉位通過通道時測量離子電流或光信號,以提供與每一個單元關聯的電流模式,和將每一個電流模式與在相同條件下獲得的已知單元的電流模式相比較,以便測定聚合物的序列。
21.權利要求3至20之一中的方法,其還包括測定分析物的濃度、大小、分子量、形狀或取向或其任何組合。
22.權利要求1至21之一中的方法,其中至少一種導電液體介質包含多種分析物。
23.權利要求1至22之一中的方法,其中所述Msp孔蛋白被進一步確定為突變MspA孔蛋白。
24.權利要求23的方法,其中所述突變MspA孔蛋白包包含界定通道的前廳和縊縮區,和至少第一突變MspA單體,其包含位置93上的突變和位置90、位置91上的突變或位置 90及91上的突變。
25.權利要求23或權利要求24的方法,其中突變MspA孔蛋白的縊縮區的直徑小于野生型MspA孔蛋白的縊縮區的直徑。
26.權利要求23至25之一中的方法,其中所述突變MspA孔蛋白在前廳或縊縮區中包含突變,所述突變允許分析物通過電泳轉位通過突變體的通道的平均轉位速度小于分析物通過電泳轉位通過野生型MspA孔蛋白的通道的平均轉位速度。
27.權利要求24至26之一中的方法,其中所述第一突變MspA單體還在下列氨基酸位置88、105、108、118、134或139的任何位置上包含一個或多個突變。
28.權利要求23至27之一中的方法,其中所述突變MspA孔蛋白包含中性縊縮區。
29.權利要求23至28之一中的方法,其中通過突變MspA孔蛋白的通道的電導高于通過其相應的野生型MspA孔蛋白的通道的電導。
30.權利要求23的方法,其中所述突變MspA孔蛋白包含具有約2至約6nm的長度和約2至約6nm的直徑的前廳,和具有約0. 3至約3nm的長度和約0. 3至約3nm的直徑的縊縮區,其中所述前廳和縊縮區一起界定了通道,和還包含至少第一突變MspA旁系同源物或同系物單體。
31.權利要求30的方法,其中突變MspA孔蛋白的縊縮區的直徑小于其相應的野生型 MspA孔蛋白的縊縮區的直徑。
32.權利要求30或權利要求31的方法,其中所述突變MspA孔蛋白在前廳或縊縮區包含突變,所述突變允許分析物通過電泳轉位通過突變體的通道的平均轉位速度小于分析物通過電泳轉位通過其相應的野生型MspA孔蛋白的通道的平均轉位速度。
33.權利要求30至32之一中的方法,其中通過突變MspA孔蛋白的通道的電導高于通過其相應的野生型MspA孔蛋白的通道的電導。
34.權利要求1、3至6或9至22之一中的方法,其中所述Msp孔蛋白被進一步確定為這樣的Msp孔蛋白,其包含具有約2至約6nm的長度和約2至約6nm的直徑的前廳,和具有約0. 3至約3nm的長度和約0. 3至約3nm的直徑的縊縮區,其中所述前廳和縊縮區一起界定了通道。
35.權利要求1、3至6或9至22之一中的方法,其中所述Msp孔蛋白由編碼單鏈Msp 孔蛋白的核酸序列編碼,其中所述核酸序列包含(a)第一和第二核苷酸序列,其中所述第一核苷酸序列編碼第一 Msp單體序列并且第二核苷酸序列編碼第二 Msp單體序列;和(b)編碼氨基酸連接體序列的第三核苷酸序列。
36.權利要求35的方法,其中所述第一和第二Msp單體序列獨立地選自野生型MspA單體、野生型MspB單體、野生型MspC單體、野生型MspD單體和其突變體。
37.權利要求35的方法,其中所述第一Msp單體序列包含野生型MspA單體或其突變體。
38.權利要求37的方法,其中所述第一Msp單體序列包含突變MspA單體。
39.權利要求1、3至6或9至22之一中的方法,其中所述Msp孔蛋白由編碼單鏈Msp 孔蛋白的核酸序列編碼,其中所述核酸序列包含(a)第1、第2、第3、第4、第5、第6、第7和第8核苷酸序列,其中所述第1、第2、第3、 第4、第5、第6、第7和第8核苷酸序列分別編碼第1、第2、第3、第4、第5、第6、第7和第 8Msp單體序列;和(b)編碼氨基酸連接體序列的第9核苷酸序列。
40.權利要求39的方法,其中每一個Msp單體包含野生型MspA單體或其突變體。
41.權利要求39的方法,其中至少一個Msp單體包含野生型MspA單體或其突變體。
42.權利要求35至41之一中的方法,其中所述Msp單體是野生型MspA旁系同源物或同系物。
43.權利要求42的方法,其中所述野生型MspA旁系同源物或同系物選自MspA/ Msmeg0965、MspB/Msmeg0520、MspC/Msmeg5483、MspD/Msmeg6057、MppA> PorMl、PorM2、 PorMU Mmcs4296、Mmcs4297、Mmcs3857、Mmcs4382、Mmcs4383、Mjls3843、Mjls3857、 Mjls3931Mjls4674、Mjls4675、Mjls4677、Map3123c、Mav3943、Mvanl836、Mvan4117、 Mvan4839、Mvan4840、Mvan5016、Mvan5017、Mvan5768、MUL 2391、Mflvl734、Mflvl735、 Mflv2295、Mflvl891、MCH4691c、MCH4689c、MCH4690c、MAB1080、MAB1081、MAB2800、 RHAlro0856U RHAlro04074 和 RHAlro03127。
44.改變通過恥垢分枝桿菌孔蛋白(Msp)的通道的電導的方法,包括在野生型Msp孔蛋白的前廳或縊縮區中除去、添加或置換至少一個氨基酸。
45.包括具有界定通道的前廳和縊縮區的恥垢分枝桿菌孔蛋白(Msp)的系統,其中所述通道位于第一液體介質與第二液體介質之間,其中至少一種液體介質包含分析物,并且其中所述系統對于檢測分析物的性質是有效的。
46.權利要求45的系統,其中所述系統對于將分析物轉位穿過通道是有效的。
47.權利要求45的系統,其中所述系統對于檢測分析物的性質是有效的,包括將Msp孔蛋白經受電場以便分析物與Msp孔蛋白相互作用。
48.權利要求45至47之一的方法,其中所述系統對于檢測分析物的性質是有效的,包括將Msp孔蛋白經受電場以便分析物通過電泳轉位通過Msp孔蛋白的通道。
49.權利要求45至48之一中的系統,其中所述性質是分析物的電性質、化學性質或物理性質。
50.權利要求45至49之一中的系統,其中所述Msp孔蛋白包含在脂雙層中。
51.權利要求45至50之一中的系統,其還被定義為包含多個Msp孔蛋白。
52.權利要求45至51之一中的系統,其中所述Msp孔蛋白選自野生型MspA孔蛋白、突變MspA孔蛋白、野生型MspA旁系同源物或同系物孔蛋白、或者突變MspA旁系同源物或同系物孔蛋白。
53.權利要求45至52之一中的系統,其中所述Msp孔蛋白被進一步確定為突變MspA 孔蛋白。
54.權利要求53的系統,其中所述突變MspA孔蛋白包含界定通道的前廳和縊縮區,和至少第一突變MspA單體,其包含位置93上的突變和位置90、位置91上的突變或位置 90及91上的突變。
55.權利要求53的系統,其中所述突變MspA孔蛋白包含具有約2至約6nm的長度和約2至約6nm的直徑的前廳,和具有約0. 3至約3nm的長度和約0. 3至約3nm的直徑的縊縮區,其中所述前廳和縊縮區一起界定了通道,和還包含至少第一突變MspA旁系同源物或同系物單體。
56.權利要求45至51之一中的系統,其中所述Msp孔蛋白還被確定為這樣的Msp孔蛋白,其包含具有約2至約6nm的長度和約2至約6nm的直徑的前廳,和具有約0. 3至約3nm的長度和約0. 3至約3nm的直徑的縊縮區,其中所述前廳和縊縮區一起界定了通道。
57.權利要求52的系統,其中所述Msp是野生型MspA旁系同源物或同系物孔蛋白。
58.權利要求57的系統,其中所述野生型MspA旁系同源物或同系物孔蛋白選自 MspA/Msmeg0965、MspB/Msmeg0520、MspC/Msmeg5483、MspD/Msmeg6057、MppA> PorMU PorM2、PorMl、Mmcs4296、Mmcs4297、Mmcs3857、Mmcs4382、Mmcs4383、Mjls3843、Mjls3857、 Mjls3931、Mjls4674、Mjls4675、Mjls4677、Map3123c、Mav3943、Mvanl836、Mvan4117、 Mvan4839、Mvan4840、Mvan5016、Mvan5017、Mvan5768、MUL_2391、Mflvl734、Mflvl735、 Mflv2295、Mflvl89U MCH4691c、MCH4689c、MCH4690c、MAB1080, MAB1081、MAB2800、RHAl ro0856URHAl ro04074 和 RHAlro03127。
59.權利要求45至51之一中的系統,其中所述Msp孔蛋白由編碼單鏈Msp孔蛋白的核酸序列編碼,其中所述核酸序列包含(a)第一和第二核苷酸序列,其中所述第一核苷酸序列編碼第一Msp單體序列并且第二核苷酸序列編碼第二 Msp單體序列;和(b)編碼氨基酸連接體序列的第三核苷酸序列。
60.權利要求45至51之一中的方法,其中所述Msp孔蛋白由編碼單鏈Msp孔蛋白的核酸序列編碼,其中所述核酸序列包含(a)第1、第2、第3、第4、第5、第6、第7和第8核苷酸序列,其中所述第1、第2、第3、 第4、第5、第6、第7和第8核苷酸序列分別編碼第1、第2、第3、第4、第5、第6、第7和第 8Msp單體序列;和(b)編碼氨基酸連接體序列的第9核苷酸序列。
61.權利要求45至60之一中的系統,其中所述Msp孔蛋白還包括分子發動機,其中所述分子發動機能夠以這樣的平均轉位速度將分析物移入或穿過通道,所述平均轉位速度小于分析物在分子發動機不存在的情況下轉位入或穿過通道的平均轉位速度。
62.權利要求45至61之一中的系統,其還包含膜片鉗放大器。
63.權利要求45至62之一中的系統,其還包含數據獲取裝置。
64.權利要求45至63之一中的系統,其還包含與第一液體介質、第二液體介質或兩者連通的一個或多個溫度調節裝置。
65.包含具有界定通道的前廳和縊縮區的恥垢分枝桿菌孔蛋白(Msp)的系統,其中所述通道位于第一液體介質與第二液體介質之間的脂雙層中,并且其中第一和第二液體介質之間的液體連通的唯一的點存在于通道中。
66.突變的恥垢分枝桿菌孔蛋白A(MspA)孔蛋白,其包含界定通道的前廳和縊縮區,和至少第一突變MspA單體,其包含位置93上的突變和位置90、位置91上的突變或位置 90及91上的突變。
67.權利要求66的突變MspA孔蛋白,其包含位置93和90上的突變。
68.權利要求66的突變MspA孔蛋白,其包含位置93和91上的突變。
69.權利要求66的突變MspA孔蛋白,其包含位置93、91和90上的突變。
70.權利要求66的突變MspA孔蛋白,其中突變MspA孔蛋白的縊縮區的直徑小于野生型MspA孔蛋白的縊縮區的直徑。
71.權利要求66至70之一中的突變MspA孔蛋白,其中所述MspA孔蛋白在前廳或縊縮區中具有突變,所述突變允許分析物以這樣的平均轉位速度轉位穿過突變體的通道,所述平均轉位速度小于分析物轉位穿過野生型Msp孔蛋白的通道的平均轉位速度。
72.權利要求66至70之一中的突變MspA孔蛋白,其中所述MspA孔蛋白在前廳或縊縮區中具有突變,所述突變允許分析物以這樣的平均轉位速度通過電泳轉位通過突變體的通道,所述平均轉位速度小于分析物通過電泳轉位通過野生型Msp孔蛋白的通道的平均轉位速度。
73.權利要求66至72之一中的突變MspA孔蛋白,其中所述MspA孔蛋白在前廳或縊縮區具有突變,所述突變允許分析物以小于0. 5nm/ys的平均轉位速度轉位通過通道。
74.權利要求71至73之一中的突變MspA孔蛋白,其中分析物選自核苷酸、核酸、氨基酸、肽、蛋白質、聚合物、藥物、離子、生物戰劑、污染物、納米級物體或其組合或聚簇。
75.權利要求74的突變MspA孔蛋白,其中分析物被進一步確定為核酸。
76.權利要求75的突變MspA孔蛋白,其中核酸以小于1個核苷酸/μ s的平均轉位速度轉位通過通道。
77.權利要求75或權利要求76的突變MspA孔蛋白,其中核酸被進一步確定為ssDNA、 dsDNA、RNA或其組合。
78.權利要求66至77之一中的突變MspA孔蛋白,其中所述突變MspA孔蛋白包含為相同或不同的2至15個Msp單體。
79.權利要求78的突變MspA孔蛋白,其中所述突變MspA孔蛋白包含為相同或不同的 7至9個Msp單體。
80.權利要求66至79之一中的突變MspA孔蛋白,其還包含選自野生型MspA單體、第二突變MspA單體、野生型MspA旁系同源物或同系物單體以及突變MspA旁系同源物或同系物單體中的至少第二單體,其中所述第二突變MspA單體可以與第一突變MspA單體相同或不同。
81.權利要求80的突變MspA孔蛋白,其中所述第二單體是野生型MspA旁系同源物或同系物單體。
82.權利要求81的突變MspA孔蛋白,其中野生型MspA旁系同源物或同系物單體是野生型MspB單體。
83.權利要求66至82之一中的突變MspA孔蛋白,其中所述第一突變MspA單體還在下列氨基酸位置88、105、108、118、134或139的任何位置上包含一個或多個突變。
84.權利要求66至82之一中的突變MspA孔蛋白,其中所述第一突變MspA單體包含一個或多個下列突變L88W、D90K/N/Q/R、D91N/Q、D93N、I105W、m08W、D118R、D134R或E139K。
85.權利要求66至82之一中的突變MspA孔蛋白,其中所述第一突變MspA單體包含下列突變:D90N/D91N/D93No
86.權利要求66至82之一中的突變MspA孔蛋白,其中所述第一突變MspA單體包含下列突變D90N/D91N/D93N/D118R/D134R/E139K。
87.權利要求66至82之一中的突變MspA孔蛋白,其中所述第一突變MspA單體包含下列突變:D90Q/D91Q/D93No
88.權利要求66至82之一中的突變MspA孔蛋白,其中所述第一突變MspA單體包含下列突變D90Q/D91Q/D93N/D118R/D134R/E139K。
89.權利要求66至82之一中的突變MspA孔蛋白,其中所述第一突變MspA單體包含下列突變D90(K,R)/D91N/D93N。
90.權利要求66至82之一中的突變MspA孔蛋白,其中所述第一突變MspA單體包含下列突變(L88,I105)ff/D91Q/D93No
91.權利要求66至82之一中的突變MspA孔蛋白,其中所述第一突變MspA單體包含下列突變I105W/m08W。
92.權利要求66至91之一中的突變MspA孔蛋白,其還包含一個或多個周質環缺失。
93.權利要求66至92之一中的突變MspA孔蛋白,其通過通道的電導高于通過其相應野生型MspA孔蛋白的通道的電導。
94.權利要求66至93之一中的突變MspA孔蛋白,其還包括分子發動機,其中所述分子發動機能夠以這樣的平均轉位速度將分析物移入或穿過通道,所述平均轉位速度小于分析物在分子發動機不存在的情況下轉位入或穿過通道的平均轉位速度。
95.權利要求66至94之一中的突變MspA孔蛋白,其還包括分子發動機,其中所述分子發動機能夠以這樣的平均轉位速度將分析物移入或穿過通道,所述平均轉位速度小于分析物在分子發動機不存在的情況下通過電泳轉位入或穿過通道的平均轉位速度。
96.權利要求94或權利要求95的突變MspA孔蛋白,其中所述分子發動機是酶。
97.權利要求96的突變MspA孔蛋白,其中所述酶是聚合酶、外切核酸酶或Klenow片段。
98.一種突變的恥垢分枝桿菌孔蛋白A(MspA)孔蛋白,其包含具有約2至約6nm的長度和約2至約6nm的直徑的前廳,和具有約0. 3至約3nm的長度和約0. 3至約3nm的直徑的縊縮區,其中所述前廳和縊縮區一起界定了通道,和還包含至少第一突變MspA旁系同源物或同系物單體。
99.權利要求98的突變MspA孔蛋白,其中所述突變MspA孔蛋白的縊縮區的直徑小于其相應野生型MspA孔蛋白的縊縮區的直徑。
100.權利要求98或權利要求99的突變MspA孔蛋白,其在前廳或縊縮區具有突變,所述突變允許分析物以這樣的平均轉位速度穿過突變體的通道,所述平均轉位速度小于分析物轉位通過其相應野生型MspA孔蛋白的通道的平均轉位速度。
101.權利要求98至100之一中的突變MspA孔蛋白,其在前廳或縊縮區中具有突變,所述突變允許分析物以這樣的平均轉位速度電泳轉位通過突變體的通道,所述平均轉位速度小于分析物通過電泳轉位通過其相應野生型MspA孔蛋白的通道的平均轉位速度。
102.權利要求98至101之一中的突變MspA孔蛋白,其在前廳或縊縮區中具有允許分析物以小于0. 5nm/ys的平均轉位速度穿過通道的突變。
103.權利要求101至102之一中的突變MspA孔蛋白,其中所述分析物被進一步確定為核苷酸、核酸、氨基酸、肽、蛋白質、聚合物、藥物、離子、生物戰劑、污染物、納米級物體或其組合或聚簇。
104.權利要求103的突變MspA孔蛋白,其中所述分析物被進一步確定為核酸。
105.權利要求104的突變MspA孔蛋白,其中所述核酸以小于1個核苷酸/μ s的平均轉位速度轉位通過通道。
106.權利要求104或權利要求105的突變MspA孔蛋白,其中所述核酸被進一步確定為 ssDNA、dsDNA、RNA 或其組合。
107.權利要求98至106之一中的突變MspA孔蛋白,其中所述突變MspA孔蛋白還包含至少一個Msp單體。
108.權利要求107的突變MspA孔蛋白,其中所述Msp單體選自野生型MspA單體、突變MspA單體、野生型MspA旁系同源物或同系物或者第二突變MspA旁系同源物或同系物單體。
109.權利要求98至108之一中的突變MspA孔蛋白,其還包含一個或多個周質環缺失。
110.權利要求98至109之一中的突變MspA孔蛋白,其在前廳或縊縮區中包含突變。
111.權利要求98至110之一中的突變MspA孔蛋白,其通過通道的電導高于通過其相應野生型MspA孔蛋白的通道的電導。
112.權利要求98至111之一中的突變MspA孔蛋白,其還包含分子發動機,其中所述分子發動機能夠以這樣的平均轉位速度將分析物移入或穿過通道,所述平均轉位速度小于分析物在分子發動機不存在的情況下轉位通過或穿過通道時的平均轉位速度。
113.權利要求98至112之一中的突變MspA孔蛋白,其還包含分子發動機,其中所述分子發動機能夠以這樣的平均轉位速度將分析物移入或穿過通道,所述平均轉位速度小于分析物在分子發動機不存在的情況下通過電泳轉位入或穿過通道的平均轉位速度。
114.權利要求112或權利要求113的突變MspA孔蛋白,其中所述分子發動機是酶。
115.權利要求114的突變MspA孔蛋白,其中所述酶是聚合酶、外切核酸酶或Klenow片段。
116.一種突變的恥垢分枝桿菌孔蛋白A(MspA)旁系同源物或同系物,其包含具有約2至約6nm的長度和約2至約6nm的直徑的前廳,和具有約0. 3至約3nm的長度和約0. 3至約3nm的直徑的縊縮區,其中所述前廳和縊縮區一起界定了通道。
117.權利要求116的突變MspA旁系同源物或同系物,其還包含至少第一突變MspA旁系同源物或同系物單體。
118.制備包含至少一個突變MspA單體的突變恥垢分枝桿菌孔蛋白A(MspA)孔蛋白的方法,所述方法包括在位置93和位置90、位置91、或位置90及91上修飾野生型MspA單體。
119.制備具有界定通道的前廳和縊縮區的突變恥垢分枝桿菌孔蛋白A(MspA)孔蛋白的方法,包括在野生型MspA旁系同源物或同系物單體的前廳或縊縮區中缺失、添加或置換任何氨基酸,以便所得的突變MspA孔蛋白能夠在施加電場后使分析物轉位通過通道。
120.一種方法,包括在不應用電場的情況下使分析物轉位通過恥垢分枝桿菌孔蛋白 (Msp)孔蛋白的通道。
121.權利要求120的方法,其中所述Msp孔蛋白還包括分子發動機。
122.權利要求120或權利要求121的方法,其中所述Msp孔蛋白選自野生型MspA孔蛋白、突變MspA孔蛋白、野生型MspA旁系同源物或同系物孔蛋白以及突變MspA旁系同源物或同系物孔蛋白。
123.權利要求120或權利要求121的方法,其中所述Msp孔蛋白由編碼單鏈Msp孔蛋白的核酸序列編碼,其中所述核酸序列包含(a)第一和第二核苷酸序列,其中所述第一核苷酸序列編碼第一Msp單體序列并且第二核苷酸序列編碼第二 Msp單體序列;和(b)編碼氨基酸連接體序列的第三核苷酸序列。
124.權利要求120或權利要求121的方法,其中所述Msp孔蛋白由編碼單鏈Msp孔蛋白的核酸序列編碼,其中所述核酸序列包含(a)第1、第2、第3、第4、第5、第6、第7和第8核苷酸序列,其中所述第1、第2、第3、 第4、第5、第6、第7和第8核苷酸序列分別編碼第1、第2、第3、第4、第5、第6、第7和第 8Msp單體序列;和(b)編碼氨基酸連接體序列的第9核苷酸序列。
125.權利要求120至124之一中的方法,其中所述分析物包含光學珠粒或磁性珠粒。
126.編碼單鏈Msp孔蛋白的核酸序列,其中所述核酸序列包含(a)第一和第二核苷酸序列,其中所述第一核苷酸序列編碼第一Msp單體序列并且第二核苷酸序列編碼第二 Msp單體序列;和(b)編碼氨基酸連接體序列的第三核苷酸序列。
127.權利要求126的核酸序列,其中所述第一和第二Msp單體序列獨立地選自野生型 MspA單體、突變MspA單體、野生型MspA旁系同源物或同系物單體以及突變MspA旁系同源物或同系物單體。
128.權利要求126或權利要求127的核酸序列,其中所述第一Msp單體序列包含野生型MspA單體或其突變體。
129.權利要求128的核酸序列,其中所述Msp單體序列包含突變MspA單體。
130.權利要求128的核酸序列,其中所述第一Msp單體序列包含一個或多個選自下述的突變氨基酸138上的A至P置換、氨基酸139上的E至A或K置換、氨基酸90上的D至K或R或Q置換、氨基酸91上的D至N或Q置換、氨基酸93上的D至N置換、氨基酸88上的L至W置換、氨基酸105上的I至W置換、氨基酸108上的N至W置換、氨基酸118上的 D至R置換和氨基酸134上的D至R置換。
131.權利要求130的核酸序列,其中所述突變MspA單體包含氨基酸138上的A至P置換、氨基酸139上的E至A置換或其組合。
132.權利要求130的核酸序列,其中所述突變MspA單體包含氨基酸90上的D至K或 R置換、氨基酸91上的D至N置換、氨基酸93上的D至N置換或其任何組合。
133.權利要求130的核酸序列,其中所述突變MspA單體包含氨基酸90上的D至Q置換、氨基酸91上的D至Q置換、氨基酸93上的D至N置換或其任何組合。
134.權利要求130的核酸序列,其中所述突變MspA單體包含氨基酸88上的L至W置換、氨基酸105上的I至W置換、氨基酸91上的D至Q置換、氨基酸93上的D至N置換或其任何組合。
135.權利要求130的核酸序列,其中所述突變MspA單體包含氨基酸105上的I至W置換、氨基酸108上的N至W置換或其組合。
136.權利要求130的核酸序列,其中所述突變MspA單體包含氨基酸118上的D至R置換、氨基酸139上的E至K置換、氨基酸134上的D至R置換或其任何組合。
137.權利要求126的核酸序列,其中所述第一MspA單體序列包含SEQ ID NO :1。
138.權利要求126的核酸序列,其中所述第二MspA單體序列包含野生型MspA旁系同源物或其突變體,其中所述旁系同源物或其突變體是野生型MspB單體或其突變體。
139.權利要求138的核酸序列,其中所述第二MspA單體序列包含SEQ ID NO :2。
140.權利要求138的核酸序列,其中所述第二MspA單體序列包含突變MspB單體。
141.權利要求126的核酸序列,其中所述第一MspA單體序列包含野生型MspA單體或其突變體,并且所述第二 Msp單體包含野生型MspB單體或其突變體。
142.權利要求126的核酸序列,其中所述第一MspA單體序列包含SEQ ID NO=I并且所述第二 Msp單體包含SEQ ID NO :2。
143.權利要求126至142中任一項的核酸序列,其中所述氨基酸連接體序列包含10至 20個氨基酸。
144.權利要求143的核酸序列,其中所述氨基酸連接體序列包含15個氨基酸。
145.權利要求144的核酸序列,其中所述氨基酸連接體序列包含(GGGGS)3(SEQID NO 3)肽序列。
146.由權利要求126至145之一中的核酸序列編碼的多肽。
147.包含權利要求126至145之一中的核酸序列的載體。
148.權利要求147的載體,其中所述載體還包含啟動子序列。
149.權利要求148的載體,其中所述啟動子包括組成型啟動子。
150.權利要求149的載體,其中所述組成型啟動子包括Psmy。啟動子。
151.權利要求148的載體,其中所述啟動子包括誘導型啟動子。
152.權利要求151的載體,其中所述誘導型啟動子包括乙酰胺誘導型啟動子。
153.編碼單鏈Msp孔蛋白的核酸序列,其中所述核酸序列包含(a)第1、第2、第3、第4、第5、第6、第7和第8核苷酸序列,其中所述第1、第2、第3、第4、第5、第6、第7和第8核苷酸序列分別編碼第1、第2、第3、第4、第5、第6、第7和第 8Msp單體序列;和(b)編碼氨基酸連接體序列的第9核苷酸序列。
154.權利要求153的核酸序列,其中所述第一和第二Msp單體序列獨立地選自野生型 Msp單體、突變Msp單體、野生型MspA旁系同源物或同系物單體以及突變MspA旁系同源物或同系物單體。
155.權利要求153的核酸序列,其中每一個Msp單體包含野生型MspA單體或其突變體。
156.權利要求153的核酸序列,其中至少一個Msp單體包括野生型MspA單體或其突變體。
157.權利要求155或權利要求156的核酸序列,其中至少一個Msp單體包含突變MspA單體。
158.權利要求157的核酸序列,其中所述突變Msp單體序列包含一個或多個選自如下的突變氨基酸138上的A至P置換、氨基酸139上的E至A或K置換、氨基酸90上的D至 K或R或Q置換、氨基酸91上的D至N或Q置換、氨基酸93上的D至N置換、氨基酸88上的L至W置換、氨基酸105上的I至W置換、氨基酸108上的N至W置換、氨基酸118上的 D至R置換和氨基酸1;34上的D至R置換。
159.權利要求158的核酸序列,其中所述突變MspA單體包含氨基酸138上的A至P置換、氨基酸139上的E至A置換或其組合。
160.權利要求158的核酸序列,其中所述突變MspA單體包含氨基酸90上的D至K或 R置換、氨基酸91上的D至N置換、氨基酸93上的D至N置換或其任何組合。
161.權利要求158的核酸序列,其中所述突變MspA單體包含氨基酸90上的D至Q置換、氨基酸91上的D至Q置換、氨基酸93上的D至N置換或其任何組合。
162.權利要求158的核酸序列,其中所述突變MspA單體包含氨基酸88上的L至W置換、氨基酸105上的I至W置換、氨基酸91上的D至Q置換、氨基酸93上的D至N置換或其任何組合。
163.權利要求158的核酸序列,其中所述突變MspA單體包含氨基酸105上的I至W置換、氨基酸108上的N至W置換或其組合。
164.權利要求158的核酸序列,其中所述突變MspA單體包含氨基酸118上的D至R置換、氨基酸139上的E至K置換、氨基酸134上的D至R置換或其任何組合。
165.權利要求153的核酸序列,其中每一個Msp單體序列包含SEQID NO :1。
166.權利要求153的核酸序列,其中至少一個Msp單體序列包含SEQID NO :1。
167.權利要求153的核酸序列,其中至少一個Msp單體序列包含野生型MspA旁系同源物或其突變體,其中所述MspA旁系同源物或其突變體是野生型MspB單體或其突變體。
168.權利要求166或權利要求167的核酸序列,其中至少一個Msp單體序列包含SEQ ID NO :2。
169.權利要求166至168之一中的核酸序列,其中至少一個Msp單體序列包含突變 MspB單體。
170.權利要求153的核酸序列,其中至少一個Msp單體序列包含野生型MspA單體或其突變體,以及至少一個Msp單體序列包含野生型MspB單體或其突變體。
171.權利要求153的核酸序列,其中至少一個Msp單體序列包含SEQID N0:1,并且至少一個Msp單體序列包含SEQ ID NO :2。
172.權利要求153至171之一中的核酸序列,其中所述氨基酸連接體序列包含10至 20個氨基酸。
173.權利要求172的核酸序列,其中所述氨基酸連接體序列包含15個氨基酸。
174.權利要求173的核酸序列,其中所述氨基酸連接體序列包含(GGGGS)3(SEQID NO 3)肽序列。
175.由權利要求66至115或153至174的一個中的核酸序列編碼的多肽。
176.包含權利要求66至115或153至174的一個中的核酸序列的載體。
177.權利要求176的載體,其中所述載體還包含啟動子序列。
178.權利要求177的載體,其中所述啟動子包括組成型啟動子。
179.權利要求178的載體,其中所述組成型啟動子包括Psmy。啟動子。
180.權利要求179的載體,其中所述啟動子包括誘導型啟動子。
181.權利要求180的啟動子,其中所述誘導型啟動子包括乙酰胺誘導型啟動子。
182.被權利要求176至181之一中的載體轉染的培養細胞或其后代,其中所述細胞能夠表達Msp孔蛋白或Msp孔蛋白單體.
183.包含權利要求176至181之一的載體的恥垢分枝桿菌菌株。
184.能夠誘導型表達Msp單體的突變細菌菌株,所述細菌菌株包含(a)野生型MspA的缺失;(b)野生型MspC的缺失;(c)野生型MspD的缺失;和(d)包含有效地連接Msp單體核酸序列的誘導型啟動子的載體。
185.權利要求184的細菌菌株,其中所述細菌菌株包括恥垢分枝桿菌菌株ML16。
186.權利要求184的細菌菌株,其中所述Msp核酸編碼野生型MspA單體或者野生型 MspA旁系同源物或同系物單體。
187.權利要求184的細菌菌株,其中所述Msp核酸編碼選自下組的Msp單體野生型 MspA單體、野生型MspC單體和野生型MspD單體。
188.權利要求187的細菌菌株,其中所述Msp核酸編碼野生型MspA單體。
189.權利要求184的細菌菌株,其中所述誘導型啟動子包括乙酰胺誘導型啟動子。
190.權利要求184的細菌菌株,其還包含野生型MspB的缺失。
191.權利要求190的細菌菌株,其還包含載體,所述載體包含有效地連接于編碼Msp孔蛋白或單體的核酸序列的組成型啟動子。
192.權利要求191的細菌菌株,其中所述Msp是野生型MspA孔蛋白或單體或者野生型 MspA旁系同源物或同系物孔蛋白或單體。
193.權利要求191的細菌菌株,其中所述Msp孔蛋白或單體選自野生型MspA孔蛋白或單體、野生型MspB孔蛋白或單體、野生型MspC孔蛋白或單體以及野生型MspD孔蛋白或單體。
194.權利要求193的細菌菌株,其中所述Msp孔蛋白或單體是野生型MspA孔蛋白或單體。
195.權利要求190的細菌菌株,其還包含含有編碼單鏈Msp孔蛋白的核酸的載體,其中所述核酸包含(a)第一和第二核苷酸序列,其中所述第一核苷酸序列編碼第一Msp單體序列并且第二核苷酸序列編碼第二 Msp單體序列;和(b)編碼氨基酸連接體序列的第三核苷酸序列。
196.權利要求190的細菌菌株,其還包含含有編碼單鏈Msp孔蛋白的核酸的載體,其中所述核酸包含(a)第1、第2、第3、第4、第5、第6、第7和第8核苷酸序列,其中所述第1、第2、第3、 第4、第5、第6、第7和第8核苷酸序列分別編碼第1、第2、第3、第4、第5、第6、第7和第 8Msp單體序列;和(b)編碼氨基酸連接體序列的第9核苷酸序列。
197.產生單鏈Msp孔蛋白的方法,所述方法包括(a)用包含能夠編碼單鏈Msp孔蛋白的核酸序列的載體轉化權利要求190的細菌菌株;和(b)從細菌純化單鏈Msp孔蛋白。
198.權利要求197的方法,其中所述載體包含編碼單鏈Msp孔蛋白的核酸序列,其中所述核酸序列包含(a)第一和第二核苷酸序列,其中所述第一核苷酸序列編碼第一Msp單體序列并且第二核苷酸序列編碼第二 Msp單體序列;和(b)編碼氨基酸連接體序列的第三核苷酸序列。
199.權利要求197的方法,其中所述載體包含編碼單鏈Msp孔蛋白的核酸序列,其中所述核酸序列包含(a)第1、第2、第3、第4、第5、第6、第7和第8核苷酸序列,其中所述第1、第2、第3、 第4、第5、第6、第7和第8核苷酸序列分別編碼第1、第2、第3、第4、第5、第6、第7和第 8Msp單體序列;和(b)編碼氨基酸連接體的第9核苷酸序列。
200.權利要求198或權利要求199的方法,其中所述Msp單體序列獨立地選自野生型 MspA單體、突變MspA單體、野生型MspA旁系同源物或同系物單體和突變MspA旁系同源物或同系物單體。
201.如權利要求198至200之一中的方法,其中所述Msp單體序列是野生型MspA單體。
全文摘要
本文中提供了恥垢分枝桿菌孔蛋白納米孔、包含此類納米孔的系統以及使用和產生此類納米孔的方法。此類納米孔可以是野生型MspA孔蛋白、突變MspA孔蛋白、野生型MspA旁系同源物孔蛋白、野生型MspA同系物孔蛋白、突變MspA旁系同源物孔蛋白、突變MspA同系物孔蛋白或單鏈Msp孔蛋白。還提供了能夠誘導型表達Msp孔蛋白的細菌菌株。
文檔編號G01N33/68GK102216783SQ200980142855
公開日2011年10月12日 申請日期2009年9月22日 優先權日2008年9月22日
發明者J·H·貢德拉赫, M·A·特羅爾, M·尼德韋斯, M·帕夫倫科, T·Z·巴特勒 申請人:Uab研究基金會, 華盛頓大學