<listing id="vjp15"></listing><menuitem id="vjp15"></menuitem><var id="vjp15"></var><cite id="vjp15"></cite>
<var id="vjp15"></var><cite id="vjp15"><video id="vjp15"><menuitem id="vjp15"></menuitem></video></cite>
<cite id="vjp15"></cite>
<var id="vjp15"><strike id="vjp15"><listing id="vjp15"></listing></strike></var>
<var id="vjp15"><strike id="vjp15"><listing id="vjp15"></listing></strike></var>
<menuitem id="vjp15"><strike id="vjp15"></strike></menuitem>
<cite id="vjp15"></cite>
<var id="vjp15"><strike id="vjp15"></strike></var>
<var id="vjp15"></var>
<var id="vjp15"></var>
<var id="vjp15"><video id="vjp15"><thead id="vjp15"></thead></video></var>
<menuitem id="vjp15"></menuitem><cite id="vjp15"><video id="vjp15"></video></cite>
<var id="vjp15"></var><cite id="vjp15"><video id="vjp15"><thead id="vjp15"></thead></video></cite>
<var id="vjp15"></var>
<var id="vjp15"></var>
<menuitem id="vjp15"><span id="vjp15"><thead id="vjp15"></thead></span></menuitem>
<cite id="vjp15"><video id="vjp15"></video></cite>
<menuitem id="vjp15"></menuitem>

具有二級酰胺酶活性的酶及其應用方法

文檔序號:447533閱讀:1403來源:國知局
專利名稱:具有二級酰胺酶活性的酶及其應用方法
技術領域
本發明一般地涉及分子和細胞生物學和生物化學。本發明提供了 酰胺酶、編碼該酰胺酶的多聚核苷酸、這些多聚核苷酸和多肽的應用,
并且, 一方面,本發明提供了具有二級酰胺酶(secondary amidase)活 性例如具有酰胺水解活性的酶,包括具有肽酶、蛋白酶和/或乙內酰脲 酶活性的酶。在別的方面,本發明的酶可以用于加工食品,例如,增 強食品風味(例如,酶催熟奶酪)、促進殺滅細菌和真菌、精細化學 中間物的修飾和去保護、合成肽鍵、進行手性拆分、水解頭孢菌素C。 本發明的酶可以用于產生7-氨基頭孢烷酸(7-ACA)和半合成的頭孢 菌素抗生素,包括頭孢噻吩、頭孢噻啶和頭孢呋辛。本發明的酶可以 用作抗微生物試劑,例如,細胞壁水解劑。
背景技術
二級酰胺酶包括許多有用的酶,包括肽酶、蛋白酶和乙內酰脲酶。 此類酶可以用于一定范圍的商業應用。例如,二級酰胺酶可以用于1) 增強食品風味,特別是奶酪(稱之為酶催熟奶酪);2)促進殺滅細菌 和真菌;3)精細化學中間物的修飾和去保護;4)合成肽鍵;5)進行 手性拆分。特別地,在本領域內需要一種能夠水解頭孢菌素C的酶。 頭孢菌素C是頭孢菌素生物合成途徑的發酵產物,雖然作為抗生素本 身,頭孢菌素C表現出一些抗革蘭氏陰性微生物的活性,但是頭孢菌 素C的主要商業用途是作為別的類似于頭孢菌素的抗生素的構建基 礎。例如,可以除去D-a-氨基己二酰側鏈,產生7-氨基頭孢烷酸
(7-ACA), 7-ACA是多種半合成的頭孢菌素抗生素,包括頭孢噻吩、 頭孢噻啶和頭孢呋辛,的前體。
半合成的頭孢菌素屬于最廣泛使用的抗生素。這些抗生素從7-氨 基頭孢烷酸(7-ACA)開始合成,7-氨基頭孢烷酸是通過頭孢菌素C
(Ceph C)脫酰基作用獲得的一種化合物。傳統上是使用化學工藝進 行脫酰基作用。然而,化學工藝涉及使用許多有毒化合物,產生許多代價大的化學廢物。因此,從Ceph C產生7-ACA的酶促途徑是非常 吸引人的。目前,從CephC酶促產生7-ACA是應用一種雙酶工藝(圖 7)完成的。第一種酶,D-氨基酸氧化酶,用于把Ceph C氧化為酮酸 中間產物,然后該酮酸中間產物被過氧化氫脫羧,產生戊二酰-7-ACA。 然后戊二酰-7-ACA通過第二種酶,戊二酰-7-ACA酰基轉移酶的作用 脫酰基形成7-ACA。雖然一些戊二酰-7-ACA酰基轉移酶可以直接把 Ceph C轉化為7-ACA,但是它們效率很低。雖然如此,對Ceph C具 有可測量出的活性的戊二酰-7-ACA酰基轉移酶可以歸類為頭孢菌素C 酰基轉移酶。
對二級酰胺酶的尋找由于缺少適于高通量篩選的底物/分析組合而 受到限制。以前的研究努力所使用的底物或分析存在著低通量、缺乏 靈敏度和/或缺少特異性的不足。
在此被討論的出版物僅僅是提供了它們的公開內容,這些公開是 在本申請的申請日之前。在此并不承認,本發明一定不具相對于在先 發明的公開內容占先的資格。
發明概述
本發明提供具有酰胺酶活性的多肽,例如具有肽酶、蛋白酶和/或 乙內酰脲酶活性的酶,這里的酰胺酶活性包括二級酰胺酶活性,例如 催化酰胺的水解。在可供選擇的方面,本發明的酶可以用于加工食品, 例如,增強食品風味(例如,酶促熟奶酪)、促進殺滅細菌和真菌、 精細化學中間物的修飾和去保護、合成肽鍵、進行手性拆分、水解頭 孢菌素C。本發明的酶可以用于產生7-氨基頭孢烷酸(7-ACA)和半 合成的頭孢菌素抗生素,包括頭孢噻啶、頭孢噻啶和頭孢呋辛。本發 明的酶可以用作抗微生物試劑,例如,作為細胞壁水解劑。
本發明提供分離的或重組的核酸,其包含的核酸序列在至少大約 100個殘基的范圍內,與SEQIDNO:l, SEQIDNO:3, SEQIDNO:5, SEQIDNO:7, SEQIDNO:9, SEQIDNO:ll, SEQIDNO:13, SEQID NO:15, SEQIDNO:17, SEQIDNO:19, SEQIDNO:21, SEQIDNO:23, SEQIDNO:25, SEQIDNO:31, SEQIDNO:33, SEQIDNO:39, SEQ IDNO:41, SEQIDNO:43, SEQ ID NO:45, SEQ ID NO:47, SEQ IDNO:49, SEQIDNO:51, SEQ IDNO:53, SEQ IDNO:59, SEQ IDNO:61, SEQIDNO:63, SEQIDNO:65, SEQIDNO:67, SEQIDNO:69, SEQ IDNO:71, SEQIDNO:75, SEQ ID NO:77, SEQ ID NO:79, SEQ ID NO:81, SEQIDNO:83, SEQIDNO:85, SEQIDNO:87, SEQ IDNO:91, SEQIDNO:93, SEQIDNO:95, SEQIDNO:97, SEQIDNO:101, SEQ ID NO: 103, SEQ ID NO: 105, SEQ ID NO: 107, SEQ ID NO: 109, SEQ IDNO:lll具有至少50%序列一致性(identity),與SEQIDNO:35, SEQIDNO:73, SEQIDNO:89, SEQ IDNO:113具有至少55%序列一 致性,與SEQIDNO:27, SEQIDNO:29, SEQ ID NO:57具有至少60 %序列一致性,與SEQ ID NO:99具有至少65 %序列一致性,與SEQ ID NO:55具有至少90%序列一致性,與SEQ ID NO:37具有至少99%序 列一致性,其中該核酸編碼至少一種具有酰胺酶活性的多肽,所述的 序列一致性通過應用序列比較算法的分析或通過觀察驗證(visual inspection)確定。
一方面,所述分離的或重組的核酸包括在至少大約100個殘基范 圍內,與SEQIDNO:l, SEQIDNO:3, SEQIDNO:5, SEQIDNO:7, SEQIDNO:9, SEQIDNO:ll, SEQIDNO:B, SEQIDNO:15, SEQID NO:17, SEQ ID NO:19, SEQ ID NO:21, SEQ ID NO:23, SEQ ID NO:25, SEQIDNO:31, SEQIDNO:33, SEQIDNO:35, SEQIDNO:39, SEQID NO:41 , SEQ ID NO:43, SEQ ID NO:45, SEQ ID NO:47, SEQ ID NO:49, SEQIDNO:51, SEQIDNO:53, SEQIDNO:59, SEQIDNO:61, SEQ IDNO:63, SEQIDNO:65, SEQ ID NO:67, SEQ ID NO:69, SEQ ID NO:71 , SEQ ID NO:73, SEQ ID NO:75, SEQ ID NO:77, SEQ ID NO:79, SEQIDNO:81, SEQIDNO:83, SEQIDNO:85, SEQIDNO:87, SEQ IDNO:89, SEQ ID NO:91, SEQ ID NO:93, SEQ ID NO:95, SEQ ID NO:97, SEQIDNO:101, SEQIDNO:103, SEQIDNO:105, SEQ ID NO:107, SEQIDNO:109, SEQIDNO:lll, SEQ ID NO:113具有至少 55 %序列一致性的核酸序列。
一方面,所述核酸包括在至少大約100個殘基范圍內,與SEQID NO:l, SEQIDNO:3, SEQIDNO:5, SEQ ID NO:7, SEQIDNO:9, SEQIDNO:ll, SEQIDNO:13, SEQIDNO:15, SEQIDNO:17, SEQ IDNO: 19, SEQ ID NO:21 , SEQ ID NO:23 , SEQ ID NO:25, SEQ ID NO:27, SEQ麗0:29, SEQIDNO:31, SEQIDNO:33, SEQIDNO:35, SEQ ID NO:39, SEQ ID NO:41, SEQ ID NO: 43, SEQ ID NO:45, SEQ ID NO:47, SEQIDNO:49, SEQIDNO:51, SEQIDNO:53, SEQIDNO:57, SEQ ID NO:59, SEQIDNO:61, SEQIDNO:63, SEQ IDNO:65, SEQIDNO:67, SEQIDNO:69, SEQIDNO:71, SEQIDNO:73, SEQIDNO:75, SEQ IDNO:77, SEQ ID NO:79, SEQ ID NO:81, SEQ ID NO:83, SEQ ID NO:85, SEQ ID NO:87, SEQ ID NO:89, SEQ ID NO:91 , SEQ ID NO:93, SEQIDNO:95, SEQIDNO:97, SEQIDNO:101, SEQIDNO:103, SEQ IDNO:105, SEQIDNO:107, SEQIDNO:109, SEQIDNO:lll , SEQ IDNO:113具有至少60%序列一致性的序列。
一方面,所述核酸包括在至少大約100個殘基范圍內,與SEQID NO:l, SEQIDNO:3, SEQIDNO:5, SEQIDNO:7, SEQIDNO:9, SEQ IDNO:ll, SEQIDNO:13, SEQ IDNO:15, SEQIDNO:17, SEQIDNO: 19, SEQIDNO:21, SEQIDNO:23, SEQIDNO:25, SEQIDNO:27, SEQIDNO:29, SEQIDNO:31, SEQIDNO:33, SEQIDNO:35, SEQ IDNO:39, SEQIDNO:41, SEQIDNO:43, SEQIDNO:45, SEQ ID NO:47, SEQIDNO:49, SEQIDNO:51, SEQIDNO:53, SEQIDNO:57, SEQIDNO:59, SEQIDNO:61, SEQIDNO:63, SEQIDNO:65, SEQ IDNO:67, SEQ ID NO:69, SEQIDNO:71, SEQIDNO:73, SEQ ID NO:75, SEQ ID NO:77, SEQ ID NO:79, SEQ ID NO:81 , SEQ ID NO:83, SEQ ID NO:85, SEQ ID NO:87, SEQ ID NO:89, SEQ ID NO:91, SEQ ID NO:93, SEQ ID NO:95, SEQ ID NO:97, SEQ ID NO:99, SEQ ID NO:101, SEQIDNO:103, SEQIDNO: 105, SEQIDNO:107, SEQID NO:脂,SEQIDNO:lll, SEQ ID NO: 113具有至少65%序列一致性 的序列。
一方面,所述核酸包括在至少大約100個殘基范圍內,與SEQID NO:l, SEQIDNO:3, SEQIDNO:5, SEQIDNO:7, SEQIDNO:9, SEQ IDNO:ll, SEQIDNO:13, SEQIDNO:15, SEQIDNO:17, SEQ ID NO:19, SEQIDNO:21, SEQIDNO:23, SEQIDNO:25, SEQIDNO:27, SEQIDNO:29, SEQIDNO:31 , SEQIDNO:33, SEQIDNO:35, SEQIDNO:39, SEQIDNO:41' SEQIDNO:43, SEQIDNO:45, SEQ ID NO:47, SEQIDNO:49, SEQ IDNO:51, SEQIDNO:53, SEQIDNO:57, SEQIDNO:59, SEQIDNO:61, SEQIDNO:63, SEQIDNO:65, SEQ IDNO:67, SEQ ID NO:69, SEQIDNO:71, SEQ ID NO:73, SEQ ID NO:75, SEQ ID NO:77, SEQ ID NO:79, SEQ ID NO:81, SEQ ID NO:83, SEQ ID NO:85, SEQ ID NO:87, SEQ ID NO:89, SEQ ID NO:91, SEQ ID NO:93, SEQ ID NO:95, SEQ ID NO:97, SEQ ID NO:99, SEQ ID NO:101, SEQ ID NO: 103, SEQIDNO:105, SEQIDNO:107, SEQID NO:109, SEQ ID NO: 111, SEQ ID NO:113具有至少70%序列一致性 的序列。
一方面,所述核酸包括在至少大約100個殘基范圍內,與SEQ ID NO:l, SEQIDNO:3, SEQIDNO:5, SEQIDNO:7, SEQIDNO:9, SEQ ID NO: 11 , SEQ ID NO: 13 , SEQ ID NO: 15 , SEQ ID NO: 17 , SEQ ID NO: 19, SEQIDNO:21, SEQIDNO:23, SEQIDNO:25, SEQIDNO:27, SEQIDNO:29, SEQIDNO:31, SEQIDNO:33, SEQIDNO:35, SEQ IDNO:39, SEQIDNO:41, SEQIDNO:43, SEQ ID NO:45, SEQ ID NO:47, SEQ ID NO:49, SEQ ID NO:51 , SEQ ID NO:53, SEQ ID NO:57, SEQIDNO:59, SEQIDNO:61, SEQIDNO:63, SEQIDNO:65, SEQ IDNO:67, SEQ ID NO:69, SEQIDNO:71, SEQIDNO:73, SEQ ID NO:75, SEQ ID NO:77, SEQ ID NO:79, SEQ ID NO:81 , SEQ ID NO:83, SEQIDNO:85, SEQIDNO:87, SEQIDNO:89, SEQIDNO:91, SEQ IDNO:93, SEQIDNO:95, SEQ ID NO:97, SEQ ID NO:99, SEQ ID NO:101, SEQIDNO:103, SEQIDNO:105, SEQIDNO:107, SEQID NO:109, SEQIDNO:lll, SEQ ID NO:113具有至少75%序列一致性 的序列。
一方面,所述核酸包括在至少大約100個殘基范圍內,與SEQID NO:l, SEQIDNO:3, SEQIDNO:5, SEQIDNO:7, SEQIDNO:9, SEQIDNO:ll, SEQIDNO:13, SEQIDNO:15, SEQIDNO:17, SEQID NO: 19, SEQ ID NO:21 , SEQ ID NO:23, SEQ ID NO:25, SEQ ID NO:27, SEQIDNO:29, SEQIDNO:31, SEQIDNO:33, SEQIDNO:35, SEQ IDNO:39, SEQIDNO:41, SEQ ID NO: 43, SEQIDNO:45, SEQIDNO:47, SEQIDNO:49, SEQIDNO:51, SEQIDNO:53, SEQIDNO:57, SEQIDNO:59, SEQIDNO:61, SEQIDNO:63, SEQIDNO:65, SEQ IDNO:67, SEQ ID NO:69, SEQIDNO:71, SEQIDNO:73, SEQ ID NO:75, SEQIDNO:77, SEQIDNO:79, SEQIDNO:81, SEQIDNO:83, SEQIDNO:85, SEQIDNO:87, SEQIDNO:89, SEQIDNO:91, SEQ IDNO:93, SEQ ID NO:95, SEQ ID NO:97, SEQ ID NO:99, SEQ ID NO:101, SEQIDNO:103, SEQIDNO:105, SEQIDNO:107, SEQID NO:109, SEQIDNO:lll, SEQ ID NO:113具有至少80%序列一致性 的序列。
一方面,所述核酸包括在至少大約100個殘基范圍內,與SEQID NO:l, SEQIDNO:3, SEQIDNO:5, SEQ ID NO:7, SEQ ID NO:9, SEQIDNO:ll, SEQIDNO:13, SEQIDNO:15, SEQIDNO:17, SEQ ID NO: 19, SEQ ID NO:21 , SEQ ID NO:23, SEQ ID NO:25, SEQ ID NO:27, SEQIDNO:29, SEQIDNO:31, SEQIDNO:33, SEQIDNO:35, SEQIDNO:39, SEQIDNO:41, SEQIDNO:43, SEQIDNO:45, SEQ IDNO:47, SEQ ID NO:49, SEQIDNO:51, SEQ ID NO:53, SEQ ID NO:57, SEQ IDNO:59, SEQIDNO:61, SEQ IDNO:63, SEQIDNO:65, SEQIDNO:67, SEQIDNO:69, SEQIDNO:71, SEQIDNO:73, SEQ IDNO:75, SEQ ID NO:77, SEQ ID NO:79, SEQIDNO:81, SEQ ID NO:83, SEQ IDNO:85, SEQIDNO:87, SEQ ID NO:89, SEQIDNO:91, SEQIDNO:93, SEQIDNO:95, SEQIDNO:97, SEQIDNO:99, SEQ IDNO:101, SEQIDNO:103, SEQIDNO:105, SEQIDNO:107, SEQ IDNO:109, SEQIDNO:lll, SEQ IDNO: 113具有至少85%序列一致 性的序列。
一方面,所述核酸包括在至少大約100個殘基范圍內,與SEQID NO:l, SEQIDNO:3, SEQIDNO:5, SEQ ID NO:7, SEQ ID NO:9, SEQIDNO:ll, SEQIDNO:13, SEQIDNO:15, SEQIDNO:17, SEQ ID NO: 19, SEQ ID NO:21 , SEQ ID NO:23, SEQ ID NO:25, SEQ ID NO:27, SEQ IDNO:29, SEQ ID NO:31, SEQ IDNO:33, SEQIDNO:35, SEQIDNO:39, SEQIDNO:41, SEQIDNO:43, SEQIDNO:45, SEQ IDNO:47, SEQ ID NO:49, SEQIDNO:51, SEQ ID NO:53, SEQ IDNO:55, SEQ ID NO:57, SEQ ID NO:59, SEQ ID NO:61 , SEQ ID NO:63, SEQIDNO:65, SEQIDNO:67, SEQIDNO:69, SEQIDNO:71, SEQ IDNO:73, SEQIDNO:75, SEQ ID NO:77, SEQ ID NO:79, SEQ ID NO:81 , SEQ ID NO:83, SEQ ID NO:85, SEQ ID NO:87, SEQ ID NO:89, SEQIDNO:91, SEQIDNO:93, SEQIDNO:95, SEQIDNO:97, SEQ IDNO:99, SEQIDNO:101, SEQ ID NO: 103, SEQIDNO:105, SEQ ID NO: 107, SEQ ID NO: 109, SEQ ID NO: 111, SEQ ID NO:113具有至少 90%序列一致性的序列。
一方面,所述核酸包括在至少大約100個殘基范圍內,與SEQ ID NO:l, SEQIDNO:3, SEQIDNO:5, SEQIDNO:7, SEQIDNO:9, SEQ IDNO:ll, SEQIDNO:13, SEQIDNO:15, SEQIDNO:17, SEQIDNO: 19, SEQIDNO:21, SEQIDNO:23, SEQIDNO:25, SEQIDNO:27, SEQIDNO:29, SEQIDNO:31, SEQIDNO:33, SEQIDNO:35, SEQ IDNO:39, SEQIDNO:41, SEQIDNO:43, SEQ ID NO:45, SEQ ID NO:47, SEQIDNO:49, SEQIDNO:51, SEQ IDNO:53, SEQIDNO:55, SEQIDNO:57, SEQIDNO:59, SEQIDNO:61, SEQIDNO:63, SEQ IDNO:65, SEQIDNO:67, SEQ ID NO:69, SEQIDNO:71, SEQ ID NO:73, SEQ ID NO:75, SEQ ID NO:77, SEQ ID NO:79, SEQ ID NO:81 , SEQIDNO:83, SEQIDNO:85, SEQIDNO:87, SEQIDNO:89, SEQ IDNO:91, SEQIDNO:93, SEQ ID NO:95, SEQ ID NO:97, SEQ ID NO:99, SEQIDNO:101, SEQIDNO:103, SEQIDNO:105, SEQ ID NO:107, SEQIDNO:109, SEQIDNO:lll, SEQ ID NO:113具有至少 95%序列一致性的序列。
一方面,所述核酸包括在至少大約100個殘基范圍內,與SEQID NO:l, SEQIDNO:3, SEQIDNO:5, SEQIDNO:7, SEQ ID NO:9, SEQIDNO:ll, SEQIDNO:13, SEQIDNO:15, SEQIDNO:17, SEQ ID NO: 19, SEQIDNO:21, SEQIDNO:23, SEQIDNO:25, SEQ ID NO:27, SEQ IDNO:29, SEQ IDNO:31, SEQIDNO:33, SEQIDNO:35, SEQIDNO:37, SEQIDNO:39, SEQIDNO:41, SEQIDNO:43, SEQ IDNO:45, SEQIDNO:47, SEQ ID NO:49, SEQIDNO:51, SEQ ID NO:53, SEQIDNO:55, SEQIDNO:57, SEQIDNO:59, SEQ IDNO:61,SEQIDNO:63, SEQIDNO:65, SEQIDNO:67, SEQIDNO:69, SEQ IDNO:71, SEQIDNO:73, SEQ ID NO:75, SEQ ID NO:77, SEQ ID NO:79, SEQIDNO:81, SEQIDNO:83, SEQIDNO:85, SEQIDNO:87, SEQIDNO:89, SEQIDNO:91, SEQIDNO:93, SEQIDNO:95, SEQ IDNO:97, SEQIDNO:99, SEQIDNO:101, SEQIDNO:103, SEQ ID NO:105, SEQIDNO:107, SEQIDNO:109, SEQIDNO:lll, SEQ ID NO:113具有至少99%序列一致性的序列。
一方面,所述核酸序列包括在SEQIDNO:l, SEQIDNO:3, SEQ IDNO:5, SEQIDNO:7, SEQIDNO:9, SEQIDNO:ll, SEQIDNO:13, SEQIDNO:15, SEQIDNO:17, SEQIDNO:19, SEQIDNO:21, SEQ IDNO:23, SEQIDNO:25, SEQIDNO:27, SEQ ID NO:29, SEQ ID NO:31, SEQIDNO:33, SEQIDNO:35, SEQIDNO:37, SEQ IDNO:39, SEQIDNO:41, SEQIDNO:43, SEQIDNO:45, SEQIDNO:47, SEQ IDNO:49, SEQIDNO:51, SEQ ID NO:53, SEQ ID NO:55, SEQ ID NO:57, SEQ ID NO:59, SEQ ID NO:61 , SEQ ID NO:63, SEQ ID NO:65, SEQIDNO:67, SEQIDNO:69, SEQE)NO:71, SEQIDNO:73, SEQ IDNO:75, SEQ ID NO:77, SEQ ID NO:79, SEQIDNO:81, SEQ ID NO:83, SEQIDNO:85, SEQIDNO:87, SEQIDNO:89, SEQIDNO:91, SEQIDNO:93, SEQIDNO:95, SEQE)NO:97, SEQIDNO:99, SEQ ID NO: 101, SEQ ID NO: 103, SEQ ID NO: 105, SEQ ID NO: 107, SEQ IDNO:109, SEQ ID NO: 111, SEQIDNO:113中闡明的序列。
本發明提供編碼包括在SEQ ID NO:2, SEQ ID NO:4, SEQ ID NO:6, SEQIDNO:8, SEQ ID NO: 10, SEQIDNO:12, SEQIDNO:14, SEQIDNO:16, SEQIDNO:18, SEQIDNO:20, SEQIDNO:22, SEQ IDNO:24, SEQ ID NO:26, SEQIDNO:28, SEQ ID NO:30, SEQ ID NO:32, SEQ ID NO:34, SEQ ID NO:36, SEQ ID NO:38, SEQ ID NO:40, SEQIDNO:42, SEQIDNO:44, SEQIDNO:46, SEQIDNO:48, SEQ ID NO.50, SEQ ID NO:52, SEQ ID NO:54, SEQ ID NO:56, SEQ ID NO:58, SEQIDNO:60, SEQIDNO:62, SEQIDNO:64, SEQIDNO:66, SEQ IDNO:68, SEQ ID NO:70, SEQ ID NO:72, SEQ ID NO:74, SEQ ID NO:76, SEQ ID NO:78, SEQ ID NO:80, SEQ ID NO:82, SEQ ID NO:84,SEQIDNO:86, SEQIDNO:88, SEQIDNO:90, SEQIDNO:92, SEQ IDNO:94, SEQIDNO:96, SEQIDNO:98, SEQIDNO:100, SEQ ID NO:102, SEQIDNO:104, SEQIDNO:106, SEQIDNO:108, SEQ ID NO:llO, SEQIDNO:113, SEQ ID NO:114中所列序列的多肽的分離的 或重組的核酸。
一方面,所述序列比較運算是BLAST版本2.2.2運算,其中過濾 設置設為blastall-p blastp-d "nr pataa"-F F,其它所有選項都設為默認值。
一方面,所述核酸包括在至少大約200, 300, 400, 500, 550, 600, 或650個殘基范圍內,與SEQIDNO:l, SEQIDNO:3, SEQIDNO:5, SEQIDNO:7, SEQIDNO:9, SEQIDNO:ll, SEQIDNO:13, SEQID NO:15, SEQ IDNO:17, SEQIDNO:19, SEQIDNO:21, SEQIDNO:23, SEQIDNO:25, SEQIDNO:27, SEQIDNO:29, SEQIDNO:31, SEQ IDNO:33, SEQIDNO:35, SEQ ID NO:37, SEQ ID NO:39, SEQ ID NO:41. SEQ ID NO:43, SEQ ID NO:45, SEQ ID NO:47, SEQ ID NO:49, SEQ ID NO:51, SEQ ID NO:53, SEQ ID NO:55, SEQ ID NO:57, SEQ ID NO:59, SEQ IDNO:61, SEQIDNO:63, SEQIDNO:65, SEQIDNO:67, SEQIDNO:69, SEQIDNO:71, SEQIDNO:73, SEQIDNO:75, SEQ IDNO:77, SEQ ID NO:79, SEQIDNO:81, SEQIDNO:83, SEQ ID NO:85, SEQ ID NO:87, SEQ ID NO:89, SEQ ID NO:91 , SEQ ID NO:93, SEQIDNO:95, SEQIDNO:97, SEQIDNO:99, SEQIDNO:101, SEQ ID NO: 103, SEQIDNO:105, SEQIDNO:107, SEQIDNO:109, SEQ ID NO: 111, SEQIDNO:113具有至少50X序列一致性的序列。
一方面,所述核酸包括在至少大約700個殘基范圍內,與SEQID NO:l, SEQIDNO:3, SEQIDNO:5, SEQIDNO:7, SEQIDNO:9, SEQ IDNO:ll, SEQIDNO:13, SEQIDNO:15, SEQIDNO:17, SEQIDNO: 19, SEQIDNO:21, SEQIDNO:25, SEQIDNO:27, SEQIDNO:29, SEQIDNO:31, SEQIDNO:33, SEQIDNO:35, SEQIDNO:37, SEQ IDNO:39, SEQIDNO:41, SEQIDNO:43, SEQ ID NO:47, SEQ ID NO:49, SEQIDNO:51, SEQIDNO:53, SEQIDNO:55, SEQIDNO:57, SEQIDNO:59, SEQIDNO:61, SEQEDNO:63, SEQIDNO:65, SEQ IDNO:67, SEQ ID NO:69, SEQIDNO:71, SEQ ID NO:73, SEQ IDNO:75, SEQ ID NO:77, SEQ ID NO:79, SEQ ID NO:81 , SEQ ID NO:83, SEQIDNO:85, SEQIDNO:87, SEQIDNO:89, SEQIDNO:91, SEQ IDNO:93, SEQIDNO:95, SEQ ID NO:97, SEQ ID NO:99, SEQID NO:101, SEQIDNO:103, SEQ ID NO: 105, SEQIDNO:107, SEQID NO:109, SEQIDNO:lll, SEQ ID NO: 113具有至少50%序列一致性 的序列。
一方面,所述核酸包括在至少大約800個殘基范圍內,與SEQ ID NO:l, SEQIDNO:3, SEQIDNO:5, SEQ ID NO:7, SEQ ID NO:9, SEQIDNO:13, SEQIDNO:15, SEQIDNO:17, SEQIDNO:19, SEQ IDNO:21, SEQIDNO:25, SEQ ID NO:27, SEQIDNO:31, SEQ ID NO:33, SEQIDNQ:35, SEQIDNO:39, SEQIDNO:41, SEQIDNO: 43, SEQIDNO:47, SEQIDNO:49, SEQIDNO:51, SEQIDNO:53, SEQIDNO:59, SEQIDNO:61, SEQIDNO:63, SEQIDNO:65, SEQ IDNO:67, SEQ ID NO:69, SEQIDNO:73, SEQ ID NO:75, SEQ ID NO:77, SEQIDNO:79, SEQ IDNO:81, SEQIDNO:83, SEQIDNO:85, SEQIDNO:87, SEQIDNO:89, SEQIDNO:91, SEQIDNO:93, SEQ IDNO:95, SEQIDNO:97, SEQIDNO:99, SEQIDNO:101, SEQ ID NO:103, SEQIDNO:105, SEQIDNO:107, SEQIDNO:lll, SEQID NO:113具有至少50%序列一致性的序列。
一方面,所述核酸包括在至少大約900個殘基范圍內,與SEQID NO:3, SEQIDNO:5, SEQIDNO:9, SEQIDNO:13, SEQIDNO:15, SEQIDNO:17, SEQIDNO:19, SEQIDNO:21, SEQIDNO:31, SEQ IDNO:35, SEQ ID NO:39, SEQ ID NO:47, SEQ ID NO:49, SEQ ID NO:53, SEQIDNO:61, SEQIDNO:63, SEQIDNO:65, SEQIDNO:73, SEQIDNO:75, SEQIDNO:81, SEQIDNO:83, SEQIDNO:87, SEQ IDNO:89, SEQIDNO:95, SEQ ID NO:97, SEQ ID NO:99, SEQ ID NO:101, SEQIDNO:103, SEQIDNO:105, SEQIDNO:107, SEQ ID NO: 111 , SEQ ID NO: 113具有至少50 %序列一致性的序列。
一方面,所述核酸包括在至少大約900個殘基范圍內,與SEQ ID NO:3, SEQIDNO:5, SEQIDNO:9, SEQIDNO:13, SEQIDNO:15, SEQIDNO:17, SEQIDNO:19, SEQIDNO:21, SEQIDNO:31, SEQIDNO:35, SEQ ID NO:39, SEQ ID NO :47, SEQ ID NO :49, SEQID NO:53, SEQ IDNO:61, SEQIDNO:63, SEQIDNO:65, SEQIDNO:73, SEQIDNO:75, SEQIDNO:81, SEQIDNO:83, SEQIDNO:87, SEQ IDNO:89, SEQIDNO:95, SEQ ID NO:97, SEQ ID NO:99, SEQ ID NO:101, SEQIDNO:103, SEQIDNO:105, SEQIDNO:107, SEQID NO: 111 , SEQ ID NO: 113具有至少50%序列一致性的序列。
一方面,所述核酸包括在至少大約1000個殘基范圍內,與SEQID NO:15, SEQ IDNO:17, SEQIDNO:19, SEQIDNO:21, SEQIDNO:31, SEQIDNO:35, SEQIDNO:47, SEQIDNO:49, SEQIDNO:53, SEQ IDNO:61, SEQIDNO:63, SEQ ID NO:65, SEQIDNO:73, SEQ ID NO:75, SEQIDNO:81, SEQIDNO:87, SEQIDNO:89, SEQIDNO:95, SEQ ID NO:97, SEQ ID NO:99, SEQ ID NO:101 , SEQ ID NO: 103, SEQIDNO:105, SEQIDNO:107, SEQIDNO:lll, SEQ ID NO: 113 具有至少50%序列一致性的序列。
一方面,所述核酸包括在至少大約1200個殘基范圍內,與SEQID NO:31, SEQIDNO:35, SEQIDNO:47, SEQIDNO:49, SEQIDNO:53, SEQIDNO:61, SEQIDNO:63, SEQIDNO:65, SEQIDNO:73, SEQ IDNO:75, SEQ ID NO:81, SEQ ID NO:87, SEQ ID NO:89, SEQ ID NO:97, SEQIDNO:99, SEQ ID NO:101, SEQ ID NO: 105, SEQID NO:107, SEQIDNO:lll具有至少50%序列一致性的序列。
本發明提供分離的或重組的核酸,其中所述核酸包括在嚴緊條件 下與包括在SEQ IDNO:l, SEQIDNO:3, SEQIDNO:5, SEQIDNO:7, SEQIDNO:9, SEQIDNO:ll, SEQIDNO:13, SEQIDNO:15, SEQID NO:17, SEQIDNO:19, SEQ IDNO:21, SEQ IDNO:23, SEQIDNO:25, SEQIDNO:27, SEQIDNO:29, SEQIDNO:31, SEQIDNO:33, SEQ ID NO:35, SEQ ID NO:37, SEQ ID NO:39, SEQ ID NO:41 , SEQ ID NO: 43, SEQIDNO:45, SEQIDNO:47, SEQIDNO:49, SEQIDNO:51, SEQIDNO:53, SEQIDNO:55, SEQIDNO:57, SEQIDNO:59, SEQ IDNO:61, SEQIDNO:63, SEQ ID NO:65, SEQ ID NO:67, SEQ ID NO:69, SEQIDNO:71, SEQIDNO:73, SEQIDNO:75, SEQIDNO:77, SEQ ID NO:79, SEQ ID NO:81, SEQ ID NO:83, SEQ ID NO:85, SEQ IDNO:87, SEQ ID NO:89, SEQIDNO:91, SEQIDNO:93, SEQ IDNO:95, SEQIDNO:97, SEQIDNO:99, SEQIDNO:101, SEQIDNO:103, SEQ IDNO:105, SEQIDNO:107, SEQIDNO:109, SEQIDNO:lll, SEQID NO:113中所列序列的核酸雜交的序列,其中所述核酸編碼具有酰胺酶 活性的多肽。
一方面,所述核酸的長度為至少大約50, 100, 150, 200, 300, 400或500個殘基。 一方面,所述核酸的長度為至少大約600, 700, 800, 900, 1000, 1100或1200個殘基或者基因或轉錄物的全長。
一方面,所述嚴緊條件包括洗滌步驟,該洗滌步驟包括在大約65°C 的溫度,在0.2xSSC中洗滌大約15分鐘。
一方面,所述酰胺酶活性包括水解酰胺鍵。所述酰胺酶活性可以 包括二級酰胺酶活性。 一方面,所述酰胺酶活性包括內酰胺酶活性。 一方面,所述酰胺酶活性包括C-端酰胺酶活性。所述酰胺酶活性可以 包括N-端酰胺酶活性。所述酰胺酶活性可以包括水解蛋白中的函胺鍵。 所述酰胺酶活性可以包括水解在藥物或藥物組合物中的酰胺鍵,所述 藥物例如頭孢菌素,如頭孢菌素C。 一方面,所述酰胺酶活性包括水 解在頭孢菌素C中的酰胺鍵產生7-氨基頭孢垸酸(7-ACA)。
一方面,所述酰胺酶活性具有對映選擇性。所述酰胺酶可以從消 旋混合物中產生對映結構純的L-氨基酸。所述酰胺酶可以通過氨基酸 垸基酯或N-保護的肽烷基酯的酶促轉化產生肽。
一方面,所述酰胺酶在包括溫度在約37t到約95"C的條件下保持 活性。所述酰胺酶在包括溫度在約55'C到約85"C的條件下可以保持活 性。
一方面,所述酰胺酶活性是耐熱性的。在暴露于大于37""C到大約 95"C的溫度后,所述酰胺酶可以是耐熱性的。
本發明提供核酸探針,所述核酸探針用于確定編碼具有酰胺酶活 性的多肽的核酸,其中所述探針包括本發明的一種核酸序列的至少10 個連續堿基。本發明提供核酸探針,所述核酸探針用于確定編碼具有 酰胺酶活性的多肽的核酸,其中所述探針包括含有與本發明的核酸序 列具有至少50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90 %, 95%, 98%, 99%或更高序列一致性的核酸序列的核酸,其中所述序列一致性通過應用序列比較運算的分析或通過觀察驗證確定。一 方面,所述探針可以包括含有一種核酸序列的至少大約10到50,大約
20到60,大約30到70,大約40到80,或大約60到100,或大約70 到150個連續堿基的寡聚核苷酸。
本發明提供擴增引物序列對,所述擴增引物序列對用于擴增編碼 本發明的多肽,例如具有酰胺酶活性的多肽的核酸,其中所述引物對 可以擴增本發明的核酸序列。所述擴增引物序列對的一個或者每個構 件都包括可以含有序列的至少大約10到50個連續堿基的寡聚核苷酸。 本發明提供擴增編碼具有酰胺酶活性的多肽的核酸的方法,包括用能 夠擴增本發明的核酸序列的擴增弓I物序列對擴增模板核酸。
本發明提供包括本發明的核酸的表達序列盒。 一方面,所述核酸 可以有效連接(operably linked to)于動物或植物啟動子。 一方面,所 述表達序列盒可以進一步包括植物表達載體。所述植物表達載體可以 包括植物病毒。 一方面,所述植物啟動子可以包括馬鈴薯,水稻,玉 米,小麥或大麥啟動子。 一方面,所述啟動子可以包括來源于根癌農 桿菌(v4gra^cten'wm fwme/adews)的T-DNA的啟動子。 一方面,所述 啟動子可以是組成型啟動子。所述組成型啟動子可以是CaMV35S。另 一方面,所述啟動子可以是誘導型啟動子。 一方面,所述啟動子可以 是具有組織特異性的啟動子。所述的組織特異的啟動子可以是種子特 異的,葉特異的,根特異的,莖特異的或脫落誘導的(abscission-induced) 啟動子。
本發明提供包括本發明的核酸的載體。本發明提供包括本發明的 載體或本發明的核酸的克隆媒介物(vehicle)。 一方面,所述克隆媒介 物可以包括病毒載體,質粒,噬菌體,噬粒(phagemid),粘粒(cosmid), fos-質粒(fosmid),細菌噬菌體或人工染色體。 一方面,所述病毒載體 可以包括腺病毒載體,逆轉錄病毒載體或腺相關病毒載體。另一方面, 所述克隆媒介物可以包括細菌人工染色體(BAC),質粒,細菌噬菌 體P1衍生的載體(PAC),酵母人工染色體(YAC)或哺乳動物人工 染色體(MAC)。
本發明提供包含本發明的載體、本發明的核酸或本發明的克隆媒 介物的轉化細胞。 一方面,所述細胞可以是細菌細胞,哺乳動物細胞,真菌細胞,酵母細胞,昆蟲細胞或植物細胞。 一方面,所述植物細胞 可以是馬鈴薯,水稻,玉米,小麥,煙草或大麥細胞。
本發明提供包含本發明的載體、本發明的核酸或本發明的克隆媒 介物的轉基因非人動物。
一方面,所述動物可以是鼠。
本發明提供包含本發明的載體、本發明的核酸或本發明的克隆媒 介物的轉基因植物。
一方面,所述植物可以是玉米植物,高梁植物, 馬鈴薯植物,西紅柿植物,小麥植物,油籽植物,油菜籽植物,大豆 植物,水稻植物,大麥植物,草或煙草植物。
本發明提供包含本發明的載體、本發明的核酸或本發明的克隆媒 介物的轉基因種子。
一方面,所述種子可以是玉米種,小麥種,油籽, 油菜籽,大豆種,棕櫚仁,向日葵籽,芝麻籽,水稻,大麥,花生, 或煙草植物的種子。
本發明提供包括本發明的核酸序列或其子序列(subsequence)的 反義寡聚核苷酸。 一方面,所述反義寡聚核苷酸的長度可以是大約10 個堿基到50個堿基,大約20堿基到60個堿基,大約30個堿基到70 個堿基,大約40個堿基到80個堿基,或大約60個堿基到100個堿基。
本發明提供抑制酰胺酶信息(message)在細胞內的翻譯的方法, 包括往所述細胞內注入或在所述細胞內表達反義寡聚核苷酸,所述反 義寡聚核苷酸包括在嚴緊條件下與本發明的核酸互補或能夠雜交的核 酸序列。
本發明提供分離的或重組的多肽,所述多肽包括(a)在至少大約 100個殘基的范圍內,與SEQIDNO:2, SEQIDNO:4, SEQIDNO:6, SEQIDNO:8, SEQIDNO:10, SEQIDNO:12, SEQIDNO:14, SEQID NO:16, SEQ IDNO:18, SEQIDNO:20, SEQIDNO:22, SEQIDNO:24, SEQIDNO:26, SEQIDNO:32, SEQIDNO:34, SEQIDNO:40, SEQ IDNO:42, SEQ ID NO:44, SEQ ID NO:46, SEQ ID NO:48, SEQ ID NO:50, SEQ ID NO:52, SEQ ID NO:54, SEQ ID NO:60, SEQ ID NO:62, SEQIDNO:64, SEQIDNO:66, SEQIDNO:68, SEQIDNO:70, SEQ IDNO:72, SEQ ID NO:76, SEQ ID NO:78, SEQ ID NO:80, SEQ ID NO:82, SEQ ID NO:85, SEQ ID NO:87, SEQ ID NO:88, SEQ ID NO:92, SEQIDNO:94, SEQIDNO:96, SEQIDNO:98, SEQIDNO:102, SEQIDNO:104, SEQIDNO:106, SEQIDNO:108, SEQIDNO:llO, SEQ ID NO:112具有至少50%序列一致性,與SEQ ID NO:36, SEQ ID NO:74, SEQ ID NO:90, SEQ ID NO:114具有至少55%序列一致性, 與SEQ ID NO:28, SEQ ID NO:30, SEQ ID NO:58具有至少60%序列 一致性,與SEQ ID NO:100具有至少65X序列一致性,與SEQ ID NO:56 具有至少90%序列一致性,與SEQ ID NO:38具有至少99%序列一致 性的序列;或者(b)由本發明的核酸編碼的多肽。 一方面,所述多肽可以具有酰胺酶活性。
一方面,所述多肽包括在至少大約150, 200, 250, 300, 350, 400, 450或500個殘基的序列區域具有至少50%—致性的氨基酸序列。一 方面,所述多肽包括在至少大約100個殘基的區域具有至少55%, 60 %, 65%, 70%, 75%, 80%, 85%, 90%, 95%或99%—致性的氨 基酸序列。
一方面,所述分離的或重組的多肽可以包括在SEQIDNO:2, SEQ IDN0:4, SEQIDNO:6, SEQ IDNO:8, SEQIDNO:10, SEQIDNO:12, SEQIDNO:14, SEQIDN0:16, SEQIDNO:18, SEQIDNO:20, SEQ IDNO:22, SEQ ID NO:24, SEQ ID NO:26, SEQ ID NO:28, SEQ ID NO:30, SEQ IDNO:32, SEQIDNO:34, SEQIDNO:36, SEQIDNO:38, SEQIDNO:40, SEQIDNO:42, SEQIDNO:44, SEQIDNO:46, SEQ IDNO:48, SEQ ID NO:50, SEQ ID NO:52, SEQ ID NO:54, SEQ ID NO:56, SEQ ID NO:58, SEQ ID NO:60, SEQ ID NO:62, SEQ ID NO:64, SEQIDNO:66, SEQIDNO:68, SEQIDNO:70, SEQIDNO:72, SEQ IDNO:74, SEQ ID NO:76, SEQ ID NO:78, SEQ ID NO:80, SEQ ID NO:82, SEQ ID NO:84, SEQ ID NO:86, SEQ ID NO:88, SEQ ID NO:90, SEQIDNO:92, SEQIDNO:94, SEQIDNO:96, SEQIDNO:98, SEQ IDNO:100, SEQIDNO:102, SEQIDNO:104, SEQIDNO:106, SEQ IDNO:108, SEQIDNO:110, SEQIDNO:113, SEQ ID NO:114中所 列的氨基酸序列。
一方面,所述酰胺酶活性包括水解酰胺鍵。所述酰胺酶活性可以 包括二級酰胺酶活性。 一方面,所述酰胺酶活性包括內酰胺酶活性。 一方面,所述酰胺酶活性包括C-端酰胺酶活性。所述酰胺酶活性可以包括N-端酰胺酶活性。所述酰胺酶活性可以包括水解蛋白中的酰胺鍵。 所述酰胺酶活性可以包括水解在藥物或藥物組合物中的酰胺鍵,所述 藥物例如頭孢菌素,如頭孢菌素C。
一方面,所述酰胺酶活性包括水
解在頭孢菌素C中的酰胺鍵產生7-氨基頭孢烷酸(7-ACA)。
一方面,所述酰胺酶活性具有對映選擇性。所述酰胺酶可以從消
旋混合物中產生對映結構純的L-氨基酸。所述酰胺酶可以通過氨基酸 烷基酯或N-保護的肽烷基酯的酶促轉化產生肽。
一方面,本發明提供分離的或重組的多肽,其中所述酰胺酶活性 是熱穩定的。 一方面,所述多肽在包括溫度在大約37X:到大約95'C的 條件下可以保持酰胺酶活性。另一方面,所述多肽可以在包括大約55°C 到大約85t:的溫度范圍,大約7(TC到大約95'C的溫度范圍,或者大約 90'C到大約95t:的溫度范圍的條件下保持酰胺酶活性。
另一方面,本發明提供分離的或重組的多肽,其中所述酰胺酶活 是耐熱的。 一方面,所述多肽在暴露于大于37X:到大約95-C的溫度范 圍,大于55'C到大約85t:的溫度范圍,大于9(TC到大約95'C的溫度 范圍后保持酰胺酶活性。
本發明提供包含本發明的多肽并缺少信號序列的分離的或重組的 多肽。
一方面,本發明提供本發明的分離的或重組的多肽,其中所述酰 胺酶活性包括在大約37°C,大約100到大約1000單位(units)每毫克 蛋白的范圍內的比活。 一方面,所述酰胺酶活性可以包括在大約37。C, 大約500到大約750單位每毫克蛋白的范圍內,大約500到大約1200 單位每毫克蛋白的范圍內,或者大約750到大約1000單位每毫克蛋白 的范圍內的比活。 一方面,所述耐熱性可以包括被加熱到一個提高的 溫度后,仍保留該酰胺酶在37。C時的比活的至少一半。另一方面,所 述耐熱性可以包括被加熱到一個提高的溫度后,仍保留在37。C時大約 500到大約1200單位每毫克蛋白的范圍內的比活。
一方面,本發明的分離的或重組的多肽可以包括至少一個糖基化 位點。 一方面,糖基化可以是N-連接的糖基化。 一方面,本發明的多 肽可以在畢赤酵母(尸.pa^on》)或裂變酵母(5*. ; om&)中被表達之 后進行糖基化。本發明提供本發明的分離的或重組的多肽,其中所述多肽在包括
大約pH4.5或pH5或更小pH的條件下保持酰胺酶活性。 一方面,所 述多肽在包括大約pH 8.0, pH 8.5, pH 9, pH 9.5, pH 10或pH 10.5
或更大pH的條件下保持酰胺酶活性。
本發明提供包含本發明的多肽的蛋白制備物,其中所述蛋白制備 物包含液體,固體或凝膠。
一方面,本發明提供包括本發明的多肽和第二結構域的異源二聚 體。 一方面,所述第二結構域可以是一個多肽,所述異源二聚體是融 合蛋白。另一方面,所述第二結構域可以是抗原決定部位(epitope) 或標記(tag)。本發明提供包括本發明的多肽的同型二聚體。
本發明提供具有酰胺酶活性的固定化多肽,其中所述多肽包括本 發明的多肽或含有本發明的多肽的異源二聚體。 一方面,所述多肽可 以固定在細胞,金屬,樹脂,聚合物,陶瓷,玻璃,微電極,石墨顆 粒,珠子,凝膠,平板,陣列或毛細管上。本發明提供包括本發明的 固定化多肽的陣列。 一方面,陣列可以包含本發明的固定化核酸。
本發明提供分離的或重組的抗體,所述抗體特異地與本發明的多 肽結合,或者與由本發明的核酸編碼的多肽結合。 一方面,所述抗體 可以是單克隆抗體或多克隆抗體。本發明提供包括本發明的抗體的雜 交瘤細胞。
本發明提供包含本發明的多肽的動物食品添加劑。本發明提供包 含本發明的多肽的可食用的酶釋放基質(enzyme delivery matrices)。
本發明提供分離或鑒定具有酰胺酶活性的多肽的方法,包括步驟 (a)提供本發明的抗體;(b)提供包含多肽的樣品;(c)把步驟(b) 的樣品與步驟(a)的抗體在所述抗體可以特異地與多肽結合的條件下 接觸,由此分離或鑒定具有酰胺酶活性的多肽。
本發明提供制備抗酰胺酶抗體的方法,包括對非人動物按足以導 致體液免疫應答的量施用本發明的核酸,本發明的多肽,或由本發明 的核酸編碼的多肽,由此制備抗酰胺酶抗體。
本發明提供產生重組多肽的方法,包括步驟(a)提供與啟動子 有效連接的核酸,其中所述核酸包括本發明的核酸;(b)在允許多肽 表達的條件下表達步驟(a)的所述核酸,由此產生重組多肽。 一方面,該方法可以進一步包括用步驟(a)的所述核酸轉化宿主細胞,然后再 表達步驟(a)的所述核酸,從而在被轉化的細胞中產生重組多肽。 本發明提供鑒定具有酰胺酶活性的多肽的方法,包括以下步驟-
(a) 提供本發明的多肽;(b)提供酰胺酶底物;(c)將多肽與步驟
(b) 的底物接觸,檢測底物的量的減少或者反應產物的量的增加,其 中所述底物的量的減少或所述反應產物的量的增加表示檢測到具有酰 胺酶活性的多肽。 一方面,所述底物可以是蛋白質或酰胺。 一方面, 所述底物可以是頭孢菌素C。
本發明提供鑒定酰胺酶底物的方法,包括以下步驟(a)提供本 發明的多肽;(b)提供受測底物;(c)將步驟(a)的多肽與步驟(b) 的受測底物接觸,受測底物的量的減少或者反應產物的量的增加,其 中所述底物的量的減少或所述反應產物的量的增加確定所述受測底物 是酰胺酶底物。
本發明提供確定受測化合物是否與多肽特異性結合的方法,包括 以下步驟(a)在允許核酸翻譯為多肽的條件下,表達核酸或包含核
酸的載體,其中所述核酸包括本發明的核酸,或者,提供本發明的多
肽;(b)提供受測化合物;(c)將所述多肽與所述受測化合物接觸; (d)確定步驟(b)的受測化合物是否特異性地與所述多肽結合。 本發明提供鑒定酰胺酶活性的調節物的方法,包括以下步驟(a) 提供本發明的多肽或由本發明的核酸編碼的多肽;(b)提供受測化合 物;(c)將步驟(a)的多肽與步驟(b)的受測化合物接觸,并測定 .酰胺酶活性,其中在受測化合物存在的情況下測定的酰胺酶活性與無 受測化合物的情況下測定的酰胺酶活性的變化確定所述受測化合物調 節了酰胺酶活性。 一方面,所述酰胺酶活性可以通過提供酰胺酶底物, 并檢測所述底物的量的減少或反應產物的量的增加,或者所述底物的 量的增加或反應產物的量減少來測定。 一方面,與沒有受測化合物時 底物或反應產物的量相比較,在有所述受測化合物時所述底物的量的 減少或所述反應產物的量的增加確定所述受測化合物是酰胺酶活性的 激活劑。另一方面,與沒有受測化合物時底物或反應產物的量相比較, 在有所述受測化合物時所述底物的量的增加或所述反應產物的量的減 少確定所述受測化合物是酰胺酶活性的抑制劑。本發明提供包括處理器和數據儲存設備的計算機系統,其中所述 數據儲存設備儲存有本發明的多肽,或由本發明的核酸編碼的多肽。 一方面,所述計算機系統可以進一步包括序列比較運算和儲存有至少 一個參考序列的數據儲存設備。所述序列比較運算可以包括說明多態 性的計算機程序。另一方面,所述計算機系統可以進一步包括識別所
述序列的一個或多個特征的識別器(identifier)。
本發明提供儲存有多肽序列或核酸序列的計算機可讀介質,其中 所述多肽序列包括本發明的多肽或由本發明的核酸編碼的多肽。'
本發明提供識別在序列中的特征的方法,包括步驟(a)應用識 別序列中一個或多個特征的計算機程序讀出序列,其中所述序列包括 多肽序列或核酸序列,其中所述多肽序列包括本發明的多肽或由本發 明的核酸編碼的多肽;(b)用計算機程序識別所述序列中的一個或多 個特征。
本發明提供比較第一序列和第二序列的方法,包括步驟(a)通 過應用比較序列的計算機程序讀出第一序列和第二序列,其中所述第 一序列包括多肽序列或核酸序列,其中所述多肽序列包括本發明的多 肽或由本發明的核酸編碼的多肽;(b)用計算機程序確定所述第一序 列和所述第二序列之間的不同。 一方面,確定第一序列和第二序列之 間的不同的步驟可以進一步包括識別多態性的步驟。 一方面,所述方 法可以進一步包括識別序列中一個或多個特征的識別器。另一方面, 所述方法可以包括應用計算機程序讀出第一序列,并識別該序列中的 一個或多個特征。
本發明提供從環境樣品中分離或回收編碼具有酰胺酶活性的多肽 的核酸的方法,包括步驟(a)提供用于擴增編碼具有酰胺酶活性的
多肽的核酸的擴增引物序列對,其中所述引物對能夠擴增本發明的核
酸或其子序列;(b)從所述環境樣品中分離核酸或者處理所述環境樣 品,以便所述樣品中的核酸可以與所述擴增引物對雜交;(c)把步驟 (b)的核酸與步驟(a)的擴增引物對組合,擴增從所述環境樣品中 得到的核酸,由此從環境樣品中分離或回收編碼具有酰胺酶活性的多 肽的核酸。 一方面,所述擴增引物序列對的一個或各個構件可以包括 含有本發明的序列或其子序列的至少大約10到50個連續堿基的寡聚核苷酸。
本發明提供從環境樣品中分離或回收編碼具有酰胺酶活性的多肽 的核酸的方法,包括步驟(a)提供包含本發明的核酸的多核苷酸探 針;(b)從所述環境樣品中分離核酸或者處理所述環境樣品,以便所
述樣品中的核酸可以與步驟(a)的多核苷酸探針雜交;(c)把步驟(b) 的所述分離的核酸或所述被處理的環境樣品與步驟(a)的多核苷酸探 針組合;(d)分離與步驟(a)的多核苷酸探針特異雜交的核酸,由此 從環境樣品中分離或回收編碼具有酰胺酶活性的多肽的核酸。 一方面, 所述環境樣品可以包括水樣品,液體樣品,土壤樣品,氣體樣品或生 物樣品。 一方面,所述生物樣品可以來源于細菌細胞,原生動物細胞, 昆蟲細胞,酵母細胞,植物細胞,真菌細胞或哺乳動物細胞。
本發明提供產生編碼具有酰胺酶活性的多肽的核酸的變異體的方 法,包括步驟(a)提供包括本發明的核酸的模板核酸;(b)在所述
模板序列中修改、刪除或添加一個或多個核苷酸,或者它們的組合, 產生所述模板核酸的變異體。 一方面,該方法可以進一步包括表達所 述的變異核酸,產生變異的酰胺酶多肽。 一方面,所述修改、添加或
刪除可以通過包括易錯PCR、重排、寡聚核苷酸誘導的定點突變、裝 配PCR、有性PCR誘變、體內誘變、盒式誘變、遞歸整體誘變、指數 整體誘變、位點專一性誘變、基因重裝配、基因位點飽和誘變(GSSM)、 合成連接重裝配(SLR)和它們的組合的方法引入。另一方面,所述修 改、添加或刪除可以通過包括重組、遞歸序列重組、硫代磷酸酯修飾 的DNA誘變、含有尿嘧啶的模板誘變、缺口二重誘變、點錯配修復誘 變、修復缺陷型宿主株誘變、化學誘變、放射誘變、缺失誘變、限制 選擇誘變、限制純化誘變、人工基因合成、整體誘變、嵌合核酸多聚 體生成和它們的組合的方法引入。
一方面,所述方法可以迭代重復,直到與所述模板核酸編碼的多 肽相比具有改變的或不同的活性或者具有改變的或不同的穩定性的酰 胺酶產生。 一方面,所述變異的酰胺酶多肽可以是耐熱性的,在暴露 于提高的溫度后仍保持一些活性。另一方面,所述變異的酰胺酶多肽 與模板核酸編碼的酰胺酶相比具有更高的糖基化。 一方面,所述變異 的酰胺酶多肽在高溫下可以有酰胺酶活性,其中由所述模板核酸編碼的酰胺酶在高溫下沒有活性。
一方面,所述方法可以迭代重復,直到
與所述模板核酸相比具有改變的密碼子使用"odon usage)的酰胺酶 編碼序列產生。另一方面,所述方法可以迭代重復,直到與所述模板 核酸相比具有更高或更低水平的信息表達或穩定性的酰胺酶基因產 生。
本發明提供修飾編碼具有酰胺酶活性的多肽的核酸中的密碼子以 增加其在宿主細胞中的表達的方法,包括以下步驟(a)提供編碼具 有酰胺酶活性的多肽的核酸,包括本發明的核酸;(b)確定步驟(a) 的核酸中的非優選的或較不優選的密碼子,把它替換為編碼相同氨基 酸的優選的或中性使用的密碼子,其中優選的密碼子是在宿主細胞基 因的編碼序列中偏愛的密碼子,非優選或較不優選的密碼子是在宿主 細胞基因的編碼序列中偏廢的密碼子,由此修飾所述核酸,從而提高 它在宿主細胞中的表達。
本發明提供修飾編碼酰胺酶多肽的核酸中的密碼子的方法,所述 方法包括以下步驟(a)提供編碼具有酰胺酶活性的多肽的核酸,包 括本發明的核酸;(b)確定步驟(a)的核酸中的密碼子,把它用編碼 相同氨基酸的不同密碼子取代,由此修飾編碼酰胺酶的核酸中的密碼 子。 '
本發明提供修飾編碼酰胺酶多肽的核酸中的密碼子以增加其在宿 主細胞中的表達的方法,所述方法包括以下步驟(a)提供編碼酰胺 酶多肽的核酸,包括本發明的核酸;(b)確定步驟(a)的核酸中非優 選的或較不優選的密碼子,把它用編碼相同氨基酸的優選的或中性使 用的密碼子替換,其中優選的密碼子是在宿主細胞基因的編碼序列中 偏愛的密碼子,非優選或較不優選的密碼子是在宿主細胞基因的編碼 序列中偏廢的密碼子,由此修飾所述核酸,從而提高它在宿主細胞中 的表達。
本發明提供修飾編碼具有酰胺酶活性的多肽的核酸中的密碼子以 降低其在宿主細胞中的表達的方法,所述方法包括以下步驟(a)提 供本發明的核酸;(b)確定步驟(a)的核酸中至少一個優選的密碼子, 把它用編碼相同氨基酸的非優選的或較不優選的密碼子替換,其中優 選的密碼子是在宿主細胞基因的編碼序列中偏愛的密碼子,非優選或較不優選的密碼子是在宿主細胞基因的編碼序列中偏廢的密碼子,由 此修飾所述核酸,從而降低它在宿主細胞中的表達。 一方面,所述宿 主細胞可以是細菌細胞,真菌細胞,昆蟲細胞,酵母細胞,植物細胞 或哺乳動物細胞。
本發明提供用于產生編碼多個修飾的酰胺酶活性位點或底物結合 位點的核酸文庫的方法,其中所述修飾的活性位點或底物結合位點衍 生于第一核酸,所述第一核酸包括編碼第一活性位點或第一底物結合 位點的序列,所述方法包括以下步驟(a)提供編碼第一活性位點或 第一底物結合位點的第一核酸,其中所述第一核酸序列包括在嚴緊條 件下與本發明的序列或其子序列雜交的序列,并且所述核酸編碼酰胺 酶活性位點或酰胺酶底物結合位點;(b)提供一套誘變的寡核苷酸, 其編碼在第一核酸的多個靶密碼子處的天然氨基酸變體;(C)應用這 套誘變的寡核苷酸來產生一套編碼活性位點或編碼底物結合位點的變 異核酸,所述變異核酸在被誘變的每個氨基酸密碼子處編碼一定范圍 的氨基酸變體,從而產生編碼多個修飾的酰胺酶活性位點或底物結合 位點的核酸文庫。 一方面,所述方法可以進一步包括誘變步驟(a)的 第一核酸,進行誘變的方法包括優化的定向進化系統、易錯PCR、重 排、寡聚核苷酸誘導的定向突變、重裝配PCR、有性PCR誘變、體內 誘變、盒式誘變、遞歸整體誘變、指數整體誘變、位點專一性誘變、 基因重裝配、基因位點飽和誘變(GSSM)、合成連接重裝配(SLR) 以及它們的組合。另一方面,所述方法可以進一步包括誘變步驟(a) 的第一核酸或變異體,進行誘變的方法包括重組、遞歸序列重組、硫 代磷酸酯修飾的DNA誘變、含有尿嘧瞎的模板誘變、缺口二重誘變、 點錯配修復誘變、修復缺陷型宿主株誘變、化學誘變、放射誘變、缺 失誘變、限制選擇誘變、限制純化誘變、人工基因合成、整體誘變、 嵌合核酸多聚體生成和它們的組合。
本發明提供制造小分子的方法,包括以下步驟(a)提供能夠合 成或修飾小分子的多種生物合成酶,其中這些酶中的一種包括由包括 本發明的核酸的核酸編碼的酰胺酶;(b)提供步驟(a)的至少一種酶 的底物;(c)步驟(b)的底物與所述酶在有利于多個生物催化反應進 行的條件下反應,通過一系列生物催化反應產生小分子。本發明提供修飾小分子的方法,包括以下步驟(a)提供酰胺酶, 其中所述酶包括本發明的多肽或由本發明的核酸編碼的多肽;(b)提
供小分子;(c)步驟(a)的酶與步驟(b)的小分子在有利于由所述 酰胺酶催化的酶促反應進行的條件下反應,由此通過酰胺酶酶促反應 修飾小分子。 一方面,所述方法可以包括步驟(a)的酶的多個小分子 底物,由此通過至少一種由所述酰胺酶催化的酶促反應產生修飾的小 分子庫。另一方面,所述方法可以包括多個額外的酶,在有利于所述 酶的多個生物催化反應進行的條件下,通過多個酶促反應形成多個修 飾的小分子。作為選擇,所述方法可以進一步包括檢驗所述文庫的步 驟,以確定表現有所要活性的特定修飾的小分子是否出現在該文庫中。 檢驗所述文庫的步驟可以進一步包括系統地消去除一個以外的所有生 物催化反應,以產生所述文庫內多個修飾的小分子的一部分,檢測所 述的這一部分內是否存在具有所要活性的特定修飾的小分子,并確定 產生具有所要活性的特定修飾的小分子的至少一個特定的生物催化反 應。
本發明提供確定酰胺酶的功能片斷的方法,包括步驟(a)提供 酰胺酶,其中該酶包括本發明的多肽或由本發明的核酸編碼的多肽; (b)從步驟(a)的序列中刪除多個氨基酸殘基,檢驗剩余的子序列 是否具有酰胺酶活性,從而確定酰胺酶的功能片斷。 一方面,所述酰 胺酶活性可以通過提供酰胺酶底物,并檢測所述底物的量的減少或反 應產物的量的增加來測定。
通過應用實時代謝流分析(real-time metabolic flux analysis),本 發明提供用于新的或修飾的表型的全細胞工程的方法,所述方法包括 以下步驟(a)通過修飾所述細胞的遺傳組成,產生修飾的細胞,其 中所述遺傳組成通過往所述細胞中添加包括本發明的核酸的核酸而被 修飾;(b)培養所述修飾的細胞,產生多個修飾的細胞;(C)通過 以實時方式監控步驟(b)的細胞培養物,測量所述細胞的至少一種代 謝參數;(d)分析步驟(c)的數據,確定測量到的參數是否與在相 似條件下的未修飾細胞有所不同,從而應用實時代謝流分析確定所述 細胞中工程化的表型。 一方面,所述細胞的遺傳組成可以通過包括刪 除細胞中的序列或修飾細胞中的序列,或者敲除基因的表達的方法而被修飾。 一方面,所述方法可以進一步包括選擇含有新的工程化表型 的細胞。另一方面,所述方法可以進一步包括培養被選擇的細胞,由 此產生含有新的工程化表型的細胞株。
本發明提供水解酰胺鍵的方法,包括以下步驟(a)提供具有酰 胺酶活性的多肽,其中所述多肽包括本發明的多肽或由本發明的核酸 編碼的多肽;(b)提供包括酰胺鍵的化合物;(c)將步驟(a)的多肽 與步驟(b)的化合物在所述多肽水解所述酰胺鍵的條件下接觸。 一方
面,所述化合物可以包括內酰胺鍵。另一方面,所述化合物可以包括c
端酰胺鍵或N端酰胺鍵。
本發明提供從組合物中溶解或除去含有酰胺鍵的化合物的方法, 包括以下步驟(a)提供具有酰胺酶活性的多肽,其中所述多肽包括 本發明的多肽或由本發明的核酸編碼的多肽;(b)提供包含含有酰胺 鍵的化合物的組合物;(c)將步驟(a)的多肽與步驟(b)的組合物 在所述多肽除去或溶解含有酰胺鍵的化合物的條件下接觸。
本發明提供增加酰胺酶多肽的耐熱性或熱穩定性的方法,所述方 法包括糖基化酰胺酶多肽,其中所述多肽包括本發明的多肽或者由本 發明的核酸編碼的多肽的至少30個相鄰氨基酸,由此增加所述酰胺酶 多肽的耐熱性或熱穩定性。 一方面,所述酰胺酶的特異活性可以在大 于37'C到大約95'C的范圍內是熱穩定或耐熱的。
本發明提供用于在細胞中過量表達重組酰胺酶多肽的方法,包括 表達含有本發明的核酸的表達載體,其中過量表達通過應用高活性的 啟動子、雙順反子的載體或者通過載體的基因擴增來完成。
本發明提供包括本發明的多肽或由本發明的核酸編碼的多肽的去 垢劑組合物,其中所述多肽包含酰胺酶活性。 一方面,所述酰胺酶可 以是非表面活性的酰胺酶。另一方面,所述酰胺酶可以是表面活性的 酰胺酶。
本發明提供用于洗滌物體的方法,包括以下步驟(a)提供包含
具有酰胺酶活性的多肽的組合物,其中所述多肽包括本發明的多肽或
由本發明的核酸編碼的多肽;(b)提供一個物體;(c)將步驟(a)的 多肽與步驟(b)的物體在所述組合物可以洗滌所述物體的條件下接觸。 本發明提供在動物消耗詞料或食物之前水解飼料或食物中的蛋白質或酰胺的方法,包括以下步驟(a)獲得包括蛋白質的詞料材料, 其中所述蛋白質可以被具有酰胺酶活性的多肽水解,其中所述多肽包
括本發明的多肽或由本發明的核酸編碼的多肽;(b)把足量的步驟(a)
的多肽添加到所述飼料或食物材料中,經過以致于可以水解所述蛋白 質和形成經過處理的食品或飼料的足夠長的時間,由此在動物消耗所 述飼料或食物之前水解飼料或食品中的蛋白質。 一方面,所述食品或 飼料包括水稻,玉米,大麥,小麥,豆類或馬鈴薯。
本發明提供拆分光學活性化合物的外消旋混合物的方法,包括以
下步驟(a)提供包括本發明的多肽或由本發明的核酸編碼的多肽的
多肽,其中所述多肽對于光學活性化合物的一種對映異構體是具有選
擇性的;(b)提供光學活性化合物的外消旋混合物;(c)將步驟(a) 的多肽與步驟(b)的混合物在所述多肽可以選擇性地轉化光學活性化 合物的僅僅一種對映異構體的條件下接觸,由此導致外消旋混合物的 拆分。 一方面,所述多肽可以對于L-對映異構體是選擇性的。另一方 面,所述多肽可以對R-對映異構體是選擇性的。 一方面,所述多肽是 立體專一性的。
本發明提供合成含有酰胺鍵的化合物的方法,包括以下步驟(a) 提供包括本發明的多肽或由本發明的核酸編碼的多肽的多肽,其中所 述多肽包含酰胺酶活性;(b)提供前體;(c)把步驟(a)的多肽與 步驟(b)的前體在所述多肽可以催化酰胺鍵合成的條件下接觸。 一方 面,所述多肽可以是立體選擇的或立體專一的,包含酰胺鍵的化合物 可以是手性的。 一方面,所述前體可以具有弱的水溶性。另一方面, 所述前體可以是非手性的,包含酰胺鍵的化合物是手性的。 一方面, 包含酰胺鍵的化合物可以是氨基酸或氨基酰胺。 一方面,所述化合物 可以是甲基多巴。
本發明提供水解青霉素的方法,包括以下步驟(a)提供包括本 發明的多肽或由本發明的核酸編碼的多肽的多肽;(b)提供包括青霉 素的組合物;(c)將步驟(a)的多肽與步驟(b)的組合物在所述多 肽可以水解青霉素的條件下組合。
本發明提供水解頭孢菌素的方法,包括以下步驟(a)提供包括 本發明的多肽或由本發明的核酸編碼的多肽的多肽;(b)提供包括頭孢菌素的組合物;(c)將步驟(a)的多肽與步驟(b)的組合物在所 述多肽可以水解頭孢菌素的條件下組合。 一方面,所述頭孢菌素可以 是頭孢菌素C。
本發明提供合成7-氨基頭孢垸酸(7-ACA)的方法,包括以下步 驟(a)提供包括本發明的多肽或由本發明的核酸編碼的多肽的多肽; (b)提供包括頭孢菌素C的組合物;(c)將步驟(a)的多肽與步驟 (b)的組合物在所述多肽可以把頭孢菌素C轉化為7-氨基頭孢烷酸 (7-ACA)的條件下組合。
本發明提供水解細胞壁的方法,包括以下步驟(a)提供包括本 發明的多肽或由本發明的核酸編碼的多肽的多肽;(b)提供包括細胞 壁的組合物;(c)把步驟(a)的多肽與步驟(b)的組合物接觸,其 中所述多肽可以水解所述細胞壁。
本發明提供影響食品加工中的發酵的方法,包括以下步驟(a) 提供包括本發明的多肽或由本發明的核酸編碼的多肽的多肽;(b)提 供包括在食品加工中使用的細菌的組合物;(c)把步驟(a)的多肽 與步驟(b)的組合物在所述多肽可以改變所述細菌的發酵特性的條件 下接觸。 一方面,所述細菌的發酵特征可以包括生長速度,酸的產生 或存活。
本發明提供催熟乳酪和形成風味的方法,包括以下步驟(a)提 供包括本發明的多肽或由本發明的核酸編碼的多肽的多肽;(b)提供 包括乳酪的組合物;(c)把步驟(a)的多肽與步驟(b)的組合物在 所述多肽水解牛奶酪蛋白的條件下接觸,由此促進奶酪成熟和奶酪風 味的形成。
本發明提供制造轉基因植物的方法,包括以下步驟(a)把異源 核酸序列導入到細胞中,其中所述異源核酸序列包括本發明的核酸, 由此產生轉化的植物細胞;(b)由所述轉化細胞獲得轉基因植物。一 方面,步驟(a)可以進一步包括通過電穿孔或植物細胞原生質體的微 注射,導入所述異源核酸序列。另一方面,步驟(a)可以進一步包括 通過DNA顆粒轟擊(DNA particle bombardment)把所述異源核酸序 列直接導入植物組織中。可替代的,步驟(a)可以進一步包括應用根 癌農桿菌宿主把所述異源核酸序列導入所述植物細胞DNA。本發明提供在細胞中,例如在動物或植物細胞中表達異源核酸序 列的方法,包括以下步驟(a)用與啟動子有效連接的異源核酸序列 轉化所述細胞,其中所述異源核酸序列包括本發明的核酸;(b)在所
述異源核酸序列被所述細胞表達的條件下培養所述細胞。
本發明提供促進細菌或真菌殺死的方法,包括(a)提供包括本 發明的多肽或由本發明的核酸編碼的多肽的多肽;(b)將步驟(a)的 多肽與組合物接觸,由此促進細菌或真菌殺死。本發明提供包括本發 明的多肽或由本發明的核酸編碼的多肽的抗微生物組合物。所述抗微 生物組合物可以是殺菌劑或殺真菌劑。
本發明提供包含本發明的多肽或由本發明的核酸編碼的多肽的食 品。本發明提供包含本發明的多肽或由本發明的核酸編碼的多肽的奶 酪。本發明提供包含本發明的多肽或由本發明的核酸編碼的多肽的乳 制品。
本發明提供包含本發明的多肽或由本發明的核酸編碼的多肽的藥 物組合物。
本發明提供包含本發明的多肽或由本發明的核酸編碼的多肽的消 費品和食品,包括可食用的產品,化妝品,清洗織物、硬表面和人的 皮膚等的產品,面包和面包添加劑,黃油,人造黃油,黃油的低熱量 替代品,乳酪,調味品,類似蛋黃醬的產品,肉類產品,含有肽的食 物添加劑,香波,例如為了處理人的皮膚的乳脂或洗液,肥皂和肥皂 替代品,洗衣粉或洗衣液,和/或用于清洗食物生產設備和廚房用器皿 的產品。
本發明提供具有在SEQIDNO:l, SEQIDNO:3, SEQIDNO:5, SEQIDNO:7, SEQIDNO:9, SEQIDNO:ll, SEQIDNO:13, SEQID NO:15, SEQ IDNO:17, SEQIDNO:19, SEQ ID NO:21 , SEQ ID NO:23, SEQIDNO:25, SEQIDNO:27, SEQIDNO:29, SEQIDNO:31, SEQ IDNO:33, SEQ ID NO:35, SEQ ID NO:37, SEQ ID NO:39, SEQ ID NO:41 , SEQ ID NO:43, SEQ ID NO:45, SEQ ID NO:47, SEQ ID NO:49, SEQIDNO:51, SEQIDNO:53, SEQIDNO:55, SEQIDNO:57, SEQ IDNO:59, SEQIDNO:61, SEQIDNO:63, SEQ ID NO:65, SEQ ID NO:67, SEQ IDNO:69, SEQIDNO:71, SEQ IDNO:73, SEQIDNO:75,SEQIDNO:77, SEQIDNO:79, SEQIDNO:81, SEQIDNO:83, SEQ IDNO:85, SEQ ID NO:87, SEQ ID NO:89, SEQIDNO:91, SEQ ID NO:93, SEQ ID NO:95, SEQ ID NO:97, SEQ ID NO:99, SEQ ID NO:101, SEQIDNO:103, SEQIDNO:105, SEQIDNO:107, SEQID NO:109, SEQIDNO:lll, SEQ ID NO:113中所列序列的分離的核酸, 以及其變異體。所述變異體與本發明的序列具有至少50%序列一致性, 并編碼具有酰胺酶活性的多肽,所述酰胺酶活性包括二級酰胺酶活性, 例如催化酰胺的水解,所述具有酰胺酶活性的多肽包括具有肽酶、蛋 白酶和/或乙內酰脲酶活性的酶。
本發明的一方面是具有在SEQ ID NO:l, SEQ ID NO: 3, SEQID NO:5, SEQIDNO:7, SEQIDNO:9, SEQIDNO:ll, SEQIDNO:13, SEQIDNO:15, SEQIDNO:17, SEQIDNO:19, SEQIDNO:21, SEQ IDNO:23, SEQIDNO:25, SEQ ID NO:27, SEQ ID NO:29, SEQ ID NO:31, SEQ IDNO:33, SEQ IDNO:35, SEQIDNO:37, SEQIDNO:39, SEQIDNO:41, SEQIDNO:43, SEQIDNO:45, SEQIDNO:47, SEQ IDNO:49, SEQIDNO:51, SEQ ID NO:53, SEQ ID NO:55, SEQ ID NO:57, SEQ ID NO:59, SEQ ID NO:61 , SEQ ID NO:63, SEQ ID NO:65, SEQIDNO:67, SEQIDNO:69, SEQIDNO:71, SEQIDNO:73, SEQ IDNO:75, SEQ ID NO:77, SEQ ID NO:79, SEQIDNO:81, SEQ ID NO:83, SEQIDNO:85, SEQIDNO:87, SEQ IDNO:89, SEQIDNO:91, SEQIDNO:93, SEQIDNO:95, SEQIDNO:97, SEQIDNO:99, SEQ IDNO:101, SEQIDNO:103, SEQIDNO:105, SEQIDNO:107, SEQ IDNO:109, SEQIDNO:lll, SEQ ID NO:113中所列序列的分離的核 酸,與其大體上相同(substantiallyidentical)的序列,以及與其互補的 序列。
本發明的另一方面是包括在SEQIDNO:l, SEQIDNO:3, SEQID NO:5, SEQIDNO:7, SEQIDNO:9, SEQIDNO:ll, SEQIDNO:13, SEQIDNO:15, SEQIDNO:17, SEQIDNO:19, SEQIDNO:21, SEQ IDNO:23, SEQIDNO:25, SEQIDNO:27, SEQ ID NO:29, SEQ ID NO:31, SEQIDNO:33, SEQIDNO:35, SEQIDNO:37, SEQ ID NO:39, SEQIDNO:41, SEQIDNO:43, SEQIDNO:45, SEQIDNO:47, SEQIDNO:49, SEQ ID NO :51, SEQ ID NO:53, SEQ ID NO:55, SEQID NO:57, SEQIDNO:59, SEQIDNO:61, SEQIDNO:63, SEQIDNO:65, SEQIDNO:67, SEQIDNO:69, SEQIDNO:71, SEQIDNO:73, SEQ IDNO:75, SEQ ID NO:77, SEQ ID NO:79, SEQIDNO:81, SEQ ID NO:83, SEQ ID NO:85, SEQ ID NO:87, SEQ ID NO:89, SEQ ID NO:91 , SEQIDNO:93, SEQIDNO:95, SEQIDNO:97, SEQIDNO:99, SEQ ID NO: 101, SEQ ID NO: 103, SEQ ID NO: 105, SEQ ID NO: 107, SEQ IDNO:109, SEQIDNO:lll, SEQ ID NO:113中所列序列的至少10個 連續堿基的分離的核酸,與其大體上相同的序列,以及與其互補的序 列。
另一方面,本發明提供編碼具有在SEQIDNO:2, SEQIDNO:4, SEQIDNO:6, SEQIDNO:8, SEQ ID NO: 10, SEQIDNO:12, SEQID NO:14, SEQ ID NO:16, SEQ IDNO:18, SEQIDNO:20, SEQIDNO:22, SEQIDNO:24, SEQIDNO:26, SEQIDNO:28, SEQIDNO:30, SEQ IDNO:32, SEQ ID NO:34, SEQ ID NO:36, SEQ ID NO:38, SEQ ID NO:40, SEQ ID NO:42, SEQ ID NO:44, SEQ ID NO:46, SEQ ID NO:48, SEQIDNO:50, SEQIDNO:52, SEQIDNO:54, SEQIDNO:56, SEQ IDNO:58, SEQ ID NO:60, SEQ ID NO:62, SEQ ID NO:64, SEQ ID NO:66, SEQ ID NO:68, SEQ ID NO:70, SEQ ID NO:72, SEQ ID NO:74, SEQIDNO:76, SEQIDNO:78, SEQIDNO:80, SEQIDNO:82, SEQ IDNO:84, SEQ ID NO:86, SEQ ID NO:88, SEQ ID NO:90, SEQ ID NO:92, SEQ ID NO:94, SEQ ID NO:96, SEQ ID NO:98, SEQ ID NO:畫,SEQIDNO:102, SEQIDNO:104, SEQIDNO:106, SEQID NO:108, SEQIDNO:110, SEQIDNO:113, SEQID NO:114中所列序 列的多肽的分離的核酸,以及其變異體,所述變異體編碼具有酰胺酶 活性的多肽,并與這樣的序列具有至少50%序列一致性,所述酰胺酶 活性包括二級酰胺酶活性。 一方面,所述酰胺酶活性包括水解酰胺, 例如具有肽酶、蛋白酶和/或乙內酰脲酶活性的酶。
本發明的另一方面是編碼本發明的多肽的分離的核酸,以及與其 大體上相同的序列。
本發明的另一方面是編碼本發明的多肽以及與其大體上相同的序列的分離的核酸。
另一方面,本發明提供具有在SEQIDN0:2, SEQIDN0:4, SEQ ID NO:6, SEQ ID N0:8, SEQ ID NO: 10, SEQ ID NO:12, SEQ ID NO:14, SEQ ID NO: 16, SEQ ID NO:18, SEQ ID NO:20, SEQ ID NO:22, SEQIDNO:24, SEQIDNO:26, SEQIDNO:28, SEQIDNO:30, SEQ IDNO:32, SEQ ID NO:34, SEQ ID NO:36, SEQ ID NO:38, SEQID NO:40, SEQ ID NO:42, SEQ ID NO: 44, SEQ ID NO:46, SEQ ID NO:48, SEQIDNO:50, SEQIDNO:52, SEQIDNO:54, SEQIDNO:56, SEQ IDNO:58, SEQ ID NO :60, SEQ ID NO :62, SEQ ID NO: 64, SEQID NO:66, SEQ ID NO:68, SEQ ID NO:70, SEQ ID NO:72, SEQ ID NO:74, SEQIDNO:76, SEQIDNO:78, SEQIDNO:80, SEQIDNO:82, SEQ IDNO:84, SEQ ID NO: 86, SEQ ID NO:88, SEQ ID NO :90, SEQID NO:92, SEQ ID NO:94, SEQ ID NO:96, SEQ ID NO:98, SEQ ID NO:IOO, SEQIDNO:102, SEQIDNO:104, SEQIDNO:106, SEQID NO駕,SEQIDNO:110, SEQIDNO:113, SEQ IDNO:114中所列序 列的純化的多肽,以及與其大體上相同的序列。 一方面,所述多肽具 有酰胺酶活性,包括二級酰胺酶活性,包括例如酰胺的水解,所述多 肽包括具有肽酶、蛋白酶和/或乙內酰脲酶活性的酶。
本發明的另一方面是特異地與本發明的多肽結合的分離的或純化 的抗體,以及與其大體上相同的序列。
本發明的另一方面是特異性結合本發明的多肽的分離的或純化的 抗體或它的結合片斷,以及與其大體上相同的序列。
本發明的另一方面是制備本發明的多肽以及與其大體上相同的序 列的方法。所述方法包括把編碼所述多肽的核酸導入宿主細胞,其中 所述核酸與啟動子有效連接,并在允許所述核酸表達的條件下培養所 述宿主細胞。
本發明的另一方面是制備具有本發明的多肽的至少10個氨基酸的 多肽以及與其大體上相同的序列的方法。所述方法包括把編碼所述多 肽的核酸導入宿主細胞,其中所述核酸與啟動子有效連接,并在允許 所述核酸表達的條件下培養所述宿主細胞,由此產生所述多肽。
本發明的另一方面是產生變異體的方法,包括獲得本發明的核酸,例如具有在SEQ ID NO:l , SEQ ID NO:3, SEQ ID NO:5, SEQ ID NO:7, SEQIDNO:9, SEQIDNO:ll, SEQIDNO:13, SEQIDNO:15, SEQID NO: 17, SEQ ID NO:19, SEQ ID NO:21 , SEQ ID NO:23, SEQ ID NO:25, SEQIDNO:27, SEQIDNO:29, SEQIDNO:31, SEQIDNO:33, SEQ IDNO:35, SEQ ID NO:37, SEQ ID NO:39, SEQIDNO:41, SEQID NO:43, SEQIDNO:45, SEQIDNO:47, SEQIDNO:49, SEQIDNO:51, SEQIDNO:53, SEQIDNO:55, SEQIDNO:57, SEQIDNO:59, SEQ IDNO:61, SEQIDNO:63, SEQ ID NO:65, SEQ ID NO:67, SEQ ID NO:69, SEQIDNO:71, SEQIDNO:73, SEQIDNO:75, SEQIDNO:77, SEQIDNO:79, SEQIDNO:81, SEQIDNO:83, SEQIDNO:85, SEQ IDNO:87, SEQ ID NO:89, SEQIDNO:91, SEQIDNO:93, SEQ ID NO:95, SEQ ID NO:97, SEQ ID NO:99, SEQ ID NO:101, SEQ ID NO:103, SEQIDNO:105, SEQIDNO:107, SEQIDNO:109, SEQID NO:lll, SEQ ID NO:113中所列序列的多聚核苷酸,與其大體上相同 的序列,與本發明的序列互補的序列,包含前述序列的至少30個連續 核苷酸的片斷,然后將所述序列中的一個或多個核苷酸替換為另外的 核苷酸,刪去所述序列中的一個或多個核苷酸,或者往所述序列中添 加一個或多個核苷酸。
本發明的另一方面是儲存有本發明的核酸以及與其大體上相同的 序列,或本發明的多肽以及與其大體上相同的序列的計算機可讀介質。 本發明的另一方面是包括處理器和數據儲存設備的計算機系統,其中 所述數據儲存設備儲存有本發明的核酸以及與其大體上相同的序列, 或本發明的多肽以及與其大體上相同的序列。本發明的另一方面是用 于比較第一序列和參考序列的方法,其中所述第一序列是本發明的核 酸,與其大體上相同的序列,或本發明的多肽,與其大體上相同的序 列。所述方法包括通過應用比較序列的計算機程序讀出第一序列和參 考序列;應用計算機程序確定所述第一序列和所述參考序列之間的不 同。本發明的另一方面是確定本發明的核酸和與其大體上相同的序列, 或本發明的多肽和與其大體上相同的序列中的特征的方法,包括通過 應用識別序列特征的計算機程序讀出序列;應用計算機程序識別所述 序列中的特征。本發明的另一方面是用于確定本發明的多肽和與之大體上相同的 序列的片斷或變異體的分析方法,所述片斷或變異體保留有本發明的 多肽和與之大體上相同的序列的酶功能。所述分析包括將本發明的多 肽和與之大體上相同的序列,或多肽片斷或變異體與底物分子在可以 使所述多肽片斷或變異體發揮功能的條件下接觸,并檢測底物水平的 降低或者在所述多肽和底物間的反應的特定反應產物的水平的增加, 由此確定這些序列的片斷或變異體。
表l是本發明的序列的表格。
本發明提供熒光性酰胺酶底物,例如7-(e-D-2-氨基己二酰胺)-4-甲基香豆素,所述酰胺酶例如二級酰胺酶。本發明提供包含7-(e-D-2-氨基己二酰胺)-4-甲基香豆素的組合物。 一方面,例如為了發現酰胺酶 活性,本發明的7-(e-D-2-氨基己二酰胺)-4-甲基香豆素被用于高通量 (HT)的基于活性的全細胞篩選。一方面,本發明的7-(e-D-2-氨基己 二酰胺)-4-甲基香豆素被用于環境文庫的高通量篩選。 一方面,為了發 現頭孢菌素C酰胺酶,7-(e-D-2-氨基己二酰胺)-4-甲基香豆素被用作底 物。本發明提供應用7-(e-D-2-氨基己二酰胺)-4-甲基香豆素來發現頭孢 菌素C酰胺酶的方法。
本發明的一個或多個具體實施方式
的細節在以下附圖和描述中闡 明。本發明的其它特征、目標和優點將在本說明書和附圖,以及權利 要求中清楚表明。
在此引用的所有的出版物、專禾U、專利申請、GenBank序列和ATCC
保藏物都出于各種目的而特意地一并引入以供參考。


下面的附圖是為了舉例說明本發明的具體實施方式
,并不意味著 對權利要求所包含的發明范圍的限制。 圖l是計算機系統的框圖。
圖2是說明用于將新的核苷酸或蛋白序列與序列數據庫作比較以 確定新序列與數據庫序列之間的同源性水平的處理程序的一個方面的 流程圖。
圖3是說明在計算機中用于確定兩個序列是否同源的處理程序的一個方面的流程圖。
圖4是說明用于檢測序列中某個特征的存在的識別處理器300的 一個方面的流程圖。
圖5是本發明的一種典型方法的說明,如實施例3中例示,采用 兩步合成程序來合成熒光性酰胺酶底物7-(^D-2-氨基己二酰胺)-4-甲
基香豆素。
圖6是說明在實施例3中發現的二級酰胺酶的氨基酸序列相關性 的圖表,它們都能夠切割產熒光的底物7-(e-D-2-氨基己二酰酌-4-甲基
香豆素。
圖7是頭孢菌素C的雙酶脫酰基作用的說明。
圖8是存在DTT和L-半胱氨酸時SEQ ID NO:9和SEQ ID NO:IO
的活性的圖解。
圖9是在實施例5中使用的各種熒光底物的結構說明,包括被合 成的7-(e-D-2-氨基己二酰胺)-4-甲基香豆素。
圖IO顯示了己經被確認的三個新克隆,為了進行酶的表征和用于 基于序列的篩選,它們被亞克隆。
圖11是實施例5的典型方法的說明。
圖12說明應用高效液相色譜(HPLC)分析的反應樣品,如下面 實施例8所描述的。
各幅附圖中同樣的參考標記表示同樣的元素。
發明詳述
本發明提供酰胺酶、編碼所述酶的多聚核苷酸、制造和應用這些 多聚核苷酸和多肽的方法。本發明是關于具有酰胺酶活性的新的多肽, 編碼它們的核酸,以及與它們結合的抗體。本發明的多肽可以在各種 診斷、治療和工業范圍內被應用。本發明的酰胺酶可以具有二級酰胺 酶活性,例如具有水解酰胺的活性,包括具有肽酶、蛋白酶和/或乙內 酰脲酶活性的酶。在可供選擇的方面,本發明的酶可以用于加工食物, 例如,增加食物中的風味(如,酶催熟奶酪),促使細菌和真菌殺死, 修飾和去保護精細化學中間產物,合成肽鍵,進行手性拆分,水解抗 生素,例如,頭孢菌素C。本發明的酰胺酶可以在高溫和/或低溫,或者在廣泛的溫度范圍內
具有活性。例如,它們可以在20。C到90°C, 30。C到8(TC,或者40°C 到7(TC的溫度范圍有活性。本發明也提供在堿性pH或酸性pH,例如 在低的水酸度,有活性的酰胺酶。在可供選擇的方面,本發明的酰胺 酶可以在酸性pH低到pH5.0, pH4.5, pH4.0和pH3.5時有活性。在 可供選擇的方面,本發明的酰胺酶可以在堿性pH高到pH9.5, pH10, pH10.5和pH11時有活性。 一方面,本發明的酰胺酶在低水活性(低 的水含量)的條件下,在大約4(TC到大約7(TC的溫度范圍內有活性。 本發明也提供用于進一步修飾本發明的典型酰胺酶以產生具有所 要特性的蛋白質的方法。例如,利用本發明的方法產生的酰胺酶可以 具有改變的酶活性,熱穩定性,pH/活性特征,pH/穩定性特征(例如 在低的pH,例如pIK6或pIK5,或高的pH,例如pH〉9時穩定性增 強),對氧化作用的穩定性,(^2+依賴性,比活,等等。利用本發明可 以改變任何感興趣的性質。例如,所述改變可以導致變異體,所述變 異體與親本酶相比,具有改變的酶活性,或pH或溫度活性特征。
定義
術語"酰胺酶(amidase)"包括具有酰胺酶活性的所有多肽,例如, 具有催化水解酰胺的活性的酶。例如,術語酰胺酶包括具有二級酰胺 酶(secondary amidase)活性,例如具有水解酰胺活性的多肽。該術語 包括具有肽酶、蛋白水解酶和/或乙內酰脲酶活性的酶。該術語包括可 以用于增加食品(例如酶促熟奶酪)中的風味、促使細菌和真菌殺死、 修飾和去保護精細化學中間產物、合成肽鍵、進行手性拆分的酶。該 術語包括可以水解酰胺抗生素,例如頭孢菌素C的酶。"酰胺酶變異 體"包括衍生于"前體酰胺酶"的氨基酸序列的氨基酸序列。該前體 酰胺酶可以包括天然發生的酰胺酶和重組的酰胺酶。酰胺酶變異體的 氨基酸序列可以通過對前體氨基酸序列迸行一個或多個氨基酸的替 代、刪除或插入而于前體酰胺酶的氨基酸序列"衍生"出來。這樣的 修飾可以是針對編碼前體酰胺酶的氨基酸序列的"前體DNA序列", 而不是操作前體酰胺酶本身。操作該前體DNA序列的合適的方法包括 在此公開的方法,和本領域技術人員已知的方法。本發明的酰胺酶也可以有如美國專利號6,500,659; 6,465,204; 6,429,004中描述的活性。 除了在此描述的篩選方法外,還可參見美國專利號6,333,176的常規檢 驗多肽是否具有酰胺酶活性的可替代方法。
術語"抗體"包括來源于(derived from)、制作于(modeled after) 或大體上編碼于(substantially encoded by) —個免疫球蛋白基因或多 個免疫球蛋白基因的肽或多肽或者其片斷,它們能特異地結合于抗原 或抗原決定部位,見例如,Fundamental Immunology,第三版,W. E. Paul, ed., Raven Press, N.Y. (1993); Wilson (1994) J. Immunol. Methods 175:267-273; Yarmush (1992) J. Biochem. Biophys. Methods 25:85-97。 術語抗體包括結合抗原的部分,即,具有與抗原結合的能力的"抗原 結合位點"(例如,片斷、序列、互補性決定區(CDRs)),包括(i) Fab片斷,由VL、 VH、 CL和CHI結構域組成的單價片斷;(ii) F
(ab') 2片斷,包括在鉸鏈區由二硫鍵連接的兩個Fab片斷的二價片 斷;(iii)由VH和CH1結構域組成的Fd片斷;(iv)由抗體單臂的 VL和VH結構域組成的Fv片斷;(v)由VH結構域組成的dAb片斷
(^Ward等,(1989) Nature 341:544-546),和(vi)分離的互補性決定區
(CDR)。單鏈抗體也被包括在術語"抗體"中。
在此使用的術語"片斷"包括多肽,例如天然發生的蛋白質,的 部分,可以存在至少兩種不同的構象。片斷可以具有與多肽相同的或 大體上相同的氨基酸序列,這里的多肽例如天然發生的蛋白質。"大體 上相同"意味著氨基酸序列大體上但并不是完全相同,但是保留有與 之相關的序列的至少一個功能活性。 一方面,氨基酸序列可以是"大 體上相同"或"大體上同源"的,假如它們至少有大約50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%或99%或 更多相同的話。也包括與天然發生的蛋白質有著不同三維結構的片斷。 一個這樣的例子是"原形式(pro-form)"分子,例如低活性的原蛋白, 它可以通過切除被改變而產生具有顯著更高活性的成熟酶。
在此使用的術語"陣列"或"微陣列"或"生物芯片"或"芯片" 是多個靶元素,每個靶元素包括固定在襯底表面的確定區域上的確定 量的一種或多種多肽(包括抗體)或核酸,以下進一步詳細描述。 正如在此使用的,術語"計算機"、"計算機程序"和"處理器"使用的是它們最廣泛的一般內容,并可與所有設備結合,細節在以下詳細 描述。特定的多肽或蛋白質的"編碼序列"或"序列編碼"是指當置 于合適的調控序列的控制下時,轉錄和翻譯成為多肽或蛋白質的核酸 序列。
在此所用的術語"表達序列盒"指的是可以影響結構基因(即, 蛋白編碼序列,例如本發明的酰胺酶編碼序列)在與這些序列相容的 宿主中表達的核酸序列。表達序列盒包括與多肽編碼序列有效連接的 啟動子;可選擇地,也可以與例如轉錄終止信號的其它序列有效連接。
必須的或有助于影響表達的其它要素也可以被使用,例如,增強子。 所以,表達序列盒也包括質粒、表達載體、重組病毒、任何形式的重
組"裸DNA"載體,等等。
在此使用的"有效連接(operably linked)"是指兩個或多個核酸(例 如,DNA)之間的相互關系。典型的,它是指轉錄調控序列與被轉錄 序列的功能關系。例如,啟動子有效連接到編碼序列,例如本發明的 核酸,假如它刺激或調控該編碼序列在合適的宿主細胞或別的表達系 統中的轉錄的話。 一般地,與被轉錄序列有效連接的啟動子轉錄調控 序列與該被轉錄序列是物理上鄰接的,即,它們是順式作用。然而, 一些轉錄調控序列,例如增強子,并不需要物理鄰接于或位置上靠近 于轉錄被其增強的編碼序列。
"載體"包括能夠感染細胞、轉染細胞、短期或永久地轉導細胞 的核酸。可以認識到的是,載體可以是裸露的核酸或與蛋白或脂構成 復合物的核酸。載體可選擇地包括病毒的或細菌的核酸和/或蛋白質, 和/或膜(例如,細胞膜、病毒脂質被膜等等)。載體包括,但不局限 于復制子(例如,RNA復制子、噬菌體),DNA可以與復制子相連, 而變得可以復制。載體包括,但不局限于RNA,自動地自我復制的環 狀或線狀DNA或RNA (例如,質粒、病毒,等等,見,例如美國專 利號5,217,879),并且包括表達質粒和非表達質粒。當重組微生物或細 胞培養物被描述作為"表達載體"的宿主時,這包括染色體外的環狀 和線狀DNA,以及整入到宿主染色體的DNA。當載體被宿主細胞保持 時,載體或者可以在細胞有絲分裂期間作為自主結構穩定復制,或者 整入到宿主基因組中。如在此使用的,術語"啟動子"包括所有可以驅動細胞例如植物 細胞中的編碼序列轉錄的序列。所以,本發明的構建物中使用的啟動 子包括順式作用轉錄控制元件和調控序列,它們涉及調控或調節基因 轉錄的時間和/或速率。例如,啟動子可以是順式作用轉錄控制元件, 包括增強子、啟動子、轉錄終止子、復制起點、染色體整合序列、5' 和3'不翻譯區,或涉及轉錄調控的內含子序列。這些順式作用序列一 般與蛋白質或別的生物分子相互作用(啟動/關閉,調節,調控,等等) 進行轉錄。"組成型"的啟動子是在多數環境條件和發育或細胞分化 狀態下持續驅動表達的啟動子。"誘導型"或"調控型"啟動子在環 境條件或發育條件的影響下指導本發明的核酸的表達。可以影響誘導 型啟動子進行轉錄的環境條件的例子包括厭氧條件、提高的溫度、干 旱或有光。
"組織特異性"啟動子是只在特定細胞或組織或器官,例如植物 或動物中,有活性的轉錄控制元件。組織特異性調控可以通過某些內 在因子實現,內在因子可以確保編碼某種組織特異性蛋白的基因的表 達。已知這樣的因子存在于哺乳動物和植物中,以使特異性組織發育。
術語"植物"包括整個植物、植物的部分(例如,葉,莖,花, 根,等等)、植物原生質體、種子和植物細胞和其后代。 一般地,可以 在本發明的方法中使用的植物種類寬泛至可適于轉化技術的高等植 物,包括被子植物(單子葉植物和雙子葉植物),還有裸子植物。它 包括多種倍體型的植物,包括多倍體,二倍體,單倍體和半合子。如 在此使用的,術語"轉基因植物"包括這樣的植物或植物細胞,其中 插入有異源核酸序列,例如本發明的核酸和各種重組構建物(例如, 表達序列盒)。
"質粒"可以從商業上獲得、在自由基礎上從公眾獲得、或者根 據公開的程序由可獲得的質粒構建。在此描述的等效質粒在技術上是 已知的,并且對本領域技術人員來說是很顯然的。
術語"基因"包括一段核酸序列,它含有DNA片斷,其涉及產生 轉錄產物(例如信息),轉錄產物又被翻譯產生多肽鏈、或者調控基因 轉錄、復制或穩定性。基因可以包括編碼區域之前或之后的區域,例 如前導物和尾部、啟動子和增強子,可適用的話,還包括在各個編碼片斷(外顯子)之間的插入序列(內含子)。
短語"核酸"或"核酸序列"包括寡核苷酸、核苷酸、多核苷酸, 它們的片斷,可以是單鏈的或雙鏈的、可以代表正義鏈或反義鏈的、
基因組的或合成的DNA或RNA (例如mRNA, rRNA, tRNA),肽 核酸(PNA),或天然的或合成的任何DNA類似的或RNA類似的物質, 包括,例如iRNA,核糖核蛋白(例如,iRNPs)。該術語包含例如寡核 苷酸的核酸,其含有天然核苷酸的己知類似物。該術語也包含具有合 成骨架的核酸類似結構,見,例如Mata(1997)Toxicol.App1. Pharmacol. 144:189-197; Stmuss-Soukup( 1997)Biochemistry 36:8692-8698; Samstag (1996) Antisense Nucleic Acid Drug Dev 6:153-156。
"氨基酸"或"氨基酸序列"包括寡肽、肽、多肽或蛋白序列, 或這些的片斷、部分或亞基,天然發生的或合成的分子。術語"多肽" 和"蛋白"包括通過肽鍵或修飾的肽鍵彼此連接的氨基酸,后者即肽 等配物,并且可以包含不同于編碼基因的20個氨基酸的修飾的氨基酸。 術語"多肽"也包括肽和多肽片斷、模體等等。該術語也包括糖基化 的多肽。本發明的肽和多肽也包括所有的"模擬物"和"肽模擬物" 形式,如在以下進一步描述的。
術語"分離的"包括從最初環境例如天然環境中取出的材料,如 果它是天然發生的話。例如,存在于活的動物中的天然發生的多核苷 酸或多肽就不是分離的,但是從天然系統中的一些或全部共存材料分 離到的同樣的多核苷酸或多肽就是分離的。這些多核苷酸可以成為載 體的一部分,和/或這些多核苷酸或多肽可以成為組合物的一部分,而 它們仍然是分離的,因為這些載體或組合物不是天然環境的一部分。 如在此使用的,分離的材料或組合物也可以是"被純化的"成分,艮P, 它并不要求絕對的純化,相反,它是一個相對的定義。從文庫中獲得 的單種核酸可以照慣例提純到電泳同質。在可替代的方面,本發明提 供可以從基因組DNA或文庫中或別的環境中的別的序列中提純的核 酸,其純度提高至少一、二、三、四、五或更多的數量級。
如在此使用的,術語"重組子"可以包括與"骨架"核酸相鄰的 核酸,而在天然環境中它并不與骨架核酸相鄰。 一方面,核酸具有5 %或更多的核酸"骨架分子"中的核酸插入物數目。根據本發明的"骨架分子"包括核酸,例如表達載體、自我復制核酸、病毒、整合的核 酸、和用于保持或操作感興趣的核酸插入物的別的載體或核酸。 一方 面,富集的核酸代表著,在重組骨架分子中核酸插入物數目占10%,
15%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 98%或更多。"重組"多肽或蛋白是指由重組DNA技術產生的多肽或 蛋白;例如,由編碼所要的多肽或蛋白的外源DNA構建物轉化的細胞 所產生的多肽或蛋白。"合成的"多肽或蛋白質是通過化學合成制備的 多肽或蛋白,如以下詳細描述。
啟動子序列可以"有效連接到"編碼序列,這樣,在啟動子處啟 動轉錄的RNA聚合酶將把該編碼序列轉錄成mRNA,如以下進一步討 論。
"寡核苷酸"包括可以用化學合成的或者單鏈的多脫氧核苷酸或 者雙矮的互補多脫氧核苷酸。這樣合成的寡核苷酸沒有5'磷酸,所以 在沒有激酶利用ATP增加磷酸基團的情況下,它不會與另外的寡核苷 酸連接。合成的寡核苷酸可以與沒有脫磷酸化的片斷連接。
兩個核酸或多肽"大體上相同",可以指當兩個或多個序列被比較 和聯配(aligned)以確定最大一致性(maxium correspondence)時,它 們具有例如至少大約50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%或99%或更高的核苷酸或氨基酸殘基(序列) 一致性,所述的最大一致性可以通過使用任何已知的序列比較算法進 行測量,如以下進一步討論,或者通過觀察檢驗得出。在可替代的方 面,本發明提供與本發明的示例性序列SEQIDN0:1, SEQIDNO:3, SEQ ID N0:5 , SEQ ID NO:7, SEQ ID NO:9, SEQ ID NO: 11 , SEQ ID NO: 13, SEQIDNO:15, SEQ.IDNO:17, SEQIDNO:19, SEQIDNO:21, SEQIDNO:23, SEQIDNO:25, SEQIDNO:27, SEQIDNO:29, SEQ IDNO:31, SEQIDNO:33, SEQ ID NO:35, SEQ ID NO:37, SEQ ID NO:39, SEQ ID NO:41 , SEQ ID NO:43, SEQ ID NO:45, SEQ ID NO:47, SEQIDNO:49, SEQIDNO:51, SEQIDNO:53, SEQIDNO:55, SEQ IDNO:57, SEQ ID NO:59, SEQIDNO:61, SEQ ID NO:63, SEQ ID NO:65, SEQIDNO:67, SEQIDNO:69, SEQ IDNO:71, SEQ IDNO:73, SEQIDNO:75, SEQIDNO:77, SEQIDNO:79, SEQIDNO:81, SEQIDNO:83, SEQIDNO:85, SEQ ID NO:87, SEQ ID NO:89, SEQ ID NO:91 , SEQ ID NO:93, SEQ ID NO:95, SEQ ID NO:97, SEQ ID NO:99, SEQIDNO:101, SEQ ID NO:103, SEQIDNO:105, SEQIDNO:107, SEQIDNO:109, SEQIDNO:lll, SEQIDNO:113;和SEQIDNO:2, SEQIDNO:4, SEQIDNO:6, SEQIDNO:8, SEQIDNO:IO, SEQ ID NO:12, SEQ IDNO:14, SEQIDNO:16, SEQ IDNO:18, SEQ ID NO:20, SEQIDNO:22, SEQIDNO:24, SEQIDNO:26, SEQIDNO:28, SEQ IDNO:30, SEQIDNO:32, SEQ ID NO:34, SEQ ID NO:36, SEQ ID NO:38, SEQ ID NO:40, SEQ ID NO:42, SEQ ID NO:44, SEQ ID NO:46, SEQIDNO:48, SEQIDNO:50, SEQIDNO:52, SEQIDNO:54, SEQ IDNO:56, SEQ ID NO:58, SEQ ID NO:60, SEQ ID NO:62, SEQ ID NO:64, SEQ ID NO:66, SEQ ID NO:68, SEQ ID NO:70, SEQ ID NO:72, SEQIDNO:74, SEQIDNO:76, SEQIDNO:78, SEQIDNO:80, SEQ IDNO:82, SEQ ID NO:84, SEQ ID NO:86, SEQ ID NO:88, SEQ ID NO:90, SEQ ID NO:92, SEQ ID NO:94, SEQ ID NO:96, SEQ ID NO:98, SEQIDNO:100, SEQIDNO:102, SEQIDNO: 104, SEQIDNO:106, SEQIDNO:108, SEQIDNO:llO, SEQIDNO:113, SEQIDNO:114 分別在至少大約10, 20, 30, 40, 50, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000或者更多個殘基的范圍內,或者在從大約50個殘基到該核酸或多 肽的全長的范圍內具有大體上一致性的核酸和多肽序列。本發明的核 酸序列可以在多肽編碼區域的全長范圍內大體上相同。
"大體上相同"的氨基酸序列也可以包括通過一個或多個保守的 或不保守的氨基酸替代、缺失或插入而與對照序列有所不同的序列, 特別是當替代發生的位點不是分子的活性位點時,并且認為該多肽本 質上保有它的功能特性。保守的氨基酸替代是,例如,把一個氨基酸 用另一個相同類型的氨基酸替代(例如,疏水的氨基酸,例如異亮氨 酸、纈氨酸、亮氨酸或甲硫氨酸,用另外的氨基酸替代,或者極性氨 基酸用另外的氨基酸替代,例如精氨酸用賴氨酸替代,谷氨酸用天冬 氨酸,或谷氨酰胺用天冬酰胺替代)。例如,可以從酰胺酶中去掉一 個或多個氨基酸,得到修飾結構的多肽,而其生物活性沒有大的改變。例如,對于酰胺酶活性并不需要的氨基端或羧基端氨基酸可以去除。
"雜交"包括核酸鏈與互補鏈通過堿基配對聯結的過程。雜交反 應可以是靈敏的和選擇性的,感興趣的特定序列甚至可以在以非常低 的濃度存在于樣品中時仍可被識別出來。嚴緊的條件可以通過例如預 雜交和雜交溶液中鹽或甲酰胺的濃度,或者通過雜交溫度被限定,這
是在本領域廣為人知的。例如,嚴緊性(stringency)可以通過降低鹽 濃度、增加甲酰胺的濃度、或者提高雜交溫度、改變雜交時間而增加, 如以下詳細描述的。在可替代的方面,本發明的核酸可以根據它們在 不同嚴緊條件(例如,高、中、低)下雜交的能力而進行定義,如在 此闡明的。
"變異體"包括在一個或多個堿基對、密碼子、內含子、外顯子 或氨基酸殘基處(分別地)發生修飾,但是仍保持本發明的酰胺酶生 物活性的本發明的多肽。變異體可以通過任何手段產生,包括,例如, 易錯PCR,重排(shuffling),寡核苷酸誘導的定點突變,裝配PCR (assemblyPCR),有性PCR誘變,體內誘變,盒式誘變,遞歸整體誘 變(recursive ensemble mutagenesis ), 指數整體誘變(exponential ensemble mutagenesis ), 位點專一性誘變,基因重裝配(gene reassembly),基因位點飽禾口突變(gene site saturated mutagenesis, GSSM) 和這些方法的組合。用于產生例如在某一 pH或溫度具有不同于野生型 酰胺酶的活性的變體酰胺酶的技術包括在內。
術語"飽和誘變"或"GSSM"包括使用簡并寡核苷酸引物在多核 苷酸中導入點突變的方法,以下詳細描述。
術語"優化的定向進化系統"或"優化的定向進化"包括用于重 新裝配相關核酸序列例如相關基因的片斷的方法,以下詳細描述。
術語"合成的連接重裝配(synthetic ligation reassembly)"或者 "SLR"包括以非隨機方式連接寡核苷酸片斷的方法,以下詳細描述。
核酸的產生和操作
本發明提供了核酸,其包括編碼本發明的酰胺酶多肽的表達序列 盒,例如表達載體。本發明也包括使用本發明的核酸來發現新的酰胺 酶序列的方法。本發明也包括使用本發明的核酸來抑制酰胺酶基因、轉錄物和多肽的表達的方法。也提供了通過例如合成的連接重裝配、 優化的定向進化系統和/或飽和誘變來修飾本發明的核酸的方法。本發
明的核酸可以通過例如克隆和表達cDNA文庫、用PCR擴增信息或基 因組DNA等等來制作、分離和/或操作。在實踐本發明的方法時,可 以通過操作模板核酸來修飾同源基因,如在此描述的。本發明可以與 科學和專利文獻中描述的本領域已知的任何方法或方案或設備相結合 來實施。
賞微術
實施本發明時所使用的核酸,不管是RNA、 iRNA、反義核酸、 cDNA、基因組DNA、載體、病毒或它們的雜交,都可以通過遺傳工 程、擴增、和/或重組表達/產生從許多來源中分離出來。由這些核酸產 生的重組多肽可以逐一被分離或克隆,并對所期望的活性進行檢驗。 可以使用任何表達系統,包括細菌、哺乳動物、酵母,昆蟲或植物細 胞表達系統。
可替代地,這些核酸可以通過已知的化學合成技術體外合成,如 在此描述的,例如,Adams (1983) J.Am. Chem. Soc, 105:661; Belousov (1997)Nucleic Acids Res. 25:3440-3444; Frenkel( 1995)Free Radic. Biol. Med. 19:373-380; Blo腿ere (1994) Biochemistry 33:7886-7896; Narang (1979) Meth. Enzymol. 68:90; Brown (1979) Meth. Enzymol. 68: 109; Beaucage (1981) Tetra. Lett 22:1859;美國專利號4,458,066。
核酸操作技術,例如亞克隆、標記探針(例如,使用Klenow聚合 酶、切口平移、擴增來進行隨機引物標記)、測序、雜交等等已經在 科學和專利文獻中詳細描述過,見,例如Sambrook等,MOLECULAR
CLONING: A LABORATORY MANUAL (第二版),1-3巻,Cold Spring Harbor Laboratory, (1989) ; CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, Ausubel等.John Wiley & Sons Inc., New York (1997); LABORATORY TECHNIQUES IN BIOCHEMISTRY AND MOLECULAR BIOLOGY: HYBRIDIZATION WITH NUCLEIC ACID PROBES,第I部分.Theory and Nucleic Acid Preparation, lessen等. Elsevier, N.Y. (1993)。另一種用于實踐本發明的方法的有用的獲得核酸和操作核酸的方 法是從基因組樣品中進行克隆,并且假如需要的話,篩選和再克隆從
例如基因組克隆或cDNA克隆中分離或擴增的插入物。在本發明的方 法中使用的核酸來源包括基因組文庫或cDNA文庫,其被包含在例如 哺乳動物的人工染色體(MACs)中,見,例如,美國專利號5,721,118; 6,025,155;人類人工染色體中,見,例如Rosenfeld (1997) Nat. Genet. 15:333-335;酵母人工染色體(YAC)中;細菌人工染色體(BAC)中; Pl人工染色體中,見,例如Woon (1998) Genomics 50: 306-316; Pl-衍生的載體(PACs )中,見,例如,Kern (1997 ) Biotechniques 23:120-124; 粘粒、重組病毒、噬菌體或質粒中。
一方面,編碼本發明的多肽的核酸在合適的階段與前導序列組合, 該前導序列能夠弓I導翻譯出的多肽或其片斷進行分泌。
本發明提供融合蛋白和編碼該融合蛋白的核酸。本發明的多肽可 以與異源的肽或多肽融合,例如與N端識別肽融合,該N端識別肽賦 予所期望的特性,例如增加穩定性或使提純簡單化。為了例如產生更 高免疫原性的肽、更容易地分離重組合成的肽、確定和分離抗體和表 達抗體的B細胞,等等,本發明的肽和多肽也可以合成和表達為融合 蛋白,其具有一個或多個與之連接的額外的結構域。有利于檢測和提 純的結構域包括,例如,金屬螯合肽,例如使得在固定的金屬上進行 提純成為可能的多組氨酸單元和組氨酸-色氨酸模式單元,使得在固定 的免疫球蛋白上進行提純成為可能的蛋白A結構域,和在FLAGS延 展/親和純化系統中使用的結構域(ImmunexCorp, Seattle WA)。為了 有利于純化,可以在純化結構域和包含上述模體的肽或多肽之間引入 可切割的連接序列,例如因子Xa或腸激酶(Inivitrogen, San Diego CA)。 例如,表達載體可以包括與六個組氨酸殘基連接的編碼抗原決定部位 的核酸序列,并連接有硫氧還蛋白和腸激酶切割位點(見,例如, Williams (1995) Biochemistry 34: 1787-1797; Dobeli (1998) Protein Expr. Purifl2:404-414)。組氨酸殘基有利于檢測和純化,而腸激酶切割位點 提供了將抗原決定部位從融合蛋白的剩余部分中純化出來的方法。關 于編碼融合蛋白的載體的技術和融合蛋白的應用在科學和專利文獻中 有很好的描述,見,例如,Kroll (1993) DNACell. Biol., 12:441-53。録微體敘顏
本發明提供了與表達(例如,轉錄或翻譯)控制序列有效連接的
本發明的核酸(例如,DNA)序列,以指導或調控RNA合成/表達, 這里的表達控制序列例如啟動子或增強子。表達控制序列可以在表達 載體中。典型的細菌啟動子包括lacl, lacZ, T3, T7, gpt,入PR, PL 和trp。典型的真核啟動子包括CMV即時早期啟動子,HSV胸苷激酶 啟動子,早期和晚期SV40啟動子,反轉錄病毒的LTRs,鼠金屬硫蛋 白-I啟動子。
合適于在細菌中表達多肽的啟動子包括五.co// lac或trp啟動子, lacl啟動子,lacZ啟動子,T3啟動子,T7啟動子,gpt啟動子,XPR 啟動子,入PL啟動子,編碼糖酵解酶例如3-磷酸甘油酸激酶(PGK) 的操縱子的啟動子和酸性磷酸酶啟動子。真核啟動子包括CMV即時早 期啟動子,HSV胸苷激酶啟動子,熱休克啟動子,早期和晚期SV40 啟動子,反轉錄病毒的LTRs,鼠金屬硫蛋白-I啟動子。已知的用來控 制基因在原核和真核細胞或它們的病毒中的表達的別的啟動子也可以 使用。
淑錄雜潛総動f
本發明提供了可以以組織特異性方式表達的表達序列盒,例如, 可以以組織特異性方式表達本發明的酰胺酶。本發明也提供了以組織 特異性方式表達本發明的酰胺酶的植物或種子。所述的組織特異性可 以是種子特異性,莖特異性,葉特異性,根特異性,果實特異性,等等。
一方面,組成型啟動子例如CaMV 35S啟動子可以用于在植物或 種子的特異部分或整個植物內的表達。例如,為了過度表達,植物啟 動子片斷可以用于指導核酸在植物例如再生植物的一些或所有組織中 表達。這樣的啟動子在此稱為"組成型"啟動子,它可以在大多數環 境條件和發育狀態或細胞分化情況下具有活性。組成型啟動子的例子 包括花椰菜花葉病毒(CaMV) 35S轉錄起始區域,衍生于根癌農桿菌 的T-DNA的l'-或2'-啟動子,以及本領域技術人員己知的來自不同植物基因的別的轉錄起始區域。這些基因包括,例如,擬南芥Ura&Vfoiw&) 的JC77/ (Huang (1996)尸/""f Mo/,歷o/. 33:125-139);擬南芥的Cfld (GenBank號U43147, Zhong (1996)嵐G饑G騰/. 251:196-203); 甘藍型油菜(5ra^^am^M)的編碼硬脂酰-酰基載體蛋白去飽和酶的 基因(Genbank號X74782, Solocombe ( 1994 )尸/a"f尸A"w/. 104:1167-1176),玉米的G戶c/ (GenBank號X15596; Martinez (1989) 乂 Mo/.歷o/208:551-565);玉米的Q cXGenBank號U45855, Manjunath (1997)尸/朋,Mo/.編.3397-112);美國專利號4,962,028; 5,633,440 中描述的植物啟動子。
本發明使用的組織特異性或組成型啟動子可以衍生于病毒,包括, 例如,煙草花葉病毒亞基因組啟動子(Kumagai (1995) Proc. Natl. Acad. Sci. USA 92:1679-1683);只能在受感染的水稻植物的韌皮部細胞中復 制的水稻東格魯桿狀病毒(RTBV),其啟動子驅動韌皮部特異的報告 基因的表達;在導管、葉中軸細胞、根尖中具有最高活性的木薯脈帶 花葉病毒(cassava vein mosaic virus, CVMV)啟動子(Verdaguer (1996) Plant Mol. Biol. 31:1129-1139)。
可替代地,植物啟動子可以指導表達酰胺酶的核酸表達于特定組 織、器官或細胞類型中(即,組織特異啟動子),或者在更加精確的環 境或發育控制下或在可誘導啟動子的控制下指導表達酰胺酶的核酸的 表達。可以影響轉錄的環境條件的例子包括厭氧條件、提高溫度、有 光、或噴撒化學試劑/激素。例如,本發明包括玉米的干旱誘導型啟動 子(Busk(1997)supra),馬鈴薯的寒冷、干旱、高鹽誘導型啟動子(Kirch (1997) Plant Mol. Biol. 33:897 909)。
組織特異性啟動子只在該組織的發育階段的某個時間段內促進轉 錄,見,例如描述擬南芥LEAFY基因啟動子的Blazquez (1998) Plant Cell 10:791-800。也見,描述轉錄因子SPL3的Cardon (1997) 12:367-77, SPL3識別擬南芥".^z/^"a)的調節植物分生組織形成的 基因(meristemidentity gene) API的啟動子區域的保守序列模體;和 描述分生組織啟動子elF4的Mandel (1995) Plant Molecular Biology, 29 巻,995-1004頁。可以使用在特定組織的整個生命周期都具有活性的組 織特異性啟動子。 一方面,本發明的核酸與主要在棉花纖維細胞中有活性的啟動子有效連接。
一方面,本發明的核酸與主要在棉花纖維細
胞伸長的階段具有活性的啟動子有效連接,例如,Rinehart( 1996) supra 所描述的。核酸可以與Fbl2A基因啟動子有效連接,這樣它將偏好在 棉花纖維細胞(Ibid)中表達。也見John (1997) Proc. Natl. Acad. Sci. USA 89: 5769-5773; John等,美國專利號5,608,148和5,602,321,描述
了用于構建轉基因棉花植物的棉花纖維特異性啟動子和方法。也可以 使用根特異性啟動子來表達本發明的核酸。根特異性啟動子的例子包 括乙醇脫氫酶基因中的啟動子(DeLisle ( 1990) Int. Rey. Cytol. 123:39-60)。也可以使用別的啟動子來表達本發明的核酸,包括,例如, 胚珠特異的,胚芽特異的,胚乳特異的,珠柄特異的,種皮特異的啟 動子或它們的組合;葉特異的啟動子(見,例如,Busk (1997) Plant J. 11:1285 1295,描述玉米的葉特異的啟動子);^gra6a"m'w附 A&o^wm的ORF13啟動子(ORF13啟動子在根部表現出高活性,見, 例如Hansen (1997) supra);玉米花粉特異性啟動子(見,例如Guerrero
(1990) Mol. Gen. Genet. 224: 161 168);番茄啟動子,其在果實成熟、 變老、從葉上脫落的過程中有活性,在花中具有低一些的活性(見, 例如,Blume (1997) Plant J. 12:731 746);馬鈴薯SK2基因的雌蕊特 異性啟動子(見,例如Ficker (1997) Plant Mol. Biol. 35:425 431);豌 豆的Blec4基因,Blec4基因在蔬菜的表皮組織和轉基因苜蓿的花梗頂 中具有活性,這使它成為使外源基因靶向表達于活躍地生長的芽或纖 維的表皮層的有用工具;胚珠特異的BELl基因(見,例如,Reiser(1995) Cell 83:735-742, GenBank號U39944);和/或Klee,美國專利號 5,589,583中的啟動子,描述了一種植物啟動子區域,其可導致在分生 組織和/或快速分裂細胞中的高水平轉錄。
可替代地,經由對植物激素例如植物生長素的暴露便能被誘導的 植物啟動子用于表達本發明的核酸。例如,本發明可以使用大豆
(6^a'"em^c丄.)中的植物生長素響應元件El啟動子片斷(AuxREs)
(Liu (1997) Plant Physiol. 115:397-407);植物生長素響應的擬南芥 GST6啟動子(也對水楊酸和過氧化氫產生響應)(Chen (1996) Plant J. 10:955-966);煙草的植物生長素誘導的parC啟動子(Sakai (1996) 37:906-913);植物生物素響應元件(Streit (1997) Mol. Plant MicrobeInteract. 10:933-937);和對應激激素脫落酸產生響應的啟動子(Sheen (1996) Science 274: 1900-1902)。
本發明的核酸也可以與植物啟動子有效連接,所述植物啟動子暴 露于施用于植物的化學試劑例如除草劑或抗生素,便能夠被誘導。例 如,可以使用由苯磺酰胺除草劑安全劑活化的玉米In2-2啟動子(De Veylder (1997) Plant Cell Physiol. 38:568-577);不同的除草劑安全劑 的應用誘導不同的基因表達模式,包括在根中、排水器中和芽尖分生 組織中表達。編碼序列可以處于例如四環素誘導的啟動子的控制下, 例如,被描述的含有Jmw^^a丄.(oat)精氨酸脫羧酶基因的轉基因 煙草植物(Masgrau (1997) Plant J. 11:465-473);或者處于水楊酸響應 元件的控制之下(Stange (1997) Plant J. 11:1315-1324)。使用化學(例 如,激素或殺蟲劑)誘導的啟動子,即,對施用于田間的轉基因植物 的化學劑發生響應的啟動子,本發明的多肽的表達可以在植物發育的 特定階段被誘導。所以,本發明也提供含有可誘導基因的轉基因植物, 所述可誘導基因編碼本發明的多肽,宿主范圍局限于靶向植物種類, 例如玉米,水稻,大麥,小麥,馬鈴薯或別的作物,并且所述可誘導 基因在作物發育的任何階段都可被誘導。
本領域技術人員會認識到,組織特異性的植物啟動子可以驅動有 效連接的序列在不是靶向組織的組織中表達。所以,組織特異性啟動 子是驅動在靶向組織或細胞類型中產生優勢表達的啟動子,但是也可 以導致在別的組織中的一些表達。
本發明的核酸也可以與化學試劑誘導的植物啟動子有效連接。這 些試劑包括例如,除草劑、合成的植物生長激素或抗生素,它們可以 通過例如噴霧而施用于轉基因植物。本發明的產生酰胺酶的核酸的可 誘導表達將允許對具有所期望的酰胺酶合成或活性的植物進行選擇。 植物局部的發育也可以因此被控制。這樣,本發明提供了促進植物和 植物的部分的收獲的方法。例如,在許多實施方式中,玉米的由苯磺 酰胺除草劑安全劑活化的玉米In2-2啟動子被使用(De Veylder (1997) Plant Cell Physiol. 38 : 568-577)。應用不同的除草劑安全劑誘導出不同 的基因表達模式,包括在根中、排水器中、芽尖分生組織中的表達。 本發明的編碼序列也可以處于四環素誘導的啟動子的控制之下,例如,對含有燕麥Uve加^"vaZ.) (oat)精氨酸脫羧酶基因的轉基因煙草植 物的描述(Masgrau (1997) Plant J. 11:465-473);或者,可以由水楊酸 響應元件控制(Stange (1997) Plant J. 11:1315-1324)。
假如適當的多肽表達是被期望的話,該編碼區域的3'端的多聚腺 苷酸化區域也可以被包括。多聚腺苷酸化區域可以出自天然基因、各 種別的植物基因、或者根癌農桿菌T-DNA中的基因。
教載柳遊微激
本發明提供包括本發明的核酸例如編碼本發明的酰胺酶和抗體的 序列的表達載體和克隆媒介物。本發明的表達載體和克隆媒介物可以 包括病毒顆粒,桿狀病毒,噬菌體,噬菌粒,粘粒,fos-質粒(fosmids), 細菌人工染色體,病毒DNA (例如,疫苗,腺病毒,禽痘病毒,偽狂 犬病病毒和SV40的衍生物),基于P1的人工染色體,酵母質粒,酵 母人工染色體,和任何別的對感興趣的特定宿主有特異性的載體(例 如,桿狀菌,曲霉和酵母)。本發明的載體可以包括染色體、非染色 體和合成的DNA序列。大多數合適的載體對于本領域技術人員都是已 知的,并且可以商業獲得。典型的載體包括細菌pQE載體(Qiagen), pBluescript質粒,PNH載體,A-ZAP載體(Stratagene); ptrc99a, PKK223-3, pDR540, pRIT2T (Pharmacia);真核細胞的PXT1, pSG5 (Stratagene), pSVK3, pBPV, pMSG, pSVLSV40 (Pharmacia)。然 而,也可以使用任何別的質粒或別的載體,只要它們可以在宿主中復 制和維持下去。可以在本發明中使用低拷貝數或高拷貝數的載體。
表達載體可以包括啟動子、翻譯起始和轉錄終止的核糖體結合位 點。載體可以包括用于擴增表達的合適序列。哺乳動物表達載體可以 包括復制起始點、任何必須的核糖體結合位點、聚腺苷酸化位點、剪 接供體和受體位點、轉錄終止序列、5'邊的非轉錄序列。 一方面,衍生 于SV40剪接位點和聚腺苷酸化位點的DNA序列可以用于提供需要的 非轉錄的基因元素。 一方面,表達載體含有一個或多個選擇性標記基 因,使得可以對含有該載體的宿主細胞進行選擇。這些選擇性標記包 括編碼二氫葉酸還原酶的基因和使得真核細胞培養物具有新霉素抗性 的基因、使得E. coli具有四環素或氨芐青霉素抗性的基因和酵母(S.cerevisiae) TRP1基因。啟動子區域可以使用氯霉素轉移酶(CAT)載 體或具有選擇標記的別的載體,從任何期望的基因中選擇出來。用于在真核細胞中表達多肽或其片斷的載體也可以含有增強子, 以增加表達水平。增強子是DNA的順式作用元件, 一般長度為大約 10到大約300bp,作用于啟動子,增強其轉錄。例子包括在SV40復制 起點下游側100bp到270bp的增強子,巨細胞病毒早期啟動子增強子, 在復制起點下游側的多瘤增強子,和腺病毒增強子。核酸序列可以通過各種程序插入載體中。 一般的,把插入物和載 體用合適的限制性內切酶消化后,序列可以在載體中的所需位置連接。 可替代的,插入物和載體的平末端可以被連接。在本領域已知多種克 隆技術,例如,Ausubel和Sambrook中描述的。這些程序和別的程序 被認為在本領域技術人員已知的范圍內。.載體可以是質粒、病毒顆粒或噬菌體的形式。別的載體包括染色 體的、非染色體的和合成的DNA序列、SV40的衍生物;細菌質粒、 噬菌體DNA、桿狀病毒、酵母質粒、衍生于質粒和噬菌體DNA的組 合的載體、病毒DNA例如牛痘、腺病毒、禽痘病毒和偽狂犬病病毒。 在原核和真核宿主中使用的各種克隆和表達載體由例如Sambrook描 述。可以使用的特定的細菌載體包括商業可獲得的質粒,包括以下已 知的克隆載體的遺傳元素pBR322 (ATCC 37017), pKK223-3(Pharmacia Fine Chemicals,Uppsala, Sweden), GEMl(Promega Biotec, Madison, WI, USA), pQE70, pQE60, pQE-9 (Qiagen), pD10, psiX174 pBluescriptIIKS, pNH8A, pNH16a, pNH18A, pNH46A (Stratagene), ptrc99a, pKK223-3, pKK223-3, DR540, pRIT5 (Pharmacia), pKK232誦8 和pCM7。特定的真核載體包括pSV2CAT, pOG44, pXTl, pSG(Stratagene) pSVK3, pBPV, pMSG禾口 pSVL (Pharmacia)。然而, 可以使用任何別的載體,只要它可以在宿主細胞中復制和維持。本發明的核酸可以在表達序列盒、載體或病毒中表達,在植物細 胞和種子中短暫的或穩定的表達。 一個典型的短暫表達系統應用了附 加體表達系統,例如,在核中通過含有超螺旋DNA的附加小染色體的 轉錄而產生的花椰菜花葉病毒(CaMV)RNA,見,例如,Covey(1990)Proc. Natl. Acad. Sci. USA 87: 1633-1637。可替代地,編碼序列,即本 發明的序列的全部或亞片斷,可以插入到植物宿主細胞基因組中,而 成為該宿主染色體DNA的整合的一部分。正義和反義轉錄產物可以以 這種方式被表達。包含本發明的核酸的序列(例如,啟動子或編碼區 域)的載體可以包括用于在植物細胞或種子中選擇表型的標記基因。 例如,所述標記可以編碼生物殺滅劑抗性,特別是抗生素抗性,例如 對卡那霉素、G41S、博來霉素、潮霉素或除草劑的抗性,例如對氯磺 隆或Basta的抗性。可以在植物中表達核酸和蛋白質的表達載體在本領域中已知,可 以包括,例如,根癌農桿菌的載體,馬鈴薯病毒X (見,例如,Angell (1997) EMBO J. 16:3675-3684),煙草花葉病病毒(見,例如,Casper (1996) Gene 173:69-73),番茄叢矮病毒(見,例如,Hillman (1989) Virology 169:42-50),煙草蝕紋病毒(見,例如,Dolja (1997) Virology 234:243-252),菜豆金色花葉病毒(見,例如,Morinaga(1993) Microbiol inimunol. 37:471-476),花椰菜花葉病毒(見,例如,Cecchini (1997) Mol. Plant Microbe Interact. 10: 1094-1101),玉米Ac/Ds轉座元件(見, 例如,Rubin (1997) Mol. Cell. Biol. 17:6294-6302; Kunze (1996) Curr. Top. Microbiol. Inimunol. 204:161-194),和玉米抑制基因-突變基因 (Spm)轉座元件(見,例如Schlappi( 1996)Plant Mol. Biol. 32:717-725); 和它們的衍生物。一方面,蛋白載體可以有兩套復制系統,使其可以在兩種生物中 保持,例如在哺乳動物或昆蟲細胞中表達,在原核宿主中克隆和擴增。 進一步,對于整合表達載體,該表達載體可以包括至少一個與宿主細 胞基因組同源的序列。它可以在表達構建物的兩側包含兩個同源序列。 通過選擇包含入載體的合適的同源序列,可以將該整合載體定位到宿 主細胞的特定位置。整合載體的構建在本領域已知。本發明的表達載體也可以包括選擇性的標記基因,以便對已經轉 化的細菌株進行選擇,例如,使細胞對藥物,例如氨芐青霉素、氯霉 素、紅霉素、卡那霉素、新霉素和四環素產生抗性的基因。選擇性的 標記也可以包括生物合成基因,例如在組氨酸、色氨酸和亮氨酸生物 合成途徑中的基因。涼主鄉辦/德應
本發明也提供包含本發明的核酸序列例如編碼本發明的酰胺酶或 抗體的序列或者本發明的載體的轉化細胞。宿主細胞可以是本領域技 術人員熟悉的任何宿主細胞,包括原核細胞,真核細胞,例如,細菌 細胞、真菌細胞、酵母細胞、哺乳動物細胞、昆蟲細胞或植物細胞。 典型的細菌細胞包括大腸桿菌、鏈霉菌、枯草芽孢桿菌、鼠傷寒沙門
氏菌(&z/附o"e〃a^^/;m^M附)和假單胞菌屬、鏈霉菌屬和葡萄球菌屬 中的許多種類。典型的昆蟲細胞包括果蠅S2和草地夜蛾(S/7(^叩tera) S/P。典型的動物細胞包括CHO, COS或黑色素瘤細胞或任何鼠或人 的細胞系。合適的宿主的選擇在本領域技術人員的能力范圍內。轉化 各種高等植物種類的技術是已知的,在技術和科學文獻中有描述,見, 例如,Weising ( 1988) Am. Rey. Genet. 22:421-477,美國專利號 5,750,870。
載體可以使用各種技術導入宿主細胞中,包括轉化,轉染,轉導, 病毒感染,基因槍,或者Ti介導的基因轉移。具體的方法包括磷酸鈣 轉染,DEAE-Dextran介導的轉染,脂轉染法(lipofection),或電穿孔
(Davis, L., Dibner, M., Battey, I., Basic Methods in Molecular Biology,
(1986))。
一方面,本發明的核酸或載體導入細胞是為了篩選,所以,所述 核酸是以合適于該核酸的后續表達的方式進入細胞。導入的方法大體 上由靶細胞類型決定。典型的方法包括CaP04沉淀法,脂質體融合法, 脂轉染法(例如,LIPOFECTIN ),電穿?L法,病毒感染法,等等。 候選的核酸可以穩定地整合到宿主細胞基因組中(例如,用反轉錄病 毒導入)或者可以短暫的或穩定的存在于細胞質中(即,通過使用傳 統的質粒,利用標準的調控序列,選擇標記,等等)。因為許多藥學 上重要的篩選要求人或模型哺乳動物靶細胞,可以轉染這些靶細胞的 反轉錄病毒載體是優選的。
適當的話,工程宿主細胞可以在傳統的營養培養基中培養,所述 營養培養基經改良而適于激活啟動子、選擇轉化子或擴增本發明的基 因。在合適的宿主株被轉化和宿主株生長到合適的細胞密度之后,用合適的方法誘導被選擇的啟動子(例如,溫度變化或化學誘導),細 胞再培養一段時期,使得它們產生所需的多肽或其片斷。細胞可以通過離心收獲,通過物理或化學方法破碎,保留得到的 粗提物以用于進一步的純化。被用來表達蛋白質的微生物細胞可以用 任何常規方法破碎,包括冷凍-融解循環,超聲波裂解法,機械破碎法, 或使用細胞溶解試劑。這些方法為本領域技術人員所熟悉。表達的多 肽或其片斷可以從重組細胞培養物中通過包括硫酸銨或乙醇沉淀、酸 提取、陰離子或陽離子交換色譜、磷酸纖維素色譜、疏水作用色譜、 親和色譜、羥基磷灰石色譜和凝集素色譜在內的方法回收和純化。假 如必要的話,可以應用蛋白質重折疊來完成多肽的構象。假如需要的話,在最終的純化步驟中可以采用高效液相色譜(HPLC)。也可以應用各種哺乳動物細胞培養系統來表達重組蛋白。哺乳動物表達系統的例子包括猴腎纖維原細胞的COS-7細胞系和別的能夠由 相容性載體表達蛋白質的細胞系,例如C127、 3T3、 CHO、 HeLa和 BHK細胞系。可以以常規方式應用宿主細胞中的構建物以產生由重組序列編碼 的基因產物。取決于在重組生產程序中采用的宿主細胞,由含有載體 的該宿主細胞產生的多肽可以是糖基化的或者可以是非糖基化的。本 發明的多肽可以包括或者不包括起始的甲硫氨酸殘基。也可以采用無細胞的翻譯系統來產生本發明的多肽。無細胞翻譯 系統可以應用由DNA構建物轉錄得到的mRNA,所述DNA構建物包 括與編碼所述多肽或其片斷的核酸有效連接的啟動子。 一些方面,該 DNA構建物在進行體外轉錄反應之前可以是線性的。轉錄得到的 mRNA然后與合適的無細胞翻譯提取物例如兔網狀細胞提取物溫育, 產生所需的多肽或其片斷。表達載體可以含有一個或多個選擇性標記基因,為選擇轉化宿主 細胞提供表型性狀,例如真核細胞培養物的二氫葉酸還原酶或新霉素 抗性,或者Ecoli的例如四環素或氨芐青霉素的抗性。繊,澇在實踐本發明時,可以通過擴增復制本發明的核酸和編碼本發明的多肽的核酸,或本發明的經修飾的核酸。擴增也可以用于克隆或修 飾本發明的核酸。所以,本發明提供用于擴增本發明的核酸的擴增引 物序列對。在可替代的方面,引物對可以擴增本發明的核酸序列,或 者它的子序列。本領域技術人員能夠針對這些序列的任何部分或全長 設計出擴增引物序列對;例如典型的SEQ IDNO:l是 atgaactcaaccttagcctacttcacggaacagggacccatgtctgacccgggaacctatcgttcgcttt ttgaagatcttcccacatccatcccagatctggtgaagcttgtgcagggagtcaccctacatatcttttggacg gagcgatatggactcaaagttcccccgcaacgaatggaggaactgcagctccgttcgatggagaaa cggctggcgcgcacgctcgaattagatccgcgtccacttgttgagccgcgtccgctagagaacaagttgct cggcaattgtcgggatcattctctattgcttaccgcgctgctgcgtcatcagggagttccggctcgcgc ccgctgtgggtttggtgcctacttcctgccagaccattttgaggaccactgggtcgttgagtactggaatcag gagcaatcccgctgggtacttgtggacgcacagttggatgcctcacagcgcgaggtgttgaagatcg actttgacactttggatgtcccccgtgatcaattcatcgtcggcggcaaagcctggcaaatgtgccgttc tggcgagcaagaccctggcaaattcggcattttcgatatgaatggattgggcttcgtgcggggggatctt gtacgtgatgtcgcctcgctcaataaaatggaattgctgccctgggattgctggggtgttattctcgttgagaa actcgatg3cccggctgacctttccgtgcttgatcgagtcgcttcgctcaccgcgagagatgtccccgatttt gaagtgctgcgcgcctgttatgagtctgatccgcgactgcgtgtgaacgactcattgctgagctacgtcaac gggaacatggtggaagtccagatcgcttaa所以,典型的擴增引物序列對是SEQ ID NO: 1的殘基1到21和 SEQ ID NO: 1的最后21個殘基的互補鏈。典型的SEQ IDNO:3是 gtgccgagcctcgacgagtacgcgacccacagcgccttcaccgaccccggccggcaccgggacctgct cggcgcgaccgggacgtcgcccgacgacctgcaccgtgcggcgacaggcgtcgtcctgcactaccgc ggccagcgcgaccggctcacggacgagcagctgcccgacgtcgacctgcgctggttctccgcccagct cgaggtcgttcggcaccgcgcggcgctcccgctcggcgcgcaccggacggacgcgcagcacctcgcg gggtgctgccgcgaccac3cgctgctcgccgtcgccgtcctgcgcgagcacggcatccccgcgcgc3g ccgcgtcggcttcgccgactacttcgagcccgacttccaccacgaccacgtcgtcgtcgagcggtgggac ggcgcgcggtgggtgcgcttcgactcggcgctggacccggcggaccacctgttcgacgtggacgacat gccggcgggggagggcatgccgttcgagacggccgccgaggtctggctcgccgcgcgggcgggccg cgtcgacccccggcggtacggcgtgg3C3aggcgatgccgc3cctgatcggcatcccgttcctgctcgg cgaggtcttcctcgagctcgcgcaccggcagcgcgacgagatcctgctgtgggacgtgtggggcgtcgg catcccgccgttcgcgcggccggacggcctggcacccgtgaccatgtcggacgacgagatggcggagc tcgccgacgaggtggcgcggctcgtcgtcgcggcggacgacggcgacgacgcggctgacgcggcgctcgacgcccgctacgccgccgatccccgcctgcggccgacggccaacccgctcgtggcgctctcgccgc tcgaacgcatcggggacgtcgacctgacggcgcggacgacgacctgg cggtga
所以,典型的擴增引物序列對是SEQ ID NO: 3的殘基1到21和 SEQ ID NO: 3的最后21個殘基的互補鏈。
典型的SEQ IDNO:5是 atgaccaatcagccggagcgcagcaccgcacggtcatactacgccgccccggcggcgatgaccgactt gagcgcgcatcgcgcgcgcttgcgcgacctgccgaccgatctggccgggctctgccgcgtcattcaggg actgctggtgcatccctttctcgcgcacctctacggcctgccgtcgagcgcgctgcgcctcggcgagttgg agttgcgccgcgcctcggcgatgctcgatcacgcgttgaccctcgacgcgcgcccgctcgtcgaggcgc gcccgccggagcgacgcctggtgggcaactgccgccacttttcggtgctgttctgcgccttactgcgcgcc cagggcgttccggcgcgcgcccgctgcggattcggcgcctacttcaatccggcgcgtttcg鄉atcact gggtcggcgaagtctgggactcgacgcgcggcgcctggcgcctcgtcgacgcacagctcgatgccgag cagcgccaggcgctgcgc3tctcgttcgatccgctcgacgtgccgcgcagcgagttcgtggtagccggc gaggcgtggcgacggtgccggagcggcgcggccgctcccgaactgttcggcatcc tcgatctgcgcggtctctggttcgtgcgcggcaacgtggtgcgcgacctcgccgcgttcagcaagcgcga actgctgccgtgggacggctggggtctgatggcgacgcgcgaggacagcagtcctgccgagctggcgc tactcgaccacgtcgccgagctgactctggccggcgacgagcgccacgacgagcgcctgcatctgcag gatgccgaacccggcctgcgcgtgcctcgcgtcgttctcagcttcaacctgaacggcgccgaggtcgatc tcggccccggcgttgcgaactga
所以,典型的擴增引物序列對是SEQ ID NO: 5的殘基1到21和
SEQ ID NO: 5的最后21個殘基的互補鏈。
典型的SEQIDNO:7是 atgcgcagcgacctcgcattctatcaaacacaggggatcatcaccgatcccggccaacatcacgacctgct gaccggcctgccgggcgacctgcccggcctggtcaaagtcgtccagggcctggtggtgcacgtcttctg gctggagcgctacggcttgaagctgaaggagacgcgcaaggccgaggtgcagttgcgctgggctgaaa agcagctcgagcgcatccgcgcgctcgacccgcgcccgctggccgaagcccggcccctggagaagcg cctggtgggcaactgccgggatttcaccgtcctgctggtatgcctgctgcgcgcccggggcatcccggcc cgcgcgcgctgcggtttcgccaagtacttcgaggcggggcggcacatggatcactgggtggccgaggttt ggaacgccgagctgcaacgctggactttggtcgacgcacaactcgacgacctgcagcgcaaggcgctc gcgataccgttcaacccgctggacgtgccgcgcgtgcagttcctgaccggcggcgaagcctggctgcgc tgccgcaaggggc郷ccgaccccgagaccttcggcatcttcgacctga鄉ggttgtggttcgtgcgc ggggacttcgtgcgcgacgtggccgcgctcaacaaggttgagctgctgccctgggatgcatggggcatc gccgatgtgcaggaaaaggatatctccggggaagacctggttttcctggacgaggtggccgagctctcac atggcgacgtggagcgcttcgagcaggtgaaggggctgtatgaaaccgacccccggctgcacgtgccggaggtgatcaacagttacacacaggcaggggtgctgcgcgtcgatctccaagcacattcgtag所以,典型的擴增引物序列對是SEQ ID NO: 7的殘基1到21和 SEQ ID NO: 7的最后21個殘基的互補鏈。典型SEQ IDNO:9是 atgaccgatcgtgcgccgtacgccgcccagagtcccatctccgatccgggcgatatgtccaggtggcttac tggcttgccagcagatttcgcggccctgcgggcgctggccaggccgctggtcgcacactaccgggccga tgacctggcggcgttcggcattcccgaggagcgcgtggaggagatcgacacgcggtttgcggagcggat gctggcgcggctgcacgagatggagagcggtccgctc3cgccgg3gcgcacgccggccaaccgcctc gtgggctgctgccgggscttcaccctgctctacctgaccatgctgcgccacgccggcatcccggcacggt cacgcgtgggctttgccggctactttgccgctggctggttcatcgaccacgtggtggctgaggtctgggac gaggccaacgggcgctggcgcctggtcgatccccagttggcggatgtgcgcactgaccccaacgacgg cttccccatcgatecgctcgatatcccgcgcgaccgtttcctggttgcgggcatggcgtggcaggcttgcc ggagtgaggaactgcagccagagcagttcgtggttgacccagatctcgatatcccggtgacgcgcggctg gctgcaactgcggcacaacctggtgcaggacctcgccgcactgacgaagc.gggagatgatcctctggga tacgtggggcatcctgggtgacgagccggtggcggaggatacgctgcccttgctggacagcatcgcggc tgtcaccgccgatcccgatgtcacgtacgcggacgccctcaatctctacgagcgggagccgggggtgca ggtgccgccagaggtgatgagcttcaacatgctggcgaacgagccaaggatggtggcgtcgggggtgtag所以,典型的擴增引物序列對是SEQ ID NO: 9的殘基1到21和 SEQ ID NO: 9的最后21個殘基的互補鏈。典型SEQ ID NO: 11是 atgcttgcagccggggtaccaggacgacttgtaggccttcaccggattgttgaactcgatctcgagcgtg aaacgctcgggcagctgcagcaggcacttcttcaggtcgccctgcagtgcctgcctgacgccctcgcgga tctgcgcgcaggcggccttgggcgcgaggctgacggtcgacggcccgatgccctcgctgaccgcgacg gcggtgatgttggggttggtctccttgatgtcggtgcagagctgccagtcgccggagacgaacaccaccg ggacgccgaccatggcggcggcataggcgtgcagcaggaattccgaagtcgccacgccgttgatgcgc atgcgcatgacctcacccgtcagcgtgtgcgccaagggattggtctcgtcgccggccttcgagtgatagcc gatgaacatcgcggcatcgaagctcttgtccagctcctgcaccatgctcatcggatggccgctccagccgc ggatcaggcgcacattctccggcaggtcggcctgcaggatgttgcgcccggtcgcgtgtgcgtccttgatc agg加tccttggcccccgccgcgttggcgccgtcgcacgccgcc紹cacttcgcgcgtcatctgctcgc gatgctcgggatagtcggcgtgcggcttgcgcgcctcgtcccagttggtgatgccggcggtgccctcgat gtcggcgctgatgaagatcttcatgccactcctctttgcaaacgcgcgccactctag所以,典型的擴增引物序列對是SEQ ID NO: 11的殘基1到21和 SEQ ID NO: 11的最后21個殘基的互補鏈。典型的SEQ IDNO:13是 ttgccgcaaggcgtgtgcgccgcttcactgcgtcggtatcggcaacgaaaggaacagtacctcatgacga tecacc3ac3gattctcgacttctetacgcgccctgccgggatgacgtccgccggcc3attcgcgcccttat tcgacgcgctgccgagcgacgtgggcgaactcgtccgcatcatccagggccttggggtgtatgaccttgt ggcgtccggcttctecggcttcacg3tcccggacgagcgccagggcgagatccacctccgccccgtaga gaaaatgctgggccgcctcctcgccctcgacgaccggccgctccgtgtcgcccggccggtcgacaggc gtctggtcggccgctgccgtcacttcgtgctgctactcgtcgccatgttgcgggccaagggtgttccggcg cgggcgcgctgcgggttcggctcctactttagacgcgggttctttgaggaccactgggtgtgcgagtactg gaacgccgccgaagcccgctgggtgcttgtcgatccacagttcgacgaggtttggcggg agacactacagatagatcacgacattcttgatgtgccgcgcgaccgtttcctggtagcgggcgacgcctgg gcgcaatgccgcgcgggtgcggccgacccggcgaagttcgaaatcgttttcgccgacctgagcggactg tggttcatcgccgggaacctggtgcgcgacgtggcggcgctcaacaagacggagatgctgccgtgggac gtctggggcgcccagccccgcccgcacgaagcgctcgacgacgaccaactgaccttcttcgacaaactc gccgcgctcacgcgcgagcctgacgcgtcgttcgcggaactgcgcaccctctacgaaggagatgatcgc ctgcgtgtgccggcgaccgtcttcaacgcgatgcgcaacgcgcccgaaacgatcgcgggctga
所以,典型的擴增引物序列對是SEQ ID NO: 13的殘基1到21和 SEQIDNO: 13的最后21個殘基的互補鏈。
典型的SEQIDNO: 15是 gtggaccaaaccggagcaaatgacgcactggtggggcatggccggcggcccgcgtccgccggtcgcc gagaccgacctgcgcgtcggcggccgcttcaaggtgcagttctgggatcccaagaacgagcatcacagc gtcagcggcatctacaaggaggtcgtgcccaaccggaagctcgccttctcgtgggcctggcagagcacg cccgagcgcgaatcgctggtgacgatcgagctcaacccggtcaccgagggcaccatgctgacgctgacc cacgagcagttcttcgacgagaaggcgcgcgacgaccacggccgcggctggaacgtcgccctcgaccg cctggagagcttcctcacatg3cccccggccaggccgtggaccgggcgttcgccggcttgccgggcgat cccgcgtcgctggccggcgtcgtgcagggccttttgatgcacgagcatatcgcgccggc ctacggcctcaccctgagcgaggcccagcacgcggaggcgcacacccggccggtcgaggagatcgtg cgcc3gatcgtggcgcacg3tcctcgtccgctcgccgagccgcgcgcgcccggcg犯cgccaggtcg gcaattgccggcacttcaccctgctgcacgtcacgatgctgcgccgcgccggcgtgcgggcgcgcgccc gctgcggcttcggcggctacttcgagccgggcaagttcctcgaccactgggtcaccgaatactggaacga gcggcgccaggcgtgggttctggtcgatgcccagctcgatgcccgccagcgcgagctcttcaagatcgc cttcgaccccctcgacgtgccgcgcgacaagttcctggtcgcgggcgacgcctggcagcgctgccgcgc Cggc3ccgccgatccg3acgcgttcggc3tcctcg3c難cacgggctgtggttcgtcgccggc2atttg atccgcgacgtcgccgcgctcaacgaccacgtgatgctgccgtgggacgtgtggggcgcgatgaccca g3acgacgcgg3gctcgacc肌ccgttcctcgac犯gctggccgcgctg3ccgtcg3gcccgaccgccatttcggcgagctgcgcgccgtctaccaggatccgcgcgtgaaagtgccggcgaccgtgttcaacgccat ccgcsaccgccccgaaaccctttg3所以,典型的擴增引物序列對是SEQ ID NO: 15的殘基1到21和 SEQ ID NO: 15的最后21個殘基的互補鏈。擴增反應也可以用于定量樣品中的核酸的量(例如,細胞樣品中 的信息的量)、標記核酸(例如將其應用于陣列或印跡)、檢測核酸或 定量樣品中的特定核酸的量。在本發明的一方面,從細胞或cDNA文 庫中分離出的信息被擴增。熟練的技術人員能夠選擇和設計適合的寡核苷酸擴增引物。擴增 方法在本領域是已知的,包括,例如聚合酶鏈式反應,PCR (見,例 如PCR PROTOCOLS, A GUIDE TO METHODS AND APPLICATIONS, ed. I皿is, Academic Press, N,Y. (1990)和PCR STRATEGLES (1995) , ed. Innis, Academic Press, Inc., N.Y.,連接酶鏈反應(LCR)(見,例如Wu(1989) Genomics 4:560; Landegren( 1988)Science 241:1077; Barringer(1990) Gene 89:117);轉錄擴增(見,例如Kwoh (1989) Proc. Natl. Acad. Sci. USA86: 1173);和自主序列復制(見,例如Guatelli (1990) Proc.Natl. Acad. Sci. USA 87:1874); Q Beta復制酶擴增(見,例如Smith(1997) J. Clin. Microbiol. 35:1477-1491),自動Q-beta復制酶擴增分 析(見,例如Burg (1996) Mol. Cell. Probes 10:257-271)和別的RNA 聚合酶介導的技術(例如,NASBA,Cangene,Mississauga, Ontario);也 見Berger (1987) Metbods Enzymol. 152:307-316; Sambrook; Ausubel; 美國專利號4,683,195和4,683,202; Sooknanan (1995) Biotechnology 13:563-564。確定序列一致性程度本發明提供與SEQ ID NO:l , SEQ ID NO:3, SEQ ID NO:5, SEQ ID NO:7, SEQIDNO:9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQIDNO:21, SEQIDNO:23, SEQ IDNO:25, SEQ ID NO:27, SEQ ID NO:29, SEQIDNO:31, SEQ ID NO:33, SEQ IDNO:35, SEQ ID NO:37, SEQIDNO:39, SEQIDNO:41, SEQ ID NO: 43, SEQIDNO:45, SEQIDNO:47, SEQIDNO:49, SEQIDNO:51, SEQIDNO:53, SEQ ID NO:55, SEQ ID NO:57, SEQ ID NO:59, SEQIDNO:61, SEQ IDNO:63, SEQIDNO:65, SEQIDNO:67, SEQ ID NO:69, SEQ ID NO:71 , SEQ ID NO:73, SEQ ID NO:.75, SEQID NO:77, SEQ ID NO:79, SEQ ID NO:81, SEQ ID NO:83, SEQ ID NO:85, SEQIDNO:87, SEQIDNO:89, SEQIDNO:91, SEQIDNO:93, SEQ IDNO:95, SEQIDNO:97, SEQIDNO:99, SEQIDNO:101, SEQ ID NO: 103, SEQ ID NO: 105, SEQ ID NO: 107, SEQ ID NO: 109, SEQID NO:lll, SEQ ID NO: 113,以及SEQIDNO:2, SEQIDNO:4, SEQID NO:6, SEQIDNO:8, SEQ ID NO: 10, SEQ ID NO: 12, SEQIDNO:14, SEQ ID NO: 16, SEQ ID NO: 18, SEQIDNO:20, SEQIDNO:22, SEQ IDNO:24, SEQ ID NO:26, SEQ ID NO:28, SEQ ID NO:30, SEQID NO:32, SEQ ID NO:34, SEQ ID NO:36, SEQ ID NO:38, SEQ ID NO:40, SEQIDNO:42, SEQ ID NO: 44, SEQIDNO:46, SEQIDNO:48, SEQ IDNO:50, SEQIDNO:52, SEQ ID NO :54, SEQ ID NO:56, SEQID NO:58, SEQ ID NO:60, SEQ ID NO:62, SEQ ID NO:64, SEQ ID NO:66, SEQIDNO:68, SEQIDNO:70, SEQIDNO:72, SEQIDNO:74, SEQ IDNO:76, SEQ ID NO:78, SEQ ID NO :80, SEQ ID NO:82, SEQID NO:84, SEQ ID NO:86, SEQ ID NO:88, SEQ ID NO:90, SEQ ID NO:92, SEQIDNO:94, SEQIDNO:96, SEQIDNO:98, SEQ ID NO: 100, SEQ IDNO:102, SEQIDNO:104, SEQIDNO:106, SEQIDNO:108, SEQ IDNO:110, SEQIDNO:113, SEQ ID NO:114具有至少50%序列一致 性的核酸和多肽。 一方面,本發明提供與本發明的序列有至少99%, 98%, 97%, 96%, 95%, 90%, 85%, 80%, 75%, 70%, 65%, 60%, 55%或50%序列一致性(同源性)的核酸和多肽。 一方面,本 發明提供具有在本發明的序列中闡明的序列的核酸和多肽。在可替代 的方面,所述序列一致性是在至少大約5, 10, 20, 30, 40, 50, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000或更多個連續殘基,或者全長的核酸 或多肽的范圍內。序列一致性(同源性)的程度可以使用任何計算機 程序和相關參數確定,包括在此描述的,例如具有默認參數的BLAST 2.2.2.或者FASTA版本3 .0t78。同源序列也可以包括RNA序列,RNA序列中的尿嘧啶替代了核 酸序列中的胸腺嘧啶。同源序列可以使用任何在此描述的程序或者可 以由測序錯誤的校正獲得。可以知道的是,在此闡明的核酸序列可以 用傳統的單字母格式表示(見,例如,Stryer, Lubert. Biochemistry, 3rd Ed., W. H Freeman k Co., New York)或者用任何別的記錄序列中核酸的一致 性的格式表示。
在此確定的各種序列比較程序被用于本發明的這一方面。蛋白和/ 或核酸序列的一致性(同源性)可以應用本領域己知的各種序列比較 算法和程序來評估。這樣的算法和程序包括,但不限于,TBLASTN, BLASTP, FASTA, TFASTA和CLUSTALW (Pearson和Lipman, Proc. Natl. Acad. Sci. USA 85 (8) :2444-2448, 1988; Altschul等,J. Mol. Biol. 215 (3) : 403-410, 1990; Thompson等,Nucleic Acids Res. 22 (2): 4673-4680, 1994; Higgins等,Methods Enzymol. 266: 383-402, 1996; Altschul等,J. Mol. Biol. 215 (3) : 403-410, 1990; Altschul等,Nature Genetics 3:266-272, 1993)。
同源性或者一致性可以應用序列分析軟件來測定(如威斯康星大 學生物技術中心遺傳學計算機組(Genetics Computer Group)的序列分 析軟件包,1710 University Avenue, Madison, WI 53705)。這樣的軟件 通過對各種缺失、替代和其它的修飾賦予表示同源性的數值來匹配相 似的序列。聯系兩個或者多個核酸或者多肽序列的術語"同源性"和 "一致性",是指當兩個或更多個序列或子序列在某一比較窗口 (comparison window)或者指定區域內被比較和聯配以確定最大一致 性時,這些序列是相同的,或者具有特定比例的相同氨基酸殘基或核 苷酸,最大一致性可以應用各種序列比較算法或者通過人工聯配和觀 察檢驗來測定。對于序列比較, 一段序列可以作為參考序列(本發明 的序列),受測序列與之進行比較。當使用序列比較算法時,將受測 序列和參考序列輸入到計算機中,指定子序列坐標,如果必要,指定 序列算法程序參數。可以使用默認的程序參數,或者可以指定替換的 參數。以程序參數為基礎,然后通過序列比較算法計算出受測序列相 對于參照序列的百分序列一致性。
正如在此所用,"比較窗口"包括參考任一數目的連續殘基的片段。例如,在本發明可選擇的方面,本發明的示例性多肽或者核酸序 列的從20到全長的任何范圍的連續殘基與具有同樣數目的連續位置的 參考序列在被優化聯配后進行比較。如果該參照序列具有與本發明的 示例性多肽或者核酸序列所需要的序列一致性,如,與本發明的序列具有50%, 55%, 60%, 65%, 70%, 75%, 80%, 90%或者95%, 98%, 99%或者更高的序列一致性,那么這一序列在本發明的范圍內。 在可供選擇的實施方式中,范圍在從大約20到600、大約50到200 和大約100到150的子序列與具有相同數目的連續位置的參考序列在 優化聯配之后,進行比較。用于進行比較的序列聯配方法在本領域已 知。用于比較的序列的優化聯配可以通過例如以下的手段實現Smith 和Waterman, Adv. Appl. Math. 2: 482, 1981的局部同源性算法, Needleman和Wunsch, J. Mol. Biol. 48:443, 1970的同源性聯配算法, person和Lipman, Proc. Nat'l. Acad. Sci. USA 85: 2444, 1988的査找相似 的方法,這些算法的計算機化實施(Wisconsin Genetics Software Package中的GAP、 BESTFIT、 FASTA和TFASTA, Genetics Computer Group, 575 Science Dr., Madison, WI),手工聯配和觀察檢驗。除了 BLAST程序(生物信息國家中心的基本局域聯配搜索工具(Basic Local Alignment Search Tool))夕卜,用于確定同源性或者一致性的其它的算法 包括,例如,ALIGN, AMAS (多重聯配序列分析(Analysis of Multiply Aligned Sequences)), AMPS (蛋白多重序列聯配(Protein Multiple Sequence Alignment)), ASSET (聯配片段統計評估工具(Aligned Segment Statistical Evaluation Tool)), BANDS, BESTSCOR, BIOSCAN(生物學序列比較分析節點(Biological Sequence Comparative Analysis Node)), BUMPS (BLocks證謂ed Searcher), FASTA, Intervals & Points , BMB , CLUSTAL V , CLUSTAL W , CONSENSUS , LCONSENSUS, WCONSENSUS, Smith-Waterman算法,DARWIN, Las Vegas算法,FNAT (強迫核苷酸聯配工具(Forced Nucleotide Alignment Tool)), Framealign, Framesearch, DYNAMIC, FILTER, FASP(Fristensky序列分析軟件包),GAP (全局聯配程序(Global Alignment Program)), GENAL, GIBBS, GenQuest, ISSC (靈敏的序列比較(Sensitive Sequence Comparison)), LALIGN (局部序列聯配(LocalSequence Alignment)), LCP (局部內容程序(Local Content Program)), MACAW(多重聯配構建和分析工作臺(Multiple Alignment Construction & Analysis Workbench)), MAP (多重聯配程序(Multiple Alignment Program)), MBLKP, MBLKN, PIMA (模式誘導的多重序列聯配
(Pattern-Induced Multi-sequence Alignment)), SAGA (通過遺傳算法 的序列聯配(Sequence Alignment by Genetic Algorithm))和WHAT隱IF。 這樣的聯配程序也可以用于篩查基因組數據庫,確定具有大體上相同 的序列的多聚核苷酸序列。大量的基因組數據庫是可利用的,例如, 作為人類基因組測序工程的構成部分的人類基因組的實質部分可以被 利用(Gibbs, 1995)。幾個基因組序列已經測定,如,生殖器支原體
(A/: gem'to/z'wm) (Fraser等,1995),甲烷球菌(M./a""a"/n'/) (Bult 等,1996),流行性感冒桿菌z.咖畫6) (Fleischma皿等,1995), 大腸桿菌(£. co/!') (Blattoer等,1997),和酵母(<S. cwev!'s!'ae) (Mewes 等,1997),和黑腹果蠅(D. 7we/fl"0gayfer) (Adams等,2000)。在模式 生物的基因組序列的測序上已經取得了很大的進展,如鼠,線蟲(C. e/eg朋s)和擬南芥(^ra6^/o/m;s平)。含有基因組信息并且注釋有一 些功能性信息的數據庫由不同組織維護,可以通過互聯網登錄。
BLAST、 BLAST 2.0和BLAST 2.2.2算法也用于實踐本發明。它 們在例如Altschul (1977)Nuc. Acids Res. 25:3389-3402; Altschul (1990) J. Mol. Biol. 215:403-410中描述。用于實施BLAST分析的軟件可以通 過美國國家生物技術信息中心公開獲得。這一算法包括首先通過鑒別 待詢序列(query sequence)中長度為W的短的字串來確定高分序列對
(high scoring sequence pairs, HSPs),所述高分序列對在與數據庫序列 中同樣長度的字串聯配時,匹配或者滿足某個正值的閾值T。 T是指作 為鄰近字串(neighborhood word)的分數閾值(Altschul (1990) supra)。 這些初始的鄰近字串被用來啟動搜索以發現包含有它們的更長的 HSPs。所述字串沿著每一個序列向兩個方向延伸,只要累積的聯配分 數在增加。對于核苷酸序列,使用參數M (—對匹配的殘基的獎勵分 數;總是大于0)來計算累積分數;對于氨基酸序列,使用記分矩陣來 計算累計分數。
出現下面情況時,字串在各個方向上的延伸便停止累積的聯配分數由達到的最大值下降了數量X;由于一個或者多個記分為負的殘 基聯配的累積,累積分數達到0或者0以下;或者延伸到了任一序列的末端。BLAST算法的參數W、 T和X決定了聯配的靈敏度和速率。 BLASTN程序(對于核苷酸序列)默認的是字串長度(W)為11,期 望值(E)為10, M=5, N=-4,對兩條鏈進行比較。對于氨基酸序列, BLASTP程序默認字串長度為3,期望值(E)為10, BLOSUM62 記分矩陣(參見Henikoff和Henikoff (1989) Proc. Natl. Acad. Sci. USA 89: 10915)聯配(B)為50,期望值(E)為10, M=5, N=-4,對兩 條鏈進行比較。BLAST算法也進行兩個序列之間的相似性的統計學分 析(參見,例如,Karlin和Altschul (1993) Proc. Natl. Acad. Sci. USA 90:5873)。由BLAST算法提供的一種相似性量度是最小合計概率 (smallest sum probability, P(N)),其表示兩個核苷酸或者氨基酸序列 間的匹配將偶然發生的概率。例如,在受測核酸和參考核酸的比較中, 如果最小合計概率小于大約0.2,更優選的是小于O.Ol,最優選的是小 于大約0.001,就認為該核酸與參考序列相似。 一方面,應用基本局域 聯配搜索工具("BLAST")來評價蛋白和核酸序列同源性。例如,五 個特定的BLAST程序可以用來進行以下的任務(1) BLASTP和 BLAST3把氨基酸待詢序列與蛋白質序列數據庫進行比較;(2) BLASTN把核苷酸待詢序列與核苷酸序列數據庫進行比較;(3) BLASTX把待詢核苷酸序列(兩條鏈)的六個閱讀框架的概念上的翻 譯產物與蛋白序列數據庫進行比較;(4)TBLASTN把待詢蛋白序列與核苷酸序列數據庫的所有六個閱讀框架(兩條鏈)的翻譯結果進行比 較;(5) TBLASTN把核苷酸待詢序列的六個框架的翻譯結果與核苷酸 序列數據庫的六個框架的翻譯結果進行比較。BLAST程序通過確定相 似片段來確定同源性序列,所述相似片段在此是指在待査詢的氨基酸 或核酸序列與受測序列之間的"高分片段對(high-scoring segment pairs)",該受測序列優選從蛋白或者核酸序列數據庫得到。高分片段 對優選利用記分矩陣來確定(即,聯配),很多的記分矩陣在本領域是 已知的。優選地,應用的記分矩陣為BLOSUM62矩陣(Gonnet等,Science 256: 1443-1445, 1992; Henikoff和Henikoff, Proteins 17:49-61, 1993)。較不優選地,也可以應用PAM或者PAM250矩陣(參見如,Schwartz和 Dayhoff, eds., 1978, Matrices for Detecting Distance Relationships: Atlas of protein Sequence and Structure, Washingion: National Biomedical Research Foundation)。
在本發明的一方面,為了確定核酸是否具有在本發明范圍內必需 的序列一致性,應用NCBI BLAST 2.2.2程序,默認選項為blastp。在 BLAST 2.2.2程序中有大約38個設定選項。在本發明的這個示范性的 方面,除了默認的過濾設置外,使用所有的默認值(即,除了過濾參 數,所有的參數設定為默認值。過濾設定為OFF);在該位置上應用"-F F"設定,使過濾失效。應用默認的過濾設定常會由于序列的短長度, 導致Karlin-Altschul干擾。
在本發明的這個示范性的方面中使用的默認值包括
"低復雜性的濾器(Filter for low complexity):開(ON) 字串大小(Word Size): 3 矩陣(Matrix): Blosum62 空位罰分(Gap Costs):存在(Existence): 11 延伸(Extension): 1"
其它的默認設定可以是低復雜性的濾器關,對于蛋白,字串
大小為3, BLOSUM62矩陣,空位罰分為-11,空位延伸罰分為-1。典型 的NCBI BLAST 2.2.2程序設置默認"-W"選項為0。這是指,如果沒 有設置,字串大小對蛋白的默認值為3,對核苷酸為ll。
計算機系統和計算機程序產品
為了確定和鑒定序列一致性、結構同源性、模體等等,本發明的 序列可以在能夠由計算機閱讀和訪問的任何介質上存儲、記錄和操作。 因此,本發明提供記錄或存儲有本發明的核酸和多肽序列的計算機、 計算機系統、計算機可讀介質、計算機程序產品等等。正如在此所用, 詞語"記錄"和"存儲"是指將信息存儲到計算機介質中的過程。技 術人員很容易地采用任何已知的方法將信息記錄到計算機可讀介質 上,從而產生包括發明的一個或者多個核酸和/或多肽序列的產品。 本發明的另一個方面是已經記錄有本發明的至少一個核酸和/或多肽序列的計算機可讀介質。計算機可讀介質包括磁性可讀介質、光學可讀 介質、電子可讀介質和磁性/光學介質。例如,計算機可讀介質可以是硬盤、軟盤、磁帶、CD-ROM、數字化視頻光盤(DVD)、隨機存儲器 (RAM),或者只讀存儲器(ROM),同時還有本領域技術人員所知的 其它類型的其它介質。本發明的方面包括存儲和操作在此描述的序列以及序列信息的系 統(如,基于因特網的系統),特別是計算機系統。計算機系統100的 一個例子在圖1的結構圖中說明。正如在此所使用的,"計算機系統" 是指其硬件部分、軟件部分以及用于分析本發明的核苷酸或者多肽序 列的數據存儲部分。計算機系統100可以包括用于處理、訪問和操作 序列數據的處理器。該處理器105可以是任何已知類型的中央處理單 元,例如Intel公司的奔騰III,或者來自Sun、 Motorola、 Compaq、 AMD 或者IBM的類似處理器。計算機系統100是一般用途的系統,包括處 理器105和一個或者多個用于存儲數據的內部數據存儲部分110,以及 一個或者多個用于檢索存儲在數據存儲部分中的數據的數據檢索裝 置。技術人員可以很容易地意識到目前可用的計算機系統的任何一個 都是合適的。一方面,計算機系統100包括處理器105,處理器105連接于數據 傳送總線,該總線連接于一個主存儲器115(優選地,按RAM來實施), 計算機系統100還包括一個或者多個內部數據存儲裝置110,如硬盤驅 動器和/或具有數據記錄作用的其它的計算機可讀介質。計算機系統100可以進一步包括一個或者多個用于讀取內部數據存儲裝置110上儲 存的數據的數據檢索裝置118。數據檢索裝置118可以是例如,軟盤驅 動器、光盤驅動器、磁帶驅動器或者可以(如,通過因特網)連接至 遠端的數據存儲系統的調制解調器等。在一些實施方式中,內部數據 存儲裝置110是可移動的計算機可讀介質,例如含有控制邏輯和/或在 其中記錄有數據的軟盤、光盤、磁帶等。有利的是,計算機系統100 可以包括或運行適當的軟件程序,從插入到數據檢索裝置中的數據存 儲部分讀取控制邏輯和/或數據。計算機系統100包括用于給計算機使 用者顯示輸出結果的顯示器120。應當注意到,計算機系統100可以在 網絡中或者寬域網中與其它的計算機系統125a-c相聯,提供集中化的計算機系統100訪問。用于訪問和處理本發明的核苷酸或者氨基酸序 列的軟件可以在執行中駐留在主存儲器115。在一些方面,計算機系統 100可以進一步包括用于比較本發明的核酸序列的序列比較算法。算法 和序列可以存儲在計算機可讀介質中。"序列比較算法"是指一個或者多個程序,其在計算機系統100上(本地或遠程)執行來比較核苷酸序列和數據儲存裝置中存儲的其它的核苷酸序列和/或混合物。例如,所述的序列比較算法可以把存儲在計算機可讀介質中的本發明的核苷 酸序列與存儲在計算機可讀介質中的參考序列加以比較,確定同源性或者結構模體。以上算法所用的參數取決于序列長度和所研究的同源性的程度。 在一些方面,在沒有來自用戶的指示時,所述參數可以是所述算法所應用的默認參數。圖2是說明了處理過程200的一個方面的流程圖, 為了確定新序列和數據庫中的序列間的同源性水平,把新的核苷酸或 者蛋白序列與數據庫中的序列加以比較。含有序列的數據庫可以是存 儲于計算機系統100的私人數據庫,或者公共的數據庫,如通過因特 網可以訪問到的GENBANK。過程200開始于起始狀態201,然后移 至狀態202,其中待比較的新序列存儲在計算機系統100的存儲器上。 如上討論,存儲器可以是任何形式的存儲器,包括RAM或者內部存儲 設備。過程200然后移至狀態204,其中序列數據庫被打開以用于分析 和比較。然后,過程200移至狀態206,其中存儲在數據庫的第一個序 列讀取到計算機的存儲器中。然后在狀態210中進行比較,確定第一 序列是否與第二序列相同。重要的是,注意到這一步驟并不限于在所 述新序列和數據庫中的第一序列間進行準確的比較。本領域技術人員 熟知比較兩個核苷酸或者蛋白序列的方法,盡管它們并不完全相同。 例如,為了提高兩個待測序列間的同源性水平,可以在一個序列中引 入空位。在比較過程中控制是否往序列中弓I入空位或者其它特征的參 數一般由計算機系統的使用者輸入。 一旦在狀態210下進行兩個序列 的比較,在決定狀態210下作出兩個序列是否相同的決定。當然,術 語"相同"并不限于絕對相同的序列。在過程200中,在使用者輸入 的同源性參數范圍內的序列將標記為"相同"。如果決定了兩個序列相 同,過程200移至狀態214,其中給使用者顯示了來自數據庫的所述序列的名稱。這一狀態可以告訴使用者具有被顯示的名稱的序列滿足輸 入的同源性限制。 一旦被存儲的序列的名稱顯示給使用者,過程200 移至決定狀態218,其中確定在數據庫中是否存在更多的序列。如果在
數據庫中沒有更多的序列存在,那么過程200終止于結束狀態220。然 而,如果在數據庫中存在更多的序列,那么過程200移至狀態224,其 中指示器移至數據庫的下一個序列以便可以與所述的新序列比較。以 這種方式,所述的新序列與數據庫中的每一個序列進行聯配和比較。 應當注意到,如果已經在決定狀態212確定了序列并不具有同源性, 那么為了確定在數據庫中是否有其它的可用于比較的序列,過程200 將立即移至決定狀態218。因此,本發明的一個方面是包括處理器、存 儲有本發明的核酸序列的數據存儲設備、以及用于進行比較的序列比 較器的計算機系統。該序列比較器可以指出待比較序列之間的同源性 水平或者鑒定結構模體,或者它可以鑒定與這些核酸編碼和多肽編碼 相比較的序列中的結構模體。圖3是說明在計算機中確定兩個序列是 否具有同源性的過程250的一個具體實施方式
的流程圖。過程250開 始于起始狀態252,然后移至狀態254,其中待比較的第一序列被存儲 于存儲器中。待比較的第二序列然后在狀態256被存儲于存儲器中。 過程250然后移至狀態260,其中讀取第一序列的第一個字符,然后到 狀態262,其中讀取第二序列的第一個字符。應當理解,如果序列是核 苷酸序列,那么所述字符一般將是A、 T、 C、 G或者U。如果序列是 蛋白質序列,那么可以是單字母的氨基酸代碼,以便第一序列和第二 序列可以很容易地進行比較。然后在決定狀態264作出是否兩個字符 是否相同的決定。如果它們是相同的,那么過程250移至狀態268,其 中讀取第一序列和第二序列的下一個字符。然后確定所述的下一字符 是否相同。如果相同,那么過程250繼續這一循環直到兩個字符是不 同的。如果確定了接下來的兩個字符并不相同,過程250移至決定狀 態274,確定在兩個序列中是否有任何更多的字符要讀取。如果沒有任 何更多的字符被讀取,那么過程250移至狀態276,其中第一序列和第 二序列的同源性水平顯示給使用者。通過計算序列間相同字符占第一 序列中字符總數的比例來確定同源性水平。這樣,如果第一個100核 苷酸序列的每一個字符都與第二序列的每一個字符聯配,那么同源性水平將是100%。作為選擇,計算機程序可以比較參考序列與本發明的序列,確定 序列是否在一個或者更多的位置上有不同。程序可以記錄關于參考序 列或本發明的序列的插入、缺失或者替代的核苷酸或者氨基酸殘基的 長度和一致性。計算機程序可以確定參照序列是否含有關于本發明序列的單核苷酸多態性(SNP),或者,本發明的序列是否含有已知序列 的SNP。因此,在一些方面,所述計算機程序是識別單核苷酸多態性 的程序。該方法可以通過如上描述的計算機系統和在圖3中說明的方 法來完成。該方法的實施可以是通過使用所述的計算機程序讀取本發 明的序列和參考序列,并用所述計算機程序來識別不同。另一方面,以計算機為基礎的系統包括用于識別本發明的核酸和 多肽中的特征的識別器。"識別器"涉及識別核酸序列中特定的特征的 一個或者多個程序。例如,識別器可以包括識別核酸序列中的開放閱 讀框架(ORF)的程序。圖4是說明用于檢測在序列中某個特征的存 在的識別器處理過程300的一方面的流程圖。過程300開始于起始狀 態302,隨后移至狀態304,其中待檢測特征的第一序列被存儲于計算 機系統100的存儲器115中。過程300然后移至狀態306,其中序列特 征的數據庫被打開。這樣的數據庫將包括各個特征的屬性及其名稱的 列表。例如,特征的名稱可以是"起始密碼子",該特征屬性將會是 "ATG"。另一個例子是特征名稱"TAATAA盒",該特征的屬性將是 "TAATAA"。這樣的數據庫的例子由威斯康星大學遺傳學計算機組制 作。可選擇地,所述特征可以是結構性多肽模體,如a螺旋、0折疊, 或者功能性多肽模體,如酶的活性位點、螺旋-轉角-螺旋模體,或者本 領域技術人員所知的其它模體。 一旦特征的數據庫在狀態306下打開, 過程300移至狀態308,其中從數據庫讀取第一特征。然后在狀態310 進行第一特征的屬性和第一序列的比較。然后在決定狀態316中作出 決定是否在第一序列中發現所述特征的屬性。如果發現有該屬性,那 么過程300移至狀態318,其中所發現的特征的名稱被顯示給使用者。 過程300然后移至決定狀態320,其中決定是否在數據庫中存在更多的 特征。如果不存在更多的特征,那么過程300終止于結束狀態324。然 而,如果在數據庫中存在更多的特征,那么過程300在狀態326中讀取下一個序列特征,并且回至狀態310,在其中進行所述下一個特征的
屬性與第一序列比較。如果在決定狀態316中所述特征的屬性沒有在
所述第一序列中發現,那么為了決定在數據庫中是否存在更多特征,
過程300直接移至決定狀態320。因此,在一方面,本發明提供了識別 開放閱讀框架(ORFs)的計算機程序。
本發明的多肽或者核酸序列可以以不同的格式用不同的數據處理 器程序加以存儲和操作。例如,序列可以以文本形式存儲于字處理文 件,如MicrosoftWORD或者WORDPERFECT或者ASCII文件,它們 在本領域技術人員所熟悉的各種數據庫程序中,如DB2, SYBASE或 者ORACLE。此外,可以應用很多的計算機程序和數據庫來作為序列 比較算法、識別器、或者將與本發明的核酸序列進行比較的參考核苷 酸序列或者多肽序列的數據來源。用于實踐本發明的程序和數據庫包 括,但不限于MacPattern ( EMBL ) , DiscoveryBase ( Molecular Applications Group), GeneMine (Molecular Applications Group), Look
(Molecular Applications Group), MacLook (Molecular Applications Group), BLAST和BLAST2 (NCBI), BLASTN和BLASTX (Altschul 等,J. Mol. Biol. 215: 403,1990), FASTA (Pearson和Lipman, Proc. Natl. Acad. Sci. USA, 85: 2444, 1988), FASTDB (Brutlag等,Comp. App. Biosci. 6: 237-245, 1990), Catalyst (Molecular Simulations Inc.), Catalyst/SHAPE ( Molecular Simulations Inc. ) , Cerius2.DBAccess
(Molecular Simulations Inc.) , HypoGen ( Molecular Simulations Inc.), Insight II (Molecular Simulations Inc.), Discover (Molecular Simulations Inc. ) , CHARMm ( Molecular Simulations Inc. ) , Felix ( Molecular Simulations Inc.), DelPhi, (Molecular Simulations Inc.), QuanteMM,
(Molecular Simulations Inc.) , Homology (Molecular Simulations Inc.), Modeler (Molecular Simulations Inc.), ISIS (Molecular Simulations Inc.), Quanta/Protein Design ( Molecular Simulations Inc.) , WebLab ( Molecular Simulations Inc.) , WebLab Diversity Explorer (Molecular Simulations Inc.), Gene Explorer (Molecular Simulations Inc.), SeqFold (Molecular Simulations Inc.), MDL可用化學制品目錄數據庫(Available Chemicals Directory database) , MDL藥品數據報告數據庫(Drug Data Report database), 綜合醫藥化學數據庫(Comprehensive Medicinal Chemistry database),德文特的世界藥物索引數據庫(World Drug Index database), BioByteMasterFile數據庫,Genbank數據庫和Genseqn數據庫。在本公 開內容的技術領域內的技術人員是熟悉很多其它的程序和數據庫的。 應用以上的程序可能檢測到的模體包括編碼亮氨酸拉鏈的序列、 螺旋-轉角-螺旋模體、糖基化作用位點、泛素化位點、a螺旋、)3折疊、 編碼引導被編碼蛋白的分泌的信號肽的信號序列、涉及轉錄調控的序 列如同源框、酸性伸展(acidic stretches)、酶的活性位點、底物結合 位點以及酶切割位點。
核酸的雜交
本發明提供了在嚴緊條件下與本發明的示范序列或者編碼本發明 多肽的核酸雜交的分離的或者重組的核酸。所述嚴緊條件可以是高的 嚴緊條件,中等嚴緊條件,低的嚴緊條件,包括在此描述的高的和降 低的嚴緊條件。在一方面,正是洗脫條件的嚴緊性提出了確定一段核 酸是否在本發明范圍內的條件,如下所述。
在可供選擇的實施方式中,本發明的核酸根據它們在嚴緊條件下 雜交的能力來定義,它們可以在大約5個殘基到本發明的核酸全長之 間;例如它們的長度可以是至少5, 10, 15, 20, 25, 30, 35, 40, 50, 55, 60, 65, 70, 75, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850,卯0, 950, 1000, 或者更多的殘基。也包括比全長核酸短的核酸。這些核酸可以作為如, 雜交探針、標記探針、PCR寡聚核苷酸探針、iRNA、編碼抗體結合肽 (抗原決定部位)的序列或反義序列、模體、活性位點等等。
一方面,本發明的核酸由它們在高的嚴緊條件下雜交的能力來定 義,高嚴緊條件包括在37'C到42'C大約50X的甲酰胺。 一方面,本發 明的核酸由它們在降低的嚴緊條件下雜交的能力來定義,低嚴緊條件 包括在3(TC到35'C大約35%到25%的甲酰胺。
作為選擇,本發明的核酸由它們在高的嚴緊條件下雜交的能力定 義,高嚴緊條件包括42。C, 50%的甲酰胺,5x SSPE, 0.3Q%SDS,和 重復序列封閉核酸,如cot-l或者鮭魚精DNA (如,200n/毫升剪切的和變性的鮭魚精DNA)。 一方面,本發明的核酸由它們在降低的嚴緊 條件下雜交的能力定義,該低嚴緊條件包括在降低的溫度35'C, 35% 的甲酰胺。
雜交以后,用6xSSC, 0.5%SDS在5CTC洗滌濾膜。甲酰胺在25 %以上時這些條件被認為是"中等"條件,甲酰胺低于25%時這些條 件被認為是"低的"條件。"中等"雜交條件的一個具體例子是當以 上的雜交是在30%的甲酰胺中進行。"低嚴緊"雜交條件的一個具體 例子是當以上的雜交是在10%的甲酰胺中進行。
與特定水平的嚴緊度相對應的溫度范圍可以通過計算感興趣的核 酸中嘌呤與嘧咬的比率并相應地調整溫度而進一步變窄。本發明的核 酸也可以通過它們在高的、中度的、降低的嚴緊條件下雜交的能力來 定義,如Ansubel和Sambrook所述。以上范圍和條件的變化為本領域 內所知。以下進一步討論雜交條件。
以上過程可以被變化以確定與探針序列同源性水平降低的核酸。 例如,為了得到與可探測探針的同源性降低的核酸,可以應用較低嚴 謹度的條件。例如,在Na+濃度大約lM的雜交緩沖液中,雜交溫度可 以以5"的幅度從68"C降低到42"。雜交后,濾膜可以用2xSSC, 0.5 XSDS在雜交溫度下洗滌。認為大于5(TC的條件為"中等"條件,低 于5(TC為"低的"條件。"中等"雜交條件的一個具體例子是當以上的 雜交在55'C進行。"低嚴緊"雜交條件的一個具體例子是當以上的雜交 在45"C進行。
作為選擇,雜交可以在緩沖液中進行,例如于42'C在含有甲酰胺 的6xSSC中進行。在這種情況下,雜交緩沖液中甲酰胺的濃度可以以 5 %的幅度從50%降低到0% ,以確定與探針的同源性水平降低的克隆。 在雜交后,濾膜可以在5(TC,用6x SSC, 0.5XSDS洗滌。認為超過 25%的甲酰胺的條件為"中等"條件,低于25%的甲酰胺為"低的" 條件。"中等"雜交條件的一個具體例子是當以上的雜交在30%甲酰胺 時進行。"低嚴緊"雜交條件的一個具體例子是當以上的雜交在10%甲 酰胺時進行。
然而,雜交形式的選擇并不是關鍵的—洗脫條件的嚴緊度提出了 確定一段核酸是否屬于本發明范圍的條件。用于鑒定核酸是否屬于本發明范圍的洗脫條件包括,例如在pH7的大約0.02摩爾的鹽濃度,溫 度至少是大約5(TC或者大約55'C到大約60°C;或者在72'C ,大約0.15M NaCl的鹽濃度,大約15分鐘;或者大約0.2xSSC的鹽濃度,溫度至 少為大約5(TC或者大約55'C到大約60°C,進行大約15到20分鐘;或 者,雜交復合物在含有0.1%SDS的大約2xSSC的鹽溶液中室、溫15分 鐘洗脫兩次,然后用含有0.1XSDS的0.1xSSC在68'C、 15分鐘洗脫 兩次;或者等效條件,參見Sambrook, Tijssen和Ausubel所說明的SSC 緩沖液和等效條件。
這些方法可以用于分離本發明的核酸。
寡聚核苷酸探針及其應用方法
技術領域
本發明也提供了核酸探針,其可以被用來例如確定編碼具有酰胺 酶活性的多肽或其片段的核酸或者用于確定酰胺酶基因。 一方面,所 述探針包括本發明的核酸的至少10個連續的堿基。作為選擇,本發明 的探針可以是本發明的核酸闡明的序列的至少大約5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 110, 120, 130, 150或者大約10到50,大約20到60,大約30到70個連 續的堿基。所述探針通過結合和/或雜交確定核酸。所述探針可以用于 本發明的陣列,參見以下的討論,包括,例如毛細管陣列。本發明的 探針也可以用于分離其它的核酸或者多肽。
本發明的探針可以用來確定生物樣品例如土壤樣品中是否含有具 有本發明的核酸序列的生物或者可以獲得所述核酸的生物。在這樣的 程序中,很有可能包藏有可以分離出所述核酸的生物體的生物樣品被 獲得,并從所述樣品中得到核酸。在允許探針特異地與所述樣品中存 在的任何互補序列雜交的條件下,讓所述核酸與所述探針接觸。在必 要的情況下,為了確定允許探針特異地與互補序列雜交的條件,可以 讓探針與來自已知含有互補序列的樣品中的互補序列相接觸,同時與 不含有互補序列的對照序列相接觸。雜交條件,如雜交緩沖液中的鹽 濃度、雜交緩沖液中甲酰胺的濃度或者雜交溫度,可以進行被變化以 確定允許所述探針特異地與互補的核酸雜交的條件(參見關于特異雜 交條件的討論)。如果樣品含有可以從其中分離出所述核酸的生物體,那么探針的 特異性雜交可以被檢測到。雜交可以通過使用可檢測試劑標記所述探 針來檢測,所述的可檢測試劑例如放射性同位素,熒光染料或者能夠 催化形成可檢測產物的酶。使用標記探針來檢測在樣品中存在的互補
核酸的很多方法對于本領域技術人員是熟悉的。這些方法包括Southern 印跡,Northern印跡,菌落雜交方法,以及點雜交。每一個這樣的程序 的實驗方案在Ausubel和Sambrook中都有說明。
作為選擇,可以在一個擴增反應中使用多于一種探針(其中的至 少之一可以特異地與存在于核酸樣品的任何互補序列雜交)來檢測樣 品中是否含有包括本發明的核酸序列的生物體(如,從中分離出所述 核酸的生物體)。 一方面,所述探針包括寡聚核苷酸。 一方面,所述 擴增反應可以包括PCR反應。PCR的方案在Ausubel和Sambrook (參 見關于擴增反應的討論)中有描述。在這些程序中,所述樣品中的核 酸與所述探針相接觸,進行所述擴增反應,檢測得到的擴增產物。擴 增產物可以通過對反應產物進行凝膠電泳,并用嵌入劑如溴化乙啶染 膠來進行檢測。可選擇地, 一種或者多種探針可以用放射性同位素標 記,并且在凝膠電泳后通過放射性自顯影來檢測放射性的擴增產物的 存在。
源于本發明的核酸序列的5'或者3'末端附近的序列的探針也可以 在染色體移步程序中被應用,以確定含有另外的序列如基因組序列的 克隆。這樣的方法允許從宿主生物體中分離出編碼別的感興趣的蛋白 的基因。
一方面,本發明的核酸序列被用作探針以確定和分離相關的核酸。 在一些方面,這樣確定的相關的核酸可以是來自某些生物體的cDNA 或者基因組DNA,但是這些生物體可以不是本發明的核酸起初被分離
出來的那些生物體。在這樣的程序中,核酸樣品與所述探針在允許探 針特異地與相關序列雜交的條件下接觸。所述探針與來自相關生物體
的核酸的雜交采用以上描述的任何方法來檢測。
在核酸雜交的反應中,用于達到一定水平的嚴緊度的條件可以變 化,這取決于待雜交的核酸的性質。例如,在選擇雜交條件時,可以 考慮所述核酸的長度、互補程度、核苷酸序列組成(如GC對AT的含量),和核酸的雜交區域的核酸類型(如,RNA, DNA)。另外一個考 慮是核酸之一是否被固定在例如濾膜上。雜交可以在低嚴緊、中等嚴 緊、高嚴緊條件下進行。作為核酸雜交的一個例子,含有固定的變性 核酸的聚合物膜首先在45"C下在含有0.9MNaCl, 50mMNaH2PO4, pH 7.0, 5.0mMNa2EDTA, 0.5%SDS, 10xDenhardt's試劑和0.5毫克/毫升 的寡聚核糖腺苷酸的溶液中預雜交30分鐘。然后向該溶液中加入到大 約2xl07 cpm (放射性比度4-9x108 cpm/ug)的"P末端標記的寡聚核 苷酸探針。在溫育12-16個小時以后,該膜在室溫下(RT)在含有0.5 %SDS的lxSET (150 mM NaCl, 20rnM Tris鹽酸,pH 7.8, lmM Na2EDTA)溶液中洗滌30分鐘,隨后,用新鮮的lxSET在寡聚核苷 酸探針的Tm-l(TC洗滌30分鐘。該膜隨后暴露于放射自顯影的膠片以 檢測雜交信號。
通過變化被用來鑒定核酸例如與可檢測探針雜交的cDNA或者基 因組DNA的雜交條件的嚴緊度,可以鑒定和分離與探針具有不同水平 的同源性的核酸。通過在低于探針的解鏈溫度下改變溫度進行雜交而 使嚴緊度變化。解鏈溫度,Tm,是指(在定義的離子強度和pH下) 50%的靶序列與精確互補的探針雜交的溫度。非常嚴緊的條件被選擇 為與特定的探針的Tm值相等或比其低大約5 °C。探針的解鏈溫度可 以通過應用以下的經驗公式計算。對于在14到70個核苷酸長度的探 針應用此公式計算解鏈溫度Tm = 81.5+16.6(log [Na+])+0.41(G+C分 數)-(600/N),其中的N是探針的長度。如果該雜交在含有甲酰胺的溶 液中進行,解鏈溫度可以通過應用以下的公式來計算Tm = 81.5+16.6(log [Na+])+0.41(G+C分數)-(0.63%甲酰胺)-(600/N),其中的N 是探針的長度。預雜交可以在6xSSC, 5xDenhardt's試劑,0.5%SDS, lOOjwg變性的鮭魚精DNA片段或者6xSSC, 5x Denhardt's試劑,0.5 %SDS,, 100/ig變性的鮭魚精DNA片段,50%甲酰胺中進行。對于SSC 和Denhardt's和其它溶液的配方列于如Sambrook中。
通過在以上所列的預雜交溶液中加入可以檢測到的探針來進行雜 交。其中所述探針包括雙鏈DNA,其在加入到雜交緩沖液前被變性。 濾膜與雜交緩沖液接觸足夠長的時間使得探針與含有其互補序列或者 其同源序列的cDNA或者基因組DNA雜交。對于超過200個核苷酸長度的探針,雜交的過程可以是在低于Tm溫度15-25t:進行。對于較短 的探針,如寡聚核苷酸探針,雜交的過程可以是在低于Tm溫度5-10°C 下進行。 一方面,在6xSSC溶液中的雜交過程在大約68'C進行。 一方 面,在含有50X甲酰胺的溶液中的雜交的過程在大約42'C進行。認為 所有前述的雜交過程在高嚴緊的條件下進行。
雜交后,洗滌濾膜以去除任何非特異結合的可檢測探針。用于洗 滌濾膜的嚴緊度也可以依據雜交的核酸的性質、雜交核酸的長度、互 補的程度、核苷酸序列的組成(如GC和AT含量)以及核酸類型(如, RNA, DNA)而變化。越來越高的嚴緊條件洗滌的例子如下2xSSC, 0.1XSDS在室溫下進行15分鐘(低嚴緊度);O.lxSSC, 0.5XSDS在 室溫下進行30分鐘到1個小時(中等嚴緊度);O.lxSSC, 0.5%SDS在 雜交溫度到68'C之間進行15到30分鐘(高嚴緊度),以及0.15M的 NaCl在72'C進行15分鐘(很高的嚴緊度)。最后的低嚴緊度洗滌可以 在O.lxSSC在室溫進行。以上的例子僅僅是列出一系列可以用于洗膜 的條件。本領域技術人員知道,對于不同嚴緊度的洗滌有各種配方。
已經與所述探針雜交的核酸可以通過放射自顯影或者其它傳統的 技術鑒定。以上的程序可以被變化,以鑒定與所述探針序列的同源性 水平降低的核酸。例如,為了得到與可檢測探針的同源性降低的核酸, 可以應用較低嚴緊度的條件。例如,在含有大約lM的Na+濃度的雜交 緩沖液中雜交溫度可以以5"C的幅度從68'C降到42'C。雜交以后,濾 膜可以用2xSSC, 0.5XSDS在雜交溫度下洗滌。認為這些條件中超過 5(TC是"中等"條件,而低于5(TC的條件是"低的"的條件。"中等" 雜交條件的例子是當以上的雜交在55'C進行。"低嚴緊"雜交條件的例 子是當以上的雜交在45'C進行。
作為選擇,雜交可以在緩沖液中進行,如在含有甲酰胺的6xSSC 中在42'C的溫度進行。在這種情況下,在雜交緩沖液中的甲酰胺的濃 度可以以5%的幅度從50%到0%,以鑒定與探針的同源性水平降低的 克隆。雜交后,濾膜可以用6xSSC, 0.5XSDS在5(TC洗滌。認為這些 條件中超過25%的甲酰胺是"中等"條件,而低于25%的甲酰胺的條 件是"低的"條件。"中等"雜交條件的一個具體例子是當以上的雜交 在甲酰胺為30%時進行。"低嚴緊"雜交條件的一個具體例子是當以上的雜交在甲酰胺為10%時進行。
本發明的這些探針和方法可以用于分離核酸,其具有的序列與本
發明的包括至少大約10、 15、 20、 25、 30、 35、 40、 50、 75、 100、 150、 200、 250、 300、 350、 400、 500、 550、 600、 650、 700、 750、 800、 850、 900、 950、 1000或者更多個連續堿基的核酸序列有至少99%、 98%、 97%、至少90%、至少85%、至少80%、至少75%、至少70 。%、至少65%、至少60%、至少55%或者至少50%的同源性,序列 彼此互補。如在此所討論的,同源性可以用聯配算法測定。例如,所 述同源性的多聚核苷酸可以含有在此描述的編碼序列之一的天然發生 的等位基因變異體。這樣的等位基因變異體與本發明的核酸相比可以 具有一個或者多個核苷酸的取代、缺失或者增加。
此外,本發明的這些探針和方法可以用于分離核酸,其編碼的多 肽與本發明的包括至少5、 10、 15、 20、 25、 30、 35、 40、 50、 75、 100、 或者150個連續氨基酸的多肽有至少99%、至少95%、至少90%、至 少85%、至少80%、至少75%、至少70%、至少65%、至少60%、 至少55%或者至少50%的一致性(同源性),這是應用序列聯配算法 (如,使用了默認參數的FASTA版本3.0t78的算法,或者使用了在此 提出的典型設置的BLAST 2.2.2程序)測定的。
抑制本發明的酰胺酶的表達
本發明提供本發明的核酸序列的互補核酸(如反義序列)。反義序 列可以抑制酰胺酶編碼基因的轉運、剪接或者轉錄。所述抑制可以通 過靶向基因組DNA或者信使RNA來發生作用。靶核酸的轉錄或者功 能可以被抑制,例如,通過雜交和/或切割。本發明提供的一套特定的 有用的抑制劑包括可以與酰胺酶基因或其信息結合的寡聚核苷酸,在 任一情況下都能阻止或者抑制酰胺酶的產生或者功能。這種關聯可以 通過序列特異性的雜交建立。另 一類有用的抑制劑包括可以弓I起酰胺 酶信息失活或者切割的寡聚核苷酸。所述寡聚核苷酸可以具有引起這 樣的切割的酶活性,如核酶(ribozyme)。所述寡聚核苷酸可以被化學 修飾或者與能夠切割互補的核酸的酶或者組合物接合。可以對由很多 不同的寡聚核苷酸組成的庫進行篩選,以尋找到那些具有所需活性的寡聚核苷酸。本發明提供了能夠結合酰胺酶信息的反義寡聚核苷酸,它能夠通過靶向mRNA來抑制蛋白水解活性。設計反義寡聚核苷酸的策略在科學和專利文獻中有很好的說明,而且技術人員可以應用本發明的新型 的試劑設計出這樣的酰胺酶寡聚核苷酸。例如,用于篩選有效的反義寡聚核苷酸的基因移步(gene walking) 7RNA作圖(RNAmapping)實 驗方案在本領域是已知的,參見,如,Ho(2000)MethodsEnzymol. 314: 168-183,其說明了 RNA作圖分析,它是基于標準的分子技術,可以 為有效的反義序列的選擇提供容易的和可靠的方法。也參見Smith (2000) Eur. J. Ph滅Sci. 11: 191-198。天然發生的核酸可以作為反義寡聚核苷酸。所述反義寡聚核苷酸 可以是任何長度;例如,在可供選擇的方面,所述反義寡聚核苷酸是 在大約5到100之間,大約10到80之間,大約15到60之間,大約 18到40之間。通過常規的篩選來確定最佳的長度。所述反義寡聚核苷 酸可以以任何濃度存在。通過常規的篩選來確定最佳的濃度。己知有 許多合成的、非天然發生的核苷酸和核酸類似物可以針對這樣的潛在 的問題。例如,可以應用含有非離子骨架如N-(2-氨乙基)甘氨酸單位的 肽核酸(PNAs)。也可以應用具有硫代磷酸酯連接的反義寡聚核苷酸, 如在WO 97/03211; WO 96/39154; Mata (1997) Toxicol Appl Pharmacol 144:189-197; Antisense Therapeutics, ed. Agrawal( Humana Press, Totowa, N丄,1996)所說明的。本發明提供的具有合成的DNA骨架類似物的反 義寡聚核苷酸也可以包括二硫代磷酸酯、甲基膦酸、氨基磷酸酯、垸 基磷酸三酯、氨基磺酸酯、3'-硫代乙縮醛、亞甲基(甲基亞氨)、3'-N-氨基甲酸酯和嗎啉代氨基甲酸酯核酸,正如以上所說明的。也可以應用組合化學方法來產生大量數目的寡聚核苷酸,可以對 它們進行快速篩選,找出對某些目標例如本發明的正義和反義酰胺酶 序列有合適的結合親和性和特異性的特異的寡聚核苷酸(參見,如, Gold (1995) J.ofBiol.Chem. 270: 13581-13584)。鄉微艨本發明提供可以結合酰胺酶信息的核酶。這些核酶可以通過,例如靶向mRNA來抑制酰胺酶活性。設計核酶和選擇用于靶向的酰胺酶特異的反義序列的策略在科學和專利文獻中有很好的說明,而且技術 人員可以應用本發明的新型的試劑設計出這樣的核酶。核酶通過核酶的靶RNA結合部分結合于靶RNA而起作用,核酶的RNA結合部分非 常靠近切割靶RNA的RNA酶活部分。這樣,通過互補的堿基配對, 核酶識別和結合靶RNA,而且一旦結合于正確的位置,便以酶的活性 作用來切割靶RNA和使其失活。如果切割發生在編碼序列中,以這樣 的方式切割靶RNA將會破壞其引導合成編碼的蛋白的能力。核酶結合 和切割其RNA耙之后,它可以從結合的RNA上釋放出來并且重復切 割新的耙子。在一些情況下,核酶的酶性質會優于其它的技術,如反義技術(其 中核酸分子結合于核酸靶來阻止其轉錄、翻譯或者與其它分子的聯 系),因為實現治療效果所必要的核酶有效濃度可能低于反義寡聚核苷 酸的濃度。這一潛在的優點反映出核酶可以以酶的方式進行作用的能 力。因此,單個核酶分子可以切割靶RNA的多個分子。此外,核酶是 一種典型的高度特異性的抑制物,其抑制作用的特異性不僅依賴于堿 基配對的結合機制,也依賴于該分子抑制與其結合的RNA的表達的機 制。即,所述抑制是由切割靶RNA引起的,因此特異性定義為靶RNA 的切割率與非靶RNA的切割率的比值。除了涉及堿基配對的那些因素, 這種切割機制還依賴于另外的因素。這樣,核酶作用的特異性比結合 于同樣的RNA位點的反義寡聚核苷酸強。本發明的核酵,例如,具有酶活的核酶RNA分子可以形成錘頭狀 基體、發夾基件,如肝炎6病毒基體、I類內含子基體和減與RNA引 導序列相聯系的RNaseP類似的RNA。錘頭狀基體的例子在如,Rossi (1992 ) Aids Research and Human Retroviruses 8: 183中有說明;發夾 基體在Hampel( 1989)Biochemistry 28: 4929和Hampel( 1990)Nuc. Acids Res. 18:299中有說明;肝炎S病毒基體在Perrotta (1992) Biochemistry 31: 16中有說明;RNaseP基體在Guetrier-Takada (1983) Cell 35: 849 中有說明;I類內含子在Cech美國專利號4,987,071中有說明。這些特定模體的引述并不是限制性的。本領域技術人員將認識到本發明的核 酶,如,本發明的有酶活的RNA分子,可以有與一個或者多個靶基因的RNA區域互補的特異的底物結合位點。本發明的核酶可以在底物結 合位點內或者其周圍具有賦予了該分子RNA切割活性的核苷酸序列。核酸的修飾本發明提供了產生本發明的核酸的變異體的方法,所述的本發明 核酸例如那些編碼本發明的酰胺酶或者本發明的抗體的核酸。這些方 法可以被重復或者以各種組合方式來應用,以產生與模板核酸編碼的 酰胺酶相比具有改變的或不同的活性,或者改變的或不同的穩定性的 酰胺酶。這些方法也可以被重復或者以各種組合方式來應用,以例如 使基因/信息表達、信息翻譯或者信息穩定性產生變化。另一方面,細 胞的遺傳學組成可以被改變,通過例如在體外進行同源基因的修飾, 然后重新插入到細胞。本發明的核酸可以用任何方法進行變化。例如,無定向或隨機方 法、或者非隨機、或者"定向進化"的方法,參見如,美國專利號 6,361,974。基因的隨機突變方法在本領域是已知的,參見如,美國專 利號5,830,696。例如,可以應用突變劑來對基因進行隨機突變。突變 劑包括,如,紫外線或者Y輻射,或者化學誘變劑,如,絲裂霉素, 亞硝酸,光活化的補骨脂內酯,它們單獨使用或者組合使用來誘導DNA 的斷裂,其可以通過重組被修復。另外的化學誘變劑包括,如,亞硫 酸氫鈉,亞硝酸,羥胺,肼或者甲酸。其它的誘變劑是核苷酸前體的 類似物,如,亞硝基胍,5-溴尿嘧啶,2-氨基嘌呤,或者吖啶。這些試 劑可以加入到PCR反應中替換核苷酸前體,從而突變該序列。也可以 應用嵌入試劑如普羅黃素,吖啶黃,奎納克林和類似物。可以應用分子生物學上的任何技術,如隨機PCR誘變,參見,如, Rice (1992) Proc. Natl. Acad. Sci. USA 89:5467-5471;或者組合式多重 盒式誘變,參見如,Crameri (1995) Biotechinques 18:194-196。可選擇 地,核酸,如基因,可以在隨機片段化后重新裝配,參見,如,美國 專利號6,291,242; 6,287,862; 6,287,861; 5,955,358; 5,830,721; 5,824,514, 5,811,238; 5,605,793.。在可選擇的方面,修飾、增加或者刪除可以通過易錯PCR、重排、寡核苷酸誘導的定點突變、裝配PCR、有性PCR誘變、體內誘變、盒式誘變、遞歸整體誘變、指數整體突變、位點專一性誘變、基因重裝配、基因位點飽和誘變(GSSM)、合成連接重裝 酉己(SLR)、重纟且、遞歸序歹!j重纟且(recursive sequence recombination)、 硫代磷酸酯修飾的DNA誘變、含有尿嘧啶模板的誘變、缺口二重誘變(gapped duplex mutagenesis)、點錯配修復i秀變(point mismatch repair mutagenesis)、修復缺陷型宿主株誘變、化學誘變、放射誘變、缺失 誘變、限制選擇誘變(restriction-selection mutagenesis)、限制純化誘 變(restriction-purification mutagenesis)、人工基因合成、整體i秀變、 嵌合核酸多聚體生成、和/或者這些方法和其它方法的組合產生。以下的出版物描述了各種遞歸重組程序和/或可以整入到本發明的 方法中的方法Stemmer (1999) "Molecular breeding of viruses for targeting and other clinical properties "Tumor Targeting 4:1-4; Ness( 1999) Nature Biotechnology 17:893-896; Chang (1999) "Evolution of a cytokine using DNA family shuffling" Nature Biotechnology 17:793-797; Minshull(1999) "Protein evolution by molecular breeding" Current Opinion in Chemical Biology 3:284-290; Christians (1999) "Directed evolution of thymidine kinase for AZT phosphorylation using DNA family shuffling" Nature Biotechnology 17:259-264; Crameri (1998) "DNA shuffling of a family of genes from diverse species accelerates directed evolution" Nature 391:288-291; Crameri ( 1997) "Molecular evolution of an arsenate detoxification pathway by DNA shuffling" Nature Biotechnology 15: 436-438; Zhang (1997)"Directed-evolution of an effective fUcosidase from a galactosidase by DNA shuffling and screening" Proc. Natl. Acad. Sci. USA 94:4504-4509; Patten等(1997) "Applications of DNA Shuffling to Pharmaceuticals and Vaccines " Current Opinion in Biotechnology 8:724-733 ; Crameri等(1996 ) " Construction and evolution of antibody-phage libraries by DNA shuffling" Nature Medicine 2:100-103; Gates等(1996) "Affinity selective isolation of ligands from peptide libraries through display on a lac repressor 'headpiece dimer'" Journal of Molecular Biology 255:373-386; Stemmer ( 1996) "Sexual PCR andAssembly PCR" In: The Encyclopedia of Molecular Biology. VCH Publishers, New York. 447-457頁;Crameri and Stemmer ( 1995)"Combinatorial multiple cassette mutagenesis creates all the permutations of mutant and wildtype cassettes" BioTechniques 18:194-195; Stemmer 等(1995) "Single-step assembly of a gene and entire plasmid form large numbers of oligodeoxyribonucleotides " Gene, 164:49-53; Stemmer (1995 )"The Evolution of Molecular Computation" Science 270:1510; Stemmer(1995) "Searching Sequence Space" Bio/Technology 13:549-553; Stemmer (1994) "Rapid evolution of a protein in vitro by DNA shuffling" Nature 370: 389-391; Stemmer (1994) "DNA shuffling by random fragmentation and reassembly: In vitro recombination for molecular evolution" Proc, Natl. Acad. Sci. USA 91: 10747-10751 。產生多樣性的突變方法包括,例如,定點誘變(Ling等.(1997)"Approaches to DNA mutagenesis: an overview" Anal Biochem. 254(2): 157-178; Dale等(1996 ) " Oligonucleotide-directed random mutagenesis using the phosphorothioate method" Methods Mol. Biol. 57:369-374; Smith( 1985)" In vitro mutagenesis "Am. Rev. Genet. 19:423-462; Botstein & Shortle (1985) "Strategies and applications of in vitro mutagenesis" Science 229:1193-1201; Carter( 1986)"Site誦directed mutagenesis ^Biochem. J. 237: 1-7; Kunkel (1987) "The efficiency of oligonucleotide directed mutagenesis "在Nucleic Acids & Molecular Biology( Eckstein, R禾口 Lilley, D. M. J. eds., Springer Verlag, Berlin));使用含有尿嘧啶的模板的誘變(Kunkel (1985) "Rapid and efficient site-specific mutagenesis without phenotypic selection" Proc. Natl. Acad. Sci. USA 82: 488-492; Kunkel等.(1987) "Rapid and efficient site-specific mutagenesis without phenotypic selection "Methods in Enzymol. 154, 367-382;和Bass等.(1988)" Mutant Trp repressors with new DNA-binding specificities " Science 242: 240-245);寡核苷酸誘導的定點誘變(Methods in Enzymol. 100: 468-500(1983); Methods in Enzymol. 154: 329-350 (1987); Zoller & Smith(1982)"Oligonucleotide-directed mutagenesis using M13-derived vectors: an efficient and general procedure for the production of point mutations inany DNA fragment" Nucleic Acids Res. 10: 6487-6500; Zoller & Smith(1983) "Oligonucleotide-directed mutagenesis of DNA fragments cloned into M13 vectors" Methods in Enzymol. 100:468-500和Zoller & Smith(1987) Oligonucleotide-directed mutagenesis: a simple method using two oligonucleotide primers and a single-stranded DNA template " Methods in Enzymol. 154: 329-350);硫代磷酸酯修飾的DNA誘變(Taylor等.(1985) "The use of phosphorothioate-modified DNA in restriction enzyme reactions to prepare nicked DNA" Nucl. Acids Res. 13: 8749-8764 ; Taylor 等 (1985 ) " The rapid generation of oligonucleotide-directed mutations at high frequency using phosphorothioate-modified DNA " Nucl. Acids Res. 13:8765-8787(1985); Nakamaye (1986) " Inhibition of restriction endonuclease Nci I cleavage by phosphorothioate groups and its application to oligonucleotide-directed mutagenesis" Nucl. Acids Res. 14: 9679-9698; Sayers 等 (1988 ) " Y-T Exonucleases in phosphorothioate-based oligonucleotide-directed mutagenesis" Nucl. Asids Res. 16:791-802禾口 Sayers等(1988 )" Strand specific cleavage of phosphorothioate-containing DNA by reaction with restriction endonucleases in the presence of ethidium bromide" Nucl. Acids Res. 16: 803-814);使用缺口雙倍DNA的誘變(Kramer等.(1984 ) "The gapped duplex DNA approach to oligonucleotide-directed mutation construction" Nucl. Acids Res. 12: 9441-9456 ; Kramer & Fritz ( 1987 ) Methods in Enzymol."Oligonucleotide-directed construction of mutations via gapped duplex DNA" 154: 350-367; Kramer等(1988) "Improved enzymatic in vitro reactions in the gapped duplex DNA approach to oligonucleotide-directed construction of mutations" Nucl. Acids Res. 16:7207禾口 Fritz等(1988)"Oligonucleotide-directed construction of mutations: a gapped duplex DNA procedure without enzymatic reactions in vitro" Nucl. Acids Res. 16: 6987-6999)。可以用于實踐本發明的另外的方案包括點錯配修復(Kramer(1984) "Point Mismatch Repair" Cell 38: 879-887),應用修復缺陷型宿主株的誘變(Carter等(1985) "Improved oligonucleotide site-directed mutagenesis using Ml 3 vectors "Nucl. Acids Res. 13: 4431-4443禾口 Carter(1987) "Improved oligonucleotide-directed mutagenesis using M13 vectors" Methods inEnzymol. 154: 382-403),缺失誘變(Eghtedarzadeh(1986) "Use of oligonucleotides to generate large deletions" Nucl. Acids Res. 14:5115),限帝i卜選擇和限制-純化(Wells等(1986) "Importance of hydrogen-bond formation in stabilizing the transition state of subtilisin" Phil. Trans. R. Soc. Lond. A 317: 415-423),通過全基因合成的誘變(Nambiar等(1984) "Total synthesis and cloning of a gene coding for the ribonuclease S protein" Science 223: 1299-1301; Sakamar禾卩Khorana(1988) "Total synthesis and expression of a gene for the a-subunit of bovine rod outer segment guanine nucleotide-binding protein(transducin)"Nucl. Acids Res. 14: 6361-6372; Wells等(1985) "Cassette mutagenesis: an efficient method for generation of multiple mutations at defined sites " Gene 34:315-323 和 Grundstrom等 (1985 )"Oligonucleotide-directed mutagenesis by microscale 'shot-gun' gene synthesis" Nucl. Acids Res. 13: 3305-3316), 雙鏈斷裂修復(Mandecki(1986 ) , Arnold (1993 ) " Protein engineering for unusual environments " Current Opinion in Biotechnology 4:450-455. "Oligonucleotide-directed double-strand break repair in plasmids of Escherichia coli: a method for site-specific mutagenesis" Proc. Natl. Acad. Sci. USA, 83: 7177-7181 )。很 多以上的方法的另外的細節在Methods in Enzymology的54巻中有說 明,其中也描述了用于解決各種誘變方法遇到的問題的有用的控制。在例如下列的文件中描述了可以用于實踐本發明的方案,如 Stemmer的美國專利號5,605,793 (1997.2.25), "Methods for In Vitro Recombination"; Stemmer等的美國專利號5,811,238 (1998. 9. 22)"Methods for Generating Polynucleotides having Desired Characteristics by Iterative Selection and Recombination"; Stemmer等的美國專禾(J號 5,830,721 (1998.11.3), "DNA Mutagenesis by Random Fragmentation and Reassembly"; Stemmer等的美國專利號5,834,252 (1998.11.10),"End-Complementary Polymerase Reaction "; Minshull等的美國專利號5,837,458 (1998. 11. 17) "Methods and Compositions for Cellular and Metabolic Engineering " ; WO 95/22625 , Stemmer禾口 Crameri , "Mutagenesis by Random Fragmentation and Reassembly " ; WO 96/33207, Stemmer禾卩Lipschutz, "End Complementary Polymerase Chain Reaction"; WO 97/20078, Ste醒er和Crameri的"Methods for Generating Polynucleotides having Desired Characteristics by Iterative Selection and Recombination"; WO 97/35966, Minshull和Stemmer, "Methods and Compositions for Cellular and Metabolic Engineerin"; WO 99/41402, P腿onen等,"Targeting of Genetic Vaccine Vectors"; WO 99/41383, Punnonen等,"Antigen Library Immunization"; WO 99/41369, Punnonen 等,"Genetic Vaccine Vector Engineering"; WO 99/41368, Punnonen等,752008 , Stemmer 禾卩 Crameri , " DNA Mutagenesis by Random Fragmentation and Reassembly" ; EP 0932670, Stemmer, "Evolving Cellular DNA Uptake by Recursive Sequence Recombination"; WO 99/23107, Stemmer等,"Modification of Virus Tropism and Host Range by Viral Genome Shuffling"; WO 99/21979, Apt等,"Human Papillomavirus Vectors "; WO 98/31837 , del Cardayre等,"Evolution of Whole Cells and Organisms by Recursive Sequence Recombination"; WO 98/27230 , Patten和 Stemmer , " Methods and Compositions for Polypeptide Engineering"; WO 98/27230, Stemmer等,"Methods for Optimization of Gene Therapy by Recursive Sequence Shuffling and Selection"; WO 00/00632, "Methods for Generating Highly Diverse Libraries"; WO 00/09679, "Methods for Obtaining in Vitro Recombined Polynucleotide Sequence Banks and Resulting Sequences"; WO 98/42832, Arnold等,"Polynucleotide Sequences Using Random or Defined Primers "; WO 99/29902, Arnold等,"Method for Creating Polynucleotide and Polypeptide Sequences"; WO 98/41653, Vind, "An in Vitro Method for Construction of a DNA Library"; WO 98/41622, Borchert等, "Method for Constructing a Library Using DNA Shuffling";以及WO 98/42727, Pati禾卩Zarling, "Sequence Alterations using HomologousRecombination "。在例如下列的文件中描述了可以用于實踐本發明的方案(提供了 關于產生不同多樣性的方法的細節),如美國專利申請系列號(USSN) 09/407,800, Patten等的"SHUFFLING OF CODON ALTERED GENES", 于1999年9月28日歸檔;del Cardayre等的"EVOLUTION OF WHOLE CELLS AND ORGANISMS BY RECURSIVE SEQUENCE RECOMBINATION ", 美國專利號6,379,964 ; Crameri等的" OLIGONUCLEOTIDE MEDIATED NUCLEIC ACID RECOMBINATION",美國專利號6,319,714; 6,368,861; 6,376,246; 6,423,542; 6,426,224和PCT/US00/01203; Welch等的"USE OF CODON-VARIED OLIGONUCLEOTIDE SYNTHESIS FOR SYNTHETIC SHUFFLING",美國專利號6,436,675; Selifonov等的"METHODS FOR MAKING CHARACTER STRINGS, POLYNUCLEOTIDES & POLYPEPTIDES HAVING DESIRED CHARACTERISTICS", 2000年1月18日歸檔,(PCT/US00/01202) 和,如Selifonov等的"METHODS FOR MAKING CHARACTER STRINGS, POLYNUCLEOTIDES & POLYPEPTIDES HAVING DESIRED CHARACTERISTICS", 2000年7月18日歸檔,(美國系列 號09/618,579); Sdifonov和Ste讓er的"METHODS OF POPULATING DATA STRUCTURES FOR USE IN EVOLUTIONARY SIMULATIONS",2000年1月18日歸檔(PCT/US00/01138),和Affholter 的"SINGLE-STRANDED NUCLEIC ACID TEMPLATE- MEDIATED RECOMBINATION AND NUCLEIC ACID FRAGMENT ISOLATION", 2000年9月6日歸檔(美國系列號09/656,549),和美國專利號 6,177,263; 6,153,410。非隨機的或者"定向進化"的方法包括例如,飽和誘變(GSSM)、 合成的連接重裝配(SLR),或者它們的組合,它們被用來修飾本發明 的核酸,以產生具有新的或者改變的性質的酰胺酶(如,在強酸性或 者強堿性條件、高溫等條件下的活性)。由改變了的核酸編碼的多肽可 以在測定蛋白水解或者其它活性之前對活性進行篩選。可以應用任何 測試形式或者方案,如,用毛細管陣列平臺。參見,如,美國專利號6,361,974; 6,280,926; 5,939,250。
娜赦,或者osw
一方面,應用含有簡并的N,N,G/T序列的密碼子引物將點突變引 入到多聚核苷酸,如,本發明的酰胺酶或者抗體,以便產生一套子代 多肽,其中,在每個氨基酸位置都可以出現完整范圍的單個氨基酸替 換,例如,替換的位置可以在將要被改變的酶活性位點或者配基結合 位點內的氨基酸殘基。這些寡聚核苷酸可以包括鄰近的第一同源序列、 簡并的N,N,G/T序列和可選擇的第二同源序列。由這樣的寡聚核苷酸 的應用獲得的下游的子代翻譯產物包括在該多肽上每一個氨基酸位點 的所有可能的氨基酸變化,這是由于N,N,G/T序列的簡并包括了所有 20個氨基酸的密碼子。 一方面, 一個這樣的簡并寡聚核苷酸(例如, 包括一個簡并的N,N,G/T盒)被應用,以使親代多聚核苷酸模板中各 個原先的密碼子發生完整范圍的密碼子替換。另一方面,應用至少兩 個簡并序列盒——或者是在同一個寡聚核苷酸中或者不是,以使親代 多聚核苷酸模板中的至少兩個原先的密碼子發生完整范圍的密碼子替 代。例如,在一個寡聚核苷酸中可以含有多于一個的N,N,G/T序列, 這樣,在多于一個的位點導入氨基酸突變。這樣的多個N,N,G/T序列 可以是直接鄰近的,或者被一個或者多個另外的核苷酸序列隔開。另 一方面,可用于引入增加和缺失的寡聚核苷酸可以單獨應用或者與含 有N,N,G/T序列的密碼子組合應用,以引入氨基酸增加、缺失和/或取 代的任何組合或者排列。
一方面,應用含有鄰接的N,N,G/T三聯體,即簡并的(N,N,G/T) n序列的寡聚核苷酸,可以在兩個或者多個鄰近的氨基酸位置同時進行 誘變。另一方面,可以應用簡并度比N,N,G/T序列小的簡并盒。例如, 在一些例子中,(如,在一個寡聚核苷酸中)應用包括僅僅一個N的簡 并三聯體序列是理想的,其中所述的N可以是在三聯體的第一,第二 或者第三的位置。在剩下的兩個位置可以使用包括任何組合和排列的 任何其它的堿基。作為選擇,在一些例子中,(如,在一個寡聚核苷酸 中)使用簡并的N,N,N三聯體序列是理想的。
一方面,應用簡并的三聯體(如N,N,G/T三聯體),可以系統地和容易地在多肽的所有氨基酸位置中的每一個位置獲得完整范圍的可能 的天然氨基酸(對應于所有20個氨基酸)(在可供選擇的方面,所述 方法也包括在每一個氨基酸殘基或者密碼子位置產生比所有可能的種類要少的替換)。例如,對于100個氨基酸的多肽,可以產生2000個 不同的種類(g卩,每個位置可能的20種氨基酸xi00個氨基酸位置)。 通過應用含有簡并N,N,G/T三聯體的一段寡聚核苷酸或者一套寡聚核 苷酸,32個不同的序列可以編碼所有20種可能的天然氨基酸。因此, 在使用至少一種這樣的寡聚核苷酸進行親本多聚核苷酸序列飽和誘變 的反應容器中,產生了 32種不同的子代寡聚核苷酸,它們編碼20種 不同的多肽。相反地,在定點突變中,應用非簡并的寡聚核苷酸導致 在每個反應容器中僅僅有一種子代多肽產物。非簡并的寡聚核苷酸可 以選擇性地與公開的簡并引物組合使用;例如,在工作多肽中,可以 應用非簡并的寡聚核苷酸來產生特異的點突變。這就提供了一種手段 來獲得特定的沉默點突變、導致相應的氨基酸變化的點突變、以及引 起終止密碼子產生和多肽片段相應的表達終止的點突變。一方面,每一個飽和誘變反應容器中含有編碼至少20種子代多肽 (如,酰胺酶)分子的多聚核苷酸,因此所有的20種天然氨基酸都會 出現在對應于親本多聚核苷酸中的被誘變的密碼子位置上的特定的氨 基酸位置(其它的例子使用了少于20個天然的組合)。產生于每個飽 和誘變反應容器的32倍簡并的子代多肽可以進行克隆擴增(例如,使 用例如表達載體克隆至合適的宿主,如E.coli宿主),然后進行表達的 篩選。當通過篩選確定顯示出有利的性質變化(例如與親本多肽比較, 在堿性、酸性條件下蛋白水解活性增強)的單個子代多肽時,就可以 用測序來確定其中所含有的相應的有利的氨基酸取代。一方面,如在此所公開的,應用飽和誘變對親本多肽的各個和所 有的氨基酸位置進行誘變,確定出的有利的氨基酸變化可以在超過一 個的氨基酸位置。可以產生含有所有或者部分這些有利的氨基酸替代 的組合的一種或者多種新的子代分子。例如,如果在多肽的三個氨基 酸位置的每一個位置確定出2個特定的有利的氨基酸變化,這樣出現 的排列就包括在每一個位置的3種可能性(與原來的氨基酸沒有變化, 和兩個有利變化中的每一個)和3個位置。這樣,就有3x3x3或者種總的可能性,包括先前檢查出的7種——6種單點突變(即,在三個 位置的每一個有2個)和在任何位置中都沒有變化的l種。
另一方面,位點飽和誘變可以和其它的隨機或者非隨機方法一起 應用來改變序列,如,合成的連接重裝配(見下),重排,嵌合,重組 以及其它的誘變程序和誘變劑。本發明提供了以反復的方式來應用任 何的誘變程序,包括飽和誘變。
合成離體就飾J
本發明提供了一種非隨機的基因改—,統,命名為"合成的連接 重裝配"或者簡稱為"SLR",這是一種"定向進化方法",可以產生具 有新的或者改變的性質的多肽,如,本發明的酰胺酶或抗體。SLR是 一種非隨機地連接寡聚核苷酸片段的方法。這一方法與隨機的寡聚核 苷酸重排不同,因為核酸構建模塊(building blocks)并不進行重排、 連連接、或者隨機嵌合,而是進行非隨機的裝配。參見,如,美國專 利申請系列號(USSN)09/332,835,名稱為"Synthetic Ligation Ressembly in Directed Evolution",在1999年6月14日歸檔("USSN 09/332,835")。 一方面,SLR包括以下的步驟(a)提供模板多聚核苷酸,其中該模 板多聚核苷酸包括編碼同源基因的序列;(b)提供多個構建模塊多聚 核苷酸,其中所述的構建模塊多聚核苷酸被設計為與模板多聚核苷酸 在預定的序列處橫跨裝配(cross-overreassemble),而且所述的構建模 塊多聚核苷酸包括所述同源基因的變異體序列以及在變異序列兩側與 模板多聚核苷酸同源的序列;(c)將模板多聚核苷酸與構建模塊多聚 核苷酸結合,以便抅建模塊多聚核苷酸與模板多聚核苷酸橫跨裝配, 產生包含同源基因序列變異體的多聚核苷酸。
SLR并不依賴于在待重新組裝的多聚核苷酸之間存在高水平的同 源性。這樣,這一方法可以用于非隨機地產生包括超過10100個不同 嵌合體的子代分子的文庫。SLR可以用于產生包括超過101000個不同 子代嵌合體的文庫。這樣,本發明包括用于產生一套最終的具有按設 計選擇的整個裝配順序的嵌合核酸分子的非隨機方法。這一方法包括 按設計產生大量特定的核酸構建模塊的步驟,這些核酸構建模塊具有 可以應用的相互間相容的可以連接的末端,然后裝配這些核酸構建模塊,這樣就完成了按設計的全部裝配順序。
將被裝配的核酸構建模塊的相互相容的可連接的末端對于這種類 型的順序裝配被認為是"適用的",如果它們使得構建模塊以預先制定 的順序聯接的話。因此,核酸構建模塊被偶聯的總體裝配順序是通過 可連接末端的設計來特異化的。如果不止一個裝配步驟將要被應用, 那么核酸構建模塊被偶聯的總體裝配順序也通過裝配步驟的先后次序
來特異化。 一方面,退火的構建模塊用酶處理,如用連接酶(如,T4 DNA 連接酶)處理,以完成構建模塊的共價鍵連接。
一方面,寡聚核苷酸構建模塊的設計通過分析一套祖先核酸序列 模板來得到,該模板作為產生子代一套最終的嵌合多聚核苷酸的基礎。 這些親本寡聚核苷酸模板作為序列信息源,輔助待誘變例如待嵌合化
或者重排的核酸構建模塊的設計。在這一方法的一個方面,為了選擇 一個或者多個分界點,對多個親本核酸模板的序列進行聯配。所述分 界點可以位于同源的區域,并且可以包括一個或者多個核苷酸。這些 分界點優選由至少兩個祖先模板中共有。所述分界點可以因此用于描 繪將要產生的寡聚核苷酸構建模塊的邊界,以便重新排列親本寡聚核 苷酸。在祖先分子中確定和選擇的分界點用作裝配最終的嵌合子代分 子的潛在的嵌合位點。分界點可以是至少兩個親本多聚核苷酸序列共 同的同源區域(包括至少一個同源核苷酸堿基)。可選擇地,分界點 可以是由至少半數的親本多聚核苷酸序列共同擁有的同源區域,或者, 是由至少三分之二的親本多聚核苷酸序列共同擁有的同源區域。更加 優選地,可應用的分界點是至少四分之三的親本多聚核苷酸序列共同 擁有的同源區域,或者,是幾乎所有的親本多聚核苷酸序列共同擁有 的同源區域。 一方面,分界點是由所有的親本多聚核苷酸序列共同擁 有的同源區域。
一方面,為了產生一個徹底的子代嵌合多聚核苷酸文庫,連接重 裝配過程被盡可能充分地實施。換句話說,核酸構建模塊的所有可能 順序的組合存在于一套最終的嵌合核酸分子中。同時,另一方面,每 個組合中的裝配順序(即,各個構建模塊的裝配順序,按各個最終的 嵌合核酸序列的5'到3'的方向)是按照以上所述設計的(或者是非隨 機的)。由于本發明的非隨機性質,不需要的副產物的可能性大大降低。
另一方面,系統地實施連接重裝配的方法。例如,實施本方法來 產生系統區分化的子代分子文庫,劃分開的文庫可以系統地進行篩選, 例如逐個的篩選。換句話說,通過選擇性的和審慎的應用特定的核酸 構建模塊,再加上選擇性的和審慎的應用連續的分步驟的裝配反應, 本發明使得這樣一種設計可以實現,即可以在各個反應容器中制備出 各自特定的一系列子代產物。這就允許進行系統的檢査和篩選步驟。 因此,這些方法允許對很可能是很大數目的子代分子以較小的組進行 系統性檢測。由于其具有以高度變通而又徹底和系統的方式進行嵌合 化反應的能力,尤其是當祖先分子之間具有低水平的同源性時,所以 這些方法可以產生包括很大數目的子代分子的文庫(或者一套分子)。 由于該快速連接重裝配發明的非隨機性,產生的子代分子優選地包括 具有依設計而選擇的全部裝配序列的最終嵌合核酸分子的文庫。飽和 誘變和優化的定向進化方法也可以用于產生不同的子代分子種類。可 以理解,本發明在分界點的選擇、核酸構建模塊的大小和數目以及偶 聯的大小和設計方面提供了選擇和控制的自由度。更進一步理解的是, 分子間同源性的要求對于本發明的操作性被大大降低了。實際上,甚 至可以在有較少分子間同源性或者沒有分子間同源性的區域選擇區別 點。例如,由于密碼子的擺動性,BP,密碼子的簡并,核苷酸的替代 可以被引入到核酸構建模塊中而并不改變在相應的祖先模板中起初編 碼的氨基酸。可選擇地, 一個密碼子可以被改變以至于起初氨基酸的 編碼被改變。本發明提供了這樣的替換,它們能夠被引入到核酸構建 模塊中,由此增加分子間同源的分界點的發生率,這樣就允許在構建 模塊之間實現更多數目的偶聯,這又使得更多數目的子代嵌合分子產 生。
另一個方面,產生構建模塊的步驟的合成性質允許設計和引入核 苷酸(如, 一個或者多個核苷酸,其可以是,例如,密碼子或者內含 子或者調控序列),所述核苷酸后來可以選擇性地在體外過程(例如, 通過誘變)或者在體內過程(如,通過利用宿主生物體的基因剪接能 力)中去除。可以理解,在很多情況中,除了產生適用的分界點的潛 在好處以外,由于很多其它的原因也需要引入這些核苷酸。一方面,核酸構建模塊被用于引入一個內含子。因此,功能性的 內含子引入到按照在此說明的方法而產生的人造基因中。人工引入的 內含子在宿主細胞的基因剪接中具有功能性,在很大程度上是與天然 發生的內含子在基因剪接上所具有的功能性相同。
汰眾游定廚遂眾系統
發明提供了一種非隨機的基因變化系統,命名為"優化的定向進 化系統",其可以用來生產具有新的或者改變的性質的多肽,如本發明
的酰胺酶或者抗體。優化的定向進化目的是應用還原性重配(reductive reassortment)、重組和選擇的重復循環,通過重組實現核酸的定向分子 進化。優化的定向進化允許產生大量的進化的嵌合序列,其中產生的 群體顯著地富集了具有預定數目遺傳交換事件的序列。
遺傳交換事件是在嵌合序列中的一個點,在這里,從一個親本變 異體到另一個親本變異體的序列轉換發生。這樣的點一般在來自兩個 親本的寡聚核苷酸連接在一起形成單個序列的連接處。這一方法允許 計算寡聚核苷酸序列的正確濃度,這樣,序列的最終嵌合群體富集了 所選擇數目的遺傳交換事件。這也提供了對選擇具有預定數目的遺傳 交換事件的嵌合突變體的更多控制。
此外,這一方法與其他系統相比,提供了一種用于探究大數量的 可能蛋白變異體的方便手段。以前,例如,如果在反應中產生了 1013 個嵌合分子,測試這樣大數目的嵌合突變體的特定活性將會非常困難。 此外,子代群體的相當部分將具有很高數目的遺傳交換事件,其中得 到的蛋白不大可能具有增高水平的特定活性。通過應用這些方法,嵌 合分子的群體可以富集那些含有特定數目的遺傳交換事件的變異體。 因此,盡管在反應中可以仍然產生1013嵌合分子,但是所選擇的用于 進一步分析的每一個分子很可能具有,例如,僅僅三個遺傳學交換事 件。因為得到的子代群體可以(在統計學上)偏斜到具有預定數目的 遺傳交換事件,所以嵌合分子之間的功能多樣性的界線減少。當計算 出來自最初的親本多聚核苷酸中的哪一個可能影響到特定的性質時, 這時便提供了更加可控制的變量。
產生嵌合子代多聚核苷酸序列的一個方法是產生對應于每一個親本序列的片段或者部分的寡聚核苷酸。每一個寡聚核苷酸優選地包括 重疊的獨特區域,這樣把所述寡聚核苷酸混合,得到具有以正確順序 裝配的寡聚核苷酸片段的新的變異體。也可以發現另外的一些信息,
如,在USSN 09/332,835;美國專利號6,361,974中。對應于每一個親 本變異體產生的寡聚核苷酸數目與在最終產生的嵌合分子中得到的遺 傳學交換的總的數目具有一定的關系。例如,為了發現具有如在高溫 下有更高活性的嵌合變異體,可以提供三個親本核苷酸序列變異體來 進行連接反應。作為一個例子,對應于每一個親本變異體的每一部分 可以產生一套50個寡聚核苷酸序列。相應的,在連接裝配過程中,在 每一個嵌合序列中有可能有超過50個交換事件。每一個產生的嵌合多 聚核苷酸都以交替的順序含有來自各個親本變異體的寡聚核苷酸的可 能性很低。如果每一個寡聚核苷酸片段以同樣的摩爾量存在于連接反 應中,有可能在一些位置中來自同一親本多聚核苷酸的寡聚核苷酸將 相互一個個連接,而不導致遺傳交換事件。如果在這一例子的任何連 接步驟中,來自每一個親本的每一個寡聚核苷酸的濃度保持不變,那 么將會有三分之一的機會(假定3個親本)來自同一個親本變異體的 寡聚核苷酸連接于嵌合序列內而不產生遺傳交換。
相應的,可以確定概率密度函數(PDF),預測在一個連接反應的 每一步中可能發生的遺傳交換事件的總數,其中給定了親本變異體的 套數、對應于每種變體的寡聚核苷酸數目、以及在連接反應中的每個 步驟中的每種變異體的濃度。在確定PDF中應用到的統計學和數學在 下面被描述。通過應用這些方法,可以計算這樣的概率密度函數,而 且這樣就富集了來源于特定連接反應的具有預定數目的遺傳交換事件 的嵌合子代群體。此外,可以預先確定遺傳交換事件的目標數目,然 后對該系統進行程序化,以計算在該連接反應的每一個步驟中,每種 親本寡聚核苷酸的起始量,從而得到以遺傳交換事件的預先確定的數 目為中心的概率密度函數。這些方法是應用還原性重配、重組和選擇 的重復循環,通過重組實現編碼多肽的核酸的定向分子進化。該系統 允許產生大量的進化的嵌合序列,其中產生的群體顯著地富集了具有 預定數目遺傳交換事件的序列。遺傳交換事件是在嵌合序列中的一個 點,在這里,從一個親本變異體到另一個親本變異體的序列轉換發生。這樣的點一般在來自兩個親本的寡聚核苷酸連接在一起形成單個序列 的連接處。這一方法允許計算寡聚核苷酸序列的正確濃度,這樣,序 列的最終嵌合群體富集了所選擇數目的遺傳交換事件。這也提供了對 選擇具有預定數目的遺傳交換事件的嵌合突變體的更多控制。
此外,這一方法與其他系統相比,提供了一種用于探究大數量的 可能蛋白變異體的方便手段。通過應用在這里描述的方法,嵌合分子 的群體可以富集那些含有特定數目的遺傳交換事件的變異體。因此, 盡管在反應中可以仍然產生1013個嵌合分子,但是所選擇的用于進一 步分析的每一個分子很可能具有,例如,僅僅三個遺傳學交換事件。 因為得到的子代群體可以(在統計學上)偏斜到具有預定數目的遺傳 交換事件,所以嵌合分子之間的功能多樣性的界線減少。當計算出來 自最初的親本多聚核苷酸中的哪一個可能影響到特定的性質時,這時 便提供了更加可控制的變量。
一方面,該方法通過產生對應于每一個親本序列的片段或者部分 的寡聚核苷酸,產生嵌合子代多聚核苷酸序列。每一個寡聚核苷酸優 選地包括重疊的獨特區域,這樣把所述寡聚核苷酸混合,得到具有以
正確順序裝配的寡聚核苷酸片段的新的變異體。也可參見USSN 09/332,835。
對應于每一個親本變異體產生的寡聚核苷酸數目與在最終產生的 嵌合分子中得到的遺傳學交換的總的數目具有一定的關系。例如,為 了發現具有如在高溫下有更高活性的嵌合變異體,可以提供三個親本 核苷酸序列變異體來進行連接反應。作為一個例子,對應于每一個親 本變異體的每一部分可以產生一套50個的寡聚核苷酸序列。相應的, 在連接裝配過程中,在每一個嵌合序列中有可能有超過50個交換事件。 每一個產生的嵌合多聚核苷酸都以交替的順序含有來自各個親本變異 體的寡聚核苷酸的可能性很低。如果每一種寡聚核苷酸片段以同樣的 摩爾量存在于連接反應中,有可能在一些位置中來自同一親本多聚核 苷酸的寡聚核苷酸將相互一個個連接,而不導致遺傳交換事件。如果 在這一例子的任何連接步驟中,來自每一個親本的每一種寡聚核苷酸 的濃度保持不變,那么將會有三分之一的機會(假定3個親本)來自 同一個親本變異體的寡聚核苷酸連接于嵌合序列內而不產生遺傳交換。
相應的,可以確定概率密度函數(PDF),預測在一個連接反應的 每一步中可能發生的遺傳交換事件的總數,其中給定了親本變異體的 套數、對應于每種變體的寡聚核苷酸數目、以及在連接反應中的每個 步驟中的每種變異體的濃度。在確定PDF中應用到的統計學和數學在 下面被描述。通過應用這些方法,可以計算這樣的概率密度函數,而 且這樣就富集了來源于特定連接反應的具有預定數目的遺傳交換事件 的嵌合子代群體。此外,可以預先確定遺傳交換事件的目標數目,然 后對該系統進行程序化,以計算在該連接反應的每一個步驟中,每種 親本寡聚核苷酸的起始量,從而得到以遺傳交換事件的預先確定的數 目為中心的概率密度函數。
嫁定遺/統鮮,
本發明包括系統和軟件,它們以所需的遺傳交換的概率密度函數
(PDF)、待重新裝配的親本基因的數目以及重新裝配的片段數目作為 輸入量。該程序輸出"片段PDF",它可以用于確定用于獲得重新裝配 的基因和那些基因的估計的遺傳交換PDF的具體方法。在此說明的過 程優選地在MATLABa中進行(The Mathworks, Natick, Massachusetts), MATLAB&是一種用于技術計算的程序語言和開發環境。
靴継
在實踐本發明時,這些過程可以迭代反復。例如,鑒定出改變的 或者新的酰胺酶表型的核酸,再分離,再修飾,再測試活性。這一過 程可以重復直到得到所需的表型。例如,完整的生物化學合成代謝的 或者分解代謝的途徑可以在細胞中設計,包括,如,酰胺水解活性, 7-氨基頭孢烷酸(7-ACA)的生成,半合成的頭孢菌素抗生素例如頭孢 噻吩、頭孢噻啶和頭孢呋辛的合成。
類似地,如果確定了特定的寡聚核苷酸對于所有所需的性質(如, 一種新的酰胺酶表型)沒有影響,那么就可以合成包括這段序列在內 的更大的親本寡聚核苷酸,從而將作為變量的這段序列去除。由于將 這段序列合并到更大的序列中,可以避免任何遺傳交換事件,所以在子代多聚核苷酸中,這一序列不再有任何變異。確定哪些寡聚核苷酸 與所需的性質最有關系,以及哪些與所需的性質無關的重復實踐可以 更有效地探尋所有可能的具有特定性質或者活性的蛋白變異體。
#膽謬
分子的體內重排在本發明的提供本發明的多肽如抗體、酰胺酶等 的變異體的方法中使用。體內重排利用細胞的天然特性進行多聚體重 組。體內重組提供了實現分子多樣性的主要的天然途徑,而遺傳重組
仍然是一種相對復雜的過程,其涉及1)同源性識別;2)鏈切割,鏈 侵入,和導致產生重組交叉的代謝步驟;和最后3)交叉消除至分離的 重組分子。交叉的形成需要同源序列的識別。
一方面,本發明提供了由至少第一多聚核苷酸(如,本發明的酰 胺酶)和第二多聚核苷酸(如,酶,如本發明的酰胺酶或者任何其它 的酰胺酶,或者,標記或者抗原決定部位)產生雜合的多聚核苷酸的 方法。本發明可以通過引入至少第一多聚核苷酸和第二多聚核苷酸到 適合的宿主細胞中產生雜合的多聚核苷酸,第一多聚核苷酸和第二多 聚核苷酸至少一個區域的部分序列有同源性。部分序列同源的區域促 進了導致序列重組產生雜合多聚核苷酸的過程。正如在此所用,術語 "雜合多聚核苷酸"是由本發明的方法產生的任何核苷酸序列,并且 含有來自至少兩個起初的多聚核苷酸序列的序列。這樣的雜合多聚核 苷酸可以源于分子間重組事件,分子間重組事件促進了 DNA分子間的 序列整合。此外,這樣的雜合多聚核苷酸可以源自分子內還原性重配 過程,分子內還原性重配過程利用重復序列來改變DNA分子中的核苷 酸序列。
沐力就
本發明提供了應用本發明核酸的體內重配。這些方法包括"分子 間"加工過程,可以統稱為"重組",在細菌中一般視作"依賴于RecA" 的現象。本發明的方法可以利用宿主細胞的重組過程來重組和重配序 列,或者利用細胞介導還原過程的能力,通過缺失來降低準重復序列 的復雜性。"還原性重配"的過程可以通過"分子內"的RecA依賴性的過程發生。
在本發明的另一個方面,新型的多聚核苷酸可以通過還原性重配 過程產生。本方法包括產生含有連續序列(最初的編碼序列)的構建 物,將它們插入到合適的載體中,隨后將它們引入到合適的宿主細胞 中。各個分子本體的重配通過具有同源性區域的構建物中的連續序列 之間,或準重復單元之間的組合過程發生。重配過程重組和/或降低了 重復序列的復雜性和范圍,并且導致產生新的蛋白種類。可以應用不
同的處理來提高重配率。這些可以包括用紫外線或者DNA損傷化學劑
處理,和/或使用表現出高水平"遺傳不穩定性"的宿主細胞系。因此, 重配過程可以包括同源重組或者準重復序列的天然性質來弓1導它們自 身的進化。
重復或者"準重復(quasi-repeated)"序列在基因的不穩定性中起 作用。在本發明中,"準重復"是并不限于它們起初的單元結構的重復。 準重復單元可以在構建物中以序列的排列出現;相似序列的連續單元。 一旦連接,在連續序列之間的連接處變得本質上無形,并且得到的構 建物的準重復性質在分子水平現在是連續的。細胞在準重復序列之間 進行的缺失過程降低了得到的構建物的復雜性。準重復單位提供了一 個實際上沒有限制的模板內容,在模板上可以發生滑移事件。因此, 含有準重復的構建物有效地提供了足夠的分子彈性,缺失(和潛在的 插入)事件實際上可以在準重復單元內的任何地方發生。
當準重復序列全部以相同方向連接,例如,頭對尾或者反之亦然, 細胞就不能區別各個單元。因此,還原過程可以在整個序列中發生。 相反地,當例如,所述單元以頭對頭存在,而不是頭對尾,相鄰單元 的頭尾倒置,這樣缺失的形成將有利于不連續單元的失去。因此,本 發明的方法優選的是序列是處于相同的方向。準重復序列的隨機定向 將會導致重配效率的損失,而序列的一致定向將會提^^最高的效率。 然而,雖然具有較少的相同定向的連續序列會降低效率,但是仍然可 以為新型分子的有效回收提供足夠的彈性。用定向相同以允許更高效 率的準重復序列制備構建物。
應用各種方法中的任何一種,可以將序列裝配成頭對尾的定向, 包括以下a) 可以使用包括poly-A頭和poly-T尾的引物,當制成單鏈時,包括 poly-A頭和poly-T尾的引物將提供定向。這通過由RNA制備引物的 頭幾個堿基來完成,而且隨后用RNaseH可以很容易去除RNA。
b) 可以應用包括唯一的限制酶切割位點的引物。將需要多重位點、一 組唯一的序列、和重復的合成和連接步驟。
c) 引物的內部幾個堿基可以被硫醇化,并且用外切酶來產生合適的具 有尾巴的分子。
重配序列的回收依賴于具有下降的重復指數(RI)的克隆載體的 確定。被重配的編碼序列可以隨后通過擴增回收。產物被再克隆和表 達。具有降低的RI的克隆載體的回收可以被完成,通過
1) 應用僅僅當構建物的復雜性下降時才能穩定地維持的載體。
2) 通過物理程序對縮短的載體進行物理回收。在這一情況下,克隆載 體將應用標準的質粒分離程序進行回收,或者在具有低分子量截留的 瓊脂糖凝膠或者柱子上利用標準程序進行大小分離。
3) 插入物的大小下降時,對含有可以選擇的斷裂基因的載體進行回收。
4) 應用表達載體以及適當的選擇,使用定向選擇技術。
相關的生物體的編碼序列(例如,基因)可以表現出高度的同源 性,并且編碼相當多樣化的蛋白產物。這些類型的序列可以在本發明 中用作準重復序列。以下的實施例說明了幾乎相同的原始編碼序列(準 重復)的重配,然而,這一過程并不限于這種幾乎相同的重復。
以下的例子表明了本發明的典型方法。描述了來源于三(3)種獨 特物種的編碼核酸序列(準重復)。每一個序列編碼的每一種蛋白都具 有不同的一套性質。這些序列中的每一個在序列的獨特位置處的單個 或者幾個堿基對上有差別。準重復序列分別地或者共同地被擴增,并 且被連接到隨機裝配物中,這樣所有可能的排列和組合都可以在連接 分子的群體中獲得。準重復單元的數目可以通過裝配條件控制。準重 復單元在構建物中的平均數目被定義為重復指數(RI)。
一旦構建物形成,可以按照已出版的實驗方案通過瓊脂糖凝膠根 據大小進行分離,也可以不分離,將構建物插入到一個克隆載體中, 并轉染至適當的宿主細胞。然后細胞繁殖并且實現"還原性重配"。 還原性重配過程的速率可以通過引入DNA損傷來進行刺激,如果需要的話。RI的降低是通過一種"分子內"的機制在重復序列間形成缺失 來介導,還是通過"分子間"的機制由重組類似的事件來介導是不重 要的。最終的結果是分子被重配,得到所有可能的組合。
可選擇地,本方法包括一個額外的步驟,即對重排的文庫成員進 行篩選,以確定具有與一種預定的大分子如蛋白質受體、寡聚糖、病 毒顆粒或者其它的預定的化合物或者結構結合或者不同方式地相互作 用,或者催化一個特定的反應(如,酶的催化結構域)的能力的個別 的重排文庫成員。
從這樣的文庫確定出的多肽可以用于治療,診斷,研究和相關目 的(如,催化劑,用于增加水溶液的同滲容摩的溶質,等等),和/或 可以用于進行一輪或者多輪附加的重排和/或選擇循環。
另一方面,可以預見,在重組或重配之前,或者在重組或重配的 過程中,通過本發明的方法產生的多聚核苷酸可以用試劑處理或進行 加工,這些處理或加工促進突變引入到原始的多聚核苷酸中。引入這 樣的突變將會增加得到的雜合多聚核苷酸及其編碼的多肽的多樣性。
促進誘變的試劑和過程可以包括,但不限于(+) -CC-1065,或者如 (+ ) -CC-1065- (N3-腺嘌呤的合成的類似物(參見S皿和Hurley, (1992);能夠抑制DNA合成的N-乙酰化或者脫乙酰基的4,-氟-4-氨 基聯苯加合物(見,例如,van de Poll等(1992)),或者能夠抑制DNA 合成的N-乙酰化或者脫乙酰基的4-氨基聯苯加合物(見,van de Poll 等(1992) , pp.751-758);三價鉻,三價鉻的鹽,可以抑制DNA復制 的多環芳香烴(PAH) DNA加合物,如7-溴甲基-苯[a]蒽("BMA"), 三(2,3-二溴丙基)磷酸鹽("Tris-BP"), 1,2-二溴-3-氯丙烷("DBCP"), 2-溴丙烯醛(2BA),苯并[a]芘-7,8-二氫二醇-9-10-環氧化物("BPDE"), 鈾(II)卣素鹽,N-羥基-2-氨基-3-甲基咪唑[4,5-f]-喹啉("N-羥基-IQ"), 和N-羥基-2-氨基-l-甲基-6-苯基咪唑[4,5-f]-吡啶("ON-羥基-PhIP")。 用于減慢或者停止PCR擴增的特別優選的方法包括紫外線(+ ) -CC-1065和(+) -CC-1065- (N3-腺嘌呤)。特別包含的方法是DNA加 合物或者來自多聚核苷酸或者多聚核苷酸庫的含有DNA加合物的多 聚核苷酸,在進一步的處理前,其可以通過包括加熱含有所述多聚核 苷酸的溶液的過程進行釋放或者去除。序列變異體的產生。
本發明也提供了制備本發明的核酸(如,酰胺酶)序列的序列變 異體的另外的方法。本發明也提供了應用本發明的核酸和多肽分離酰 胺酶的另外的方法。
一方面,本發明提供了本發明的酰胺酶編碼序列
(如,基因,cDNA或者信息)的變異體,其可以通過任何方法被改變,
包括,例如,隨機的方法,或者非隨機的方法,或者"定向進化"的 方法,如上所述。
被分離的突變體可以是天然發生的。變異體也可以在體外產生。 變異體也可以應用基因工程技術來產生,如定點誘變、隨機的化學誘
變、核酸外切酶ni缺失方法和標準的克隆技術。可選擇地,可以應用
化學合成或者修飾方法來產生這樣的變異體、片段、類似物或者衍生
物。本領域技術人員也熟悉制備變異體的其它方法。這些方法包括這 樣的程序,其中,從天然分離物中獲得的核酸序列經過修飾而產生編 碼具有某些特征的多肽的核酸,所述的特征使這些多肽在企業或者實 驗室應用中具有更高的價值。在這樣的程序中,大量的變異體序列被 獲得和表征,這些變異體序列與從天然分離物中得到的序列相比,有 一個或者多個核苷酸的差異。這些核苷酸的差異可能引起相對于天然 分離得到的核酸序列編碼的多肽的氨基酸變化。
例如,變異體可以通過易錯PCR產生。在易錯PCR中,PCR在 DNA聚合酶的復制保真性較低的情況下進行,這樣便在全長的PCR產 物中得到較高的點突變率。易錯PCR在例如,在Leung, D.W.,等, Technique, 1:11 15, 1989)和Caldwell, R. C.和Joyce G. F" PCR Methods Applic., 2: 28-33, 1992中描述。簡要地說,在這一程序中,待突變的核 酸與PCR引物、反應緩沖液、MgCl2、 MnCl2、 Taq聚合酶以及適合濃 度的dNTPs混合,在全長的PCR產物中得到高的點突變率。例如,反 應可以使用20fmol待誘變的核酸進行,每種PCR引物30pmo1,反應 緩沖液包括50mMKCl, lOmMTrisHCl (pH8.3)和0.01%明膠,7mM 的MgCl2, 0.5mM MnCl2, 5 units的Taq聚合酶,0.2mM dGTP, 0.2raM dATP, lmMdCTP,和lmMdTTP。 PCR可以進行30個循環,每個循 環為94°C 1分鐘;45°C 1分鐘;和72°C 1分鐘。然而,這些參數可以適當地變化。誘變的核酸克隆到一個適當的載體,并評價由誘變核酸 編碼的多肽的活性。
變異體也可以用寡聚核苷酸誘導的定向突變產生,在任何感興趣
的克隆DNA中產生位點特異性的突變。寡聚核苷酸誘變在,例如, Reidhaar-01son (1988) Science 241:53-57中描述。簡要地說,在這一 程序中,合成多個具有一個或者多個突變的雙鏈寡聚核苷酸,這些寡 聚核苷酸所含有的突變將要被導入被克隆的DNA中,將這些寡聚核苷 酸插入到待誘變的克隆DNA中。回收含有誘變DNA的克隆,并評估 它們編碼的多肽的活性。
另一個產生變異體的方法是裝配PCR。裝配PCR涉及由小的DNA 片段的混合物裝配出PCR產物。在同一個容器中平行進行很多不同的 PCR反應,其中, 一個反應產物用作另外一個反應的引物。裝配PCR 在例如美國專利號5,965,408有說明。
另一個產生變異體的方法是有性PCR誘變。在有性PCR誘變中, 由于基于序列同源性的DNA分子的隨機片段化,在不同的但是高度相 關的DNA序列的DNA分子之間,在體外強行發生同源重組,然后通 過PCR反應的引物延伸,遺傳交換得到固定。有性PCR誘變在,例如, Ste纖er (1994) Proc. Natl. Asad. Sci. USA 91: 10747-10751中描述。 簡要地說,在這一程序中,多個待重組的核酸用DNase消化,產生具 有50到200個核苷酸的平均大小的片段。純化具有所需的平均大小的 片段,重懸于PCR混合物中。在有利于核酸片段重組的條件下進行PCR 反應。例如,PCR可以這樣進行將純化的片段重懸于含有0.2mM的 各禾中dNTP, 2.2mMMgCl2, 50mMKCl, 10mM的Tris-HCl, pH9.0, 以及0.1%的Triton X-100的溶液中,其濃度為10-30ng/:l,以100: 1 的比例在反應混合物中加入2.5Uiiits的Taq聚合酶,用以下的條件進 行PCR: 94°C 60秒,94°C 30秒,50國55。C 30秒,72。C 30秒(30-45 次),然后72'C進行5分鐘。然而,這些參數可以進行適當的變化。在 一些方面,寡聚核苷酸可以包括在該PCR反應中。在其它的一些方面, DNA聚合酶I的幻enow片段可以用于第一輪PCR反應,而Taq聚合 酶可以用于后續的PCR反應。重組序列經過分離并評估它們編碼的多 肽的活性。變異體也可以通過體內誘變產生。在一些方面,感興趣的序列中 的隨機突變通過在細菌菌株中擴增該感興趣的序列而產生,所述細菌
菌株例如在一個或者多個DNA修復途徑中具有突變的大腸桿菌菌株。
這種"突變"菌株具有比野生型親本更高的隨機突變率。在一種這樣
的菌株中進行DNA的繁殖將最終產生DNA中的隨機突變。適于在體 內誘變中應用的突變菌株在,例如,PCT
發明者D·P·維納, E·沃特斯, K·昌, N·R·巴頓, S·盧, W·格林伯格 申請人:戴弗薩公司
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
韩国伦理电影