<listing id="vjp15"></listing><menuitem id="vjp15"></menuitem><var id="vjp15"></var><cite id="vjp15"></cite>
<var id="vjp15"></var><cite id="vjp15"><video id="vjp15"><menuitem id="vjp15"></menuitem></video></cite>
<cite id="vjp15"></cite>
<var id="vjp15"><strike id="vjp15"><listing id="vjp15"></listing></strike></var>
<var id="vjp15"><strike id="vjp15"><listing id="vjp15"></listing></strike></var>
<menuitem id="vjp15"><strike id="vjp15"></strike></menuitem>
<cite id="vjp15"></cite>
<var id="vjp15"><strike id="vjp15"></strike></var>
<var id="vjp15"></var>
<var id="vjp15"></var>
<var id="vjp15"><video id="vjp15"><thead id="vjp15"></thead></video></var>
<menuitem id="vjp15"></menuitem><cite id="vjp15"><video id="vjp15"></video></cite>
<var id="vjp15"></var><cite id="vjp15"><video id="vjp15"><thead id="vjp15"></thead></video></cite>
<var id="vjp15"></var>
<var id="vjp15"></var>
<menuitem id="vjp15"><span id="vjp15"><thead id="vjp15"></thead></span></menuitem>
<cite id="vjp15"><video id="vjp15"></video></cite>
<menuitem id="vjp15"></menuitem>

諾卡噻唑菌素的生物合成基因簇的制作方法

文檔序號:572813閱讀:1109來源:國知局

專利名稱::諾卡噻唑菌素的生物合成基因簇的制作方法
技術領域
:本發明屬于微生物基因資源和基因工程領域,具體涉及硫肽類抗生素諾卡噻唑菌素(Nocathiacins)的生物合成基因簇的克隆,序列分析,基因功能研究及其應用。
背景技術
:諾卡噻唑菌素(Nocathiacins)是一類富含元素硫,氨基酸殘基被高度修飾的環肽類抗生素,它們作為硫肽家族中十分重要的成員,最初是在篩選對有新青霉素抗性的金黃色葡萄球菌(Methicillin-ResistantS/c[p/^/ococcw51awwiw'MRSA)和有多種耐藥性的糞腸球菌(Multi-DrugResistant£"feracoccws/aec^/w,MREF)的生長有抑制作用的抗生素的過程中,從土壤樣品中發現的[J.1998,57,715]。1998年,Tokushima研究中心率先從擬無枝酸菌Uw_yco/Wo;w&sp.MJ347-81F4)中分離純化到了MJ347-81F4-A(NocathiacinI)和B,并完成了它們的發酵、活性測試和結構測定,但沒有確定其絕對構型。2003年,Bristol-MyersSquibb藥物研究所又從諾卡氏菌(iVocfl^/flsp.WW-12651)中發現了NocathiacinI、II、III,并對其進行了發酵、分離純化和活性測試,還利用NMR、X-ray等方法首次確定了其絕對構型[J爿油'Wo/..2003,56,226,232;Clough,B.;JOg.CAew.2002,67,8699]。諾卡噻唑菌素與硫肽家族其他抗生素一樣也擁有一個以三取代的吡啶為核心,由多個噻唑及脫水氨基酸所構成的環肽中心。其中NocathiacinI在結構上與該家族的另一成員糖硫己糖二酐a極其相似,不同之處在于多了一個2,3-脫氫丙氨酰胺的邊鏈,吲哚酸單元與大環相連部分的酯鍵替代了原來的硫酯鍵。研究表明諾卡噻唑菌素可以很好地抑制革蘭氏陽性菌的生長,特別是對多種耐藥性的條件致病菌具有極強的殺傷作用。其中NocathiacinI對MRSA的MIC值為0.003ng/mL,對有青霉素抗性的肺炎鏈球菌(penicillin-resistantS/re/^ococow;wet/wo"/fle,PRSP)的MIC值達到0.001ng/mL,比萬古霉素高出10-20倍。同時,它還對近期出現的有萬古霉素(Vancomycin)抗性的糞腸球菌(vancomycin-resistant五"ferococcf々ecc/w附,VREF)具有良好的抗'性,MIC值為0.015pg/mL。而且與萬古霉素相比,諾卡噻唑菌素對感染MRSA的小鼠具有更加顯著的療效,Nocathiacinl、II、IH的PD5o值分別為0.8、0.62、0.89mg/kg,萬古霉素在同樣條件下僅為1.3mg/kg。Nocathiacinl和n作為硫肽家族抗菌活性最好的兩個化合物,在較低pH下還比其他成員具有更好的水溶性,可能是因為分子中含有一個二甲基氨基己糖的緣故[Afec.171-175]。近期發現這類抗生素的作用機制與硫鏈絲菌肽類似,也是與50S亞基的23SrRNA-Lll蛋白復合物結合,通過阻止或促進L11構象的變化,影響aa-tRNA-Ef-Tu-GTP復合物的識別及延伸因子的GTPase活性,從而抑制細菌體內蛋白質的合成來發揮活性作用的[JJ附.C/ze附.Soc.2OO8,"0,121O2-12110]。目前其具體的構效關系還不是很清楚,但據推測它們相似的環肽中心可能是其具有優越活性的關鍵結構。諾卡噻唑菌素作為新一代抗感染藥物的先導化合物,自發現之日起就引起了科學家們的濃厚興趣。考慮到它們的溶解度尚未達到靜脈注射藥劑的要求,不少化學家對其進行了化學半合成改造。Bristol-MyersSquibb藥物研究所通過在Nocathiacinl上添加了一些極性水溶性基團,來提高它們的生物利用度如在吡啶環的羥基上或在吲哚酸側鏈的氮上烷氧化[Bioorganic&MedicinalChemistryLetters.2004,14,3743-3746];通過Michael加成在2,3-脫氫丙氨酰胺邊鏈上添加氨或硫醇[re/raZ/Wra"2004,5,1059-1063];或者用化學法或酶法去掉2,3-脫氫丙氨酰胺,得到NocathiacinIV,再進一步垸氧化或添加烴基胺[JOg.C/ie/n.2002,67,8789]。但這些方法往往很難在提高水溶性的同時保持原始結構良好的抗菌活性。而這類抗生素的化學結構極其復雜,二十多年來人們只完成了部分模塊和酸性水解產物的合成[re/ra/iec/raw2:e".1984,25,2127;/Org.C/ze附.1996,6丄4623;J.Og.丄饑2003,5,4421;r自/^腦1991,32,4263;2005,117,3802-3806;Comm朋.2008,591—593]。直到近幾年有機合成大師Moody和Nicolaou等人才完成了啟動噻星A、淀硫霉素D、硫鏈絲菌肽、鹽屋霉素A、GE2270A/T的全合成,諾卡噻唑菌素的全合成還沒有人報道[J"gew.Oie/n./W.£ca007,46,7930-7954]。并且由于該類抗生素復雜的多環結構,眾多的手性中心,使得單純利用全合成的方法進行改造步驟繁多,實際生產成本過高。而近年來隨著基因組學和蛋白質組學的深入研究以及新型生物技術的快速發展,使我們利用微生物作為"細胞工廠",通過遺傳控制來大量合成具有良好生物活性和新型作用機制的天然產物及其類似物成為可能。這也為我們在微生物體內獲得所需要的新型硫肽類抗生素提供了一條新的思路。因此我們以微生物來源的諾卡噻唑菌素為目標分子,從克隆諾卡噻唑菌素的生物合成基因簇出發,采用微生物學、分子生物學、生物化學以及有機化學相結合的方法來研究其生物合成,闡明其生物合成途徑及調節機制,在此基礎上運用代謝工程的原理,合理修飾諾卡噻唑菌素的生物合成途徑,探索生物利用度更好、并能通過微生物發酵大量生產的新型藥物。
發明內容本發明涉及一類由諾卡氏菌產生的具有良好抗菌活性的抗生素一諾卡噻唑菌素(Nocathiacins)的生物合成基因簇的克隆、測序、分析、功能研究及其應用。本發明中整個基因簇共包含37個基因的核苷酸序列或互補序列(序列1),其中有8個基因woc28,膨20,騰21,膨22,膨23,膨9,woc24和woc30負責NocathiacinI大環骨架的生物合成;4個基因noc25,《oc26,noc27和"oc29負責吲哚酸側鏈的生物合成;6個基因"oc6,woc10,wocll,"ocl2,wocl3和"ocl4負責4-N,N-二甲基-2,4,6-脫氧己糖的生物合成;5個細胞色素P450氧化還原酶基因woc7,wocl5,wcl6,膨18,wocl9,負責NocathiacinI的氧化還原后修飾;2個甲基轉移酶基因wocS,woc36,分別負責NocathiacinI的甲基化后修飾和自身的抗性;2個抗性基因"oc/7,"oc37;3個調節基因"oc5,woc33,朋c34;4個與轉錄翻譯有關的基因wocl,woc2,朋d,wo";以及3個未知功能的基因woc31,woc32,woc35。本發明還提供了一個編碼諾卡噻唑菌素前體肽的核苷酸序列,由序列2中的氨基酸序列組成,命名為"oc28,其基因的核苷酸序列位于序列1中第38432-38581堿基處。本發明還提供了一個編碼諾卡噻唑菌素噻唑環形成的環化酶的核苷酸序列,由序列3中的氨基酸序列組成,命名為《oc23,其基因的核苷酸序列位于序列1中第30980-32875堿基處。本發明還提供了一個編碼諾卡噻唑菌素噻唑環形成的NADH脫氫酶的核苷酸序列,由序列4中的氨基酸序列組成,命名為朋c22,其基因的核苷酸序列位于序列1中第29544-30767堿基處。本發明還提供了一個編碼諾卡噻唑菌素大環骨架形成的脫水酶的核苷酸序列,由序列5中的氨基酸序列組成,命名為朋c21,其基因的核苷酸序列位于序列1中第26965-29523堿基處。本發明還提供了一個編碼諾卡噻唑菌素大環骨架形成的脫水酶的核苷酸序列,由序列6中的氨基酸序列組成,命名為朋c20,其基因的核苷酸序列位于序列1中第25968-26960堿基處。本發明還提供了一個編碼自由基SAM硫胺合成酶的核苷酸序列,由序列7中的氨基酸序列組成,命名為woc27,其基因的核苷酸序列位于序列1中第36848-37948堿基處。本發明還提供了一個編碼酰基-CoA合成酶的核苷酸序列,由序列8中的氨基酸序列組成,命名為"oc25,其基因的核苷酸序列位于序列1中第34680-35912堿基處。本發明還提供了一個編碼酰基轉移酶的核苷酸序列,由序列9中的氨基酸序列組成,命名為朋c26,其基因的核苷酸序列位于序列1中第35933-36820堿基處。本發明還提供了一個編碼SAM依賴的氧化酶或甲基轉移酶的核苷酸序列,由序列10中的氨基酸序列組成,命名為"oc29,其基因的核苷酸序列位于序列1中第38714-39976堿基處。本發明還提供了一個編碼N-雙甲基轉移酶的核苷酸序列,由序列11中的氨基酸序列組成,命名為"oc10,其基因的核苷酸序列位于序列1中第149卯-15703堿基處。本發明還提供了一個編碼NDP-己糖3位C上的甲基轉移酶的核苷酸序列,由序列12中的氨基酸序列組成,命名為"ocll,其基因的核苷酸序列位于序列1中第15728-16972堿基處。本發明還提供了一個編碼NDP-己糖-3-酮還原酶的核苷酸序列,由序列13中的氨基酸序列組成,命名為wocl2,其基因的核苷酸序列位于序列1中第16984-17970堿基處。本發明還提供了一個編碼dTDP-4-酮-6-脫氧葡萄糖2,3-脫水酶的核苷酸序列,由序列14中的氨基酸序列組成,命名為wocl3,其基因的核苷酸序列位于序列1中第17988-19418堿基處。本發明還提供了一個編碼NDP-6-脫氧-D-葡萄糖4位C上的氨基轉移酶的核苷酸序列,由序列15中的氨基酸序列組成,命名為朋cl4,其基因的核苷酸序列位于序列1中第19424-20560堿基處。本發明還提供了一個編碼糖基轉移酶的氨基轉移酶的核苷酸序列,由序列16中的氨基酸序列組成,命名為woc6,其基因的核苷酸序列位于序列1中第11505-12683堿基處。本發明還提供了一個編碼細胞色素P450氧化還原酶的核苷酸序列,由序列17中的氨基酸序列組成,命名為"oc7,其基因的核苷酸序列位于序列1中第12704-13912堿基處。本發明還提供了一個編碼細胞色素P450氧化還原酶的核苷酸序列,由序列18中的氨基酸序列組成,命名為"ocl5,其基因的核苷酸序列位于序列1中第20591-21703堿基處。本發明還提供了一個編碼細胞色素P450氧化還原酶的核苷酸序列,由序列19中的氨基酸序列組成,命名為"ocl6,其基因的核苷酸序列位于序列1中第21696-22934堿基處。本發明還提供了一個編碼細胞色素P450氧化還原酶的核苷酸序列,由序列20中的氨基酸序列組成,命名為wocl8,其基因的核苷酸序列位于序列1中第23507-24649堿基處。本發明還提供了一個編碼細胞色素P450氧化還原酶的核苷酸序列,由序列21中的氨基酸序列組成,命名為"ocl9,其基因的核苷酸序列位于序列1中第24646-25947堿基處。本發明還提供了一個編碼甲基轉移酶的核苷酸序列,由序列22中的氨基酸序列組成,命名為"oc8,其基因的核苷酸序列位于序列1中第13909-14532堿基處。本發明還提供了一個編碼甲基轉移酶的核苷酸序列,由序列23中的氨基酸序列組成,命名為"oc36,其基因的核苷酸序列位于序列1中第43983-44768堿基處。本發明還提供了一個編碼博來霉素抗性蛋白的核苷酸序列,由序列24中的氨基酸序列組成,命名為"ocl7,其基因的核苷酸序列位于序列1中第22956-23480堿基處。本發明還提供了一個編碼磷酸鹽ABCtransporter的核苷酸序列,由序列25中的氨基酸序列組成,命名為"oc37,其基因的核苷酸序列位于序列1中第44914-45423堿基處。本發明還提供了一個編碼SARP家族的轉錄調節蛋白的核苷酸序列,由序列26中的氨基酸序列組成,命名為"oc5,其基因的核苷酸序列位于序列1中第10404-11387堿基處。本發明還提供了一個編碼熱休克蛋白的核苷酸序列,由序列27中的氨基酸序列組成,命名為"oc33,其基因的核苷酸序列位于序列1中第42031-42456堿基處。本發明還提供了一個編碼hspl8轉錄調節因子的核苷酸序列,由序列28中的氨基酸序列組成,命名為"oc34,其基因的核苷酸序列位于序列1中第42565-43173堿基處。本發明還提供了一個編碼RNA聚合酶ECF-亞族的信號因子的核苷酸序列,由序列29中的氨基酸序列組成,命名為"oc3,其基因的核苷酸序列位于序列1中第8731-9867堿基處。本發明還提供了一個編碼ATP酶的信號因子的核苷酸序列,由序列30中的氨基酸序列組成,命名為"oc4,其基因的核苷酸序列位于序列1中第9968-10387堿基處。本發明還提供了一個編碼DGPFAETKE家族蛋白的核苷酸序列,由序列31中的氨基酸序列組成,命名為"oc2,其基因的核苷酸序列位于序列1中第8282-8725堿基處。本發明還提供了一個編碼50S核糖體蛋白L18的核苷酸序列,由序列32中的氨基酸序列組成,命名為"ocl,其基因的核苷酸序列位于序列1中第7731-8084堿基處。本發明還提供了一個編碼未知功能蛋白的核苷酸序列,由序列33中的氨基酸序列組成,命名為woc9,其基因的核苷酸序列位于序列1中第14529-14984堿基處。本發明還提供了一個編碼未知功能蛋白的核苷酸序列,由序列34中的氨基酸序列組成,命名為"oc24,其基因的核苷酸序列位于序列1中第32902-34683堿基處。本發明還提供了一個編碼未知功能蛋白的核苷酸序列,由序列35中的氨基酸序列組成,命名為"oc30,其基因的核苷酸序列位于序列1中第40174-40914堿基處。本發明還提供了一個編碼未知功能蛋白的核苷酸序列,由序列36中的氨基酸序列組成,命名為"oc31,其基因的核苷酸序列位于序列1中第41001-41408堿基處。本發明還提供了一個編碼未知功能蛋白的核苷酸序列,由序列37中的氨基酸序列組成,命名為"oc32,其基因的核苷酸序列位于序列1中第41492-41953堿基處。本發明還提供了一個編碼未知功能蛋白的核苷酸序列,由序列38中的氨基酸序列組成,命名為"oc35,其基因的核苷酸序列位于序列1中第43228-43758堿基處。序列1的互補序列可根據DNA堿基互補原則得到。序列l的核苷酸序列或部分核苷酸序列可以通過聚合酶鏈式反應(PCR)或用合適的限制性內切酶消化相應的DNA片段或利用其他合適的技術得到。本發明還提供了獲得至少包含部分序列1中DNA片段的重組質粒的途徑。本發明還提供了諾卡噻唑菌素生物合成的微生物體途徑,至少其中之一的基因包含有序列1中的核苷酸序列。本發明所提供的核苷酸序列或部分核苷酸序列,可利用聚合酶鏈式反應(PCR)的方法或包含本發明序列的DNA作為探針以Southern雜交等方法從其他生物體中得到與諾卡噻唑菌素生物合成基因相似的基因。包含本發明所提供的核苷酸序列或至少部分核苷酸序列的克隆DNA可用于從諾卡氏菌iVoc^W/flsp.WW-12651基因組文庫中定位更多的文庫質粒。這些文庫質粒至少包含本發明中的部分序列,也包含有iVocflW/flsp.WW-12651基因組中以前鄰近區域未克隆的DNA。本發明所提供的核苷酸序列或至少部分核苷酸序列可以被修飾或突變。這些途徑包括插入、置換或缺失,聚合酶鏈式反應,錯誤介導聚合酶鏈式反應,位點特異性突變,不同序列的重新連接,序列的不同部分或與其他來源的同源序列進行定向進化(DNAshuffling),或通過紫外線或化學試劑誘變等。包含本發明所提供的核苷酸序列或至少部分核苷酸序列的克隆基因可以通過合適的表達體系在外源宿主中表達以得到相應的酶或其他更高的生物活性或產量的代謝產物。這些外源宿主包括鏈霉菌、假單孢菌、大腸桿菌、芽孢桿菌、酵母、植物和動物等。本發明所提供的氨基酸序列可以用來分離所需要的蛋白并可用于抗體的制備。包含本發明所提供的氨基酸序列或至少部分序列的多肽可能在去除或替代某些氨基酸之后仍有生物活性甚至有新的生物學活性,或者提高了產量或優化了蛋白動力學特征或其他致力于得到的性質。包含本發明所提供的核苷酸序列或至少部分核苷酸序列的基因或基因簇可以在異源宿主中表達并通過DNA芯片技術了解它們在宿主代謝鏈中的功能。包含本發明所提供的核苷酸序列或至少部分核苷酸序列的基因或基因簇可以通過遺傳重組來構建重組質粒以獲得其生物合成途徑,也可以通過插入、置換、缺失或失活進而獲得新的生物合成途徑。包含本發明所提供的核苷酸序列或至少部分核苷酸序列的克隆基因或DNA片段可以通過中斷諾卡噻唑菌素生物合成的一個或幾個步驟而得到新的諾卡噻唑菌素結構類似物。包含DNA片段或基因可以用來提高諾卡噻唑菌素或其衍生物的產量,本發明提供了在基因工程微生物中提高產量的途徑。本發明所提供的核苷酸序列編碼核糖體機制諾卡噻唑菌素生物合成的前體肽可以通過插入、置換或缺失,聚合酶鏈式反應,錯誤介導聚合酶鏈式反應,位點特異性突變,不同序列的重新連接,序列的不同部分或與其他來源的同源序列進行定向進化(DNAshuffling),紫外線或化學試劑誘變等方法來產生新的硫肽類抗生素或其他多肽類代謝產物。包含本發明所提供的核苷酸序列編碼的蛋白可以催化合成噻唑環、羥化吡啶環、吲哚酸等結構單元,并可以通過與其他天然產物的生物合成途徑或部分生物合成途徑重組,來獲得包含有著這些結構單元并且具有更好生物活性的代謝產物。包含本發明所提供的核苷酸序列編碼的蛋白可以催化合成諾卡噻唑菌素的大環骨架和其結構類似物。包含本發明所提供的核苷酸序列編碼的蛋白可以催化合成4-N,N-二甲基-2,4,6-脫氧己糖,并可以通過與其他天然產物的生物合成途徑或部分生物合成途徑重組,來獲得新的糖基化產物。本發明所提供的諾卡噻唑菌素的后修飾基因提供了通過遺傳修飾得到類似物的途徑,所包含的氧化還原反應也可有其他應用。總之,本發明所提供的包含諾卡噻唑菌素生物合成相關的所有基因和蛋白信息可以幫助人們理解硫肽類抗生素的生物合成機制,為進一步遺傳改造提供了材料和知識。本發明所提供的基因及其蛋白質也可以用來尋找和發現可用于醫藥、工業或農業的化合物或基因、蛋白。圖l:諾卡噻唑菌素的化學結構。圖2:諾卡噻唑菌素生物合成基因簇的基因結構和限制性內切酶譜。(A)6個交疊的黏粒代表了諾卡氏菌iVoca^/flsp.WW-12651基因組45kb的DNA區域,S代表限制性內切酶SmaI,實體表示已被DNA測序的部分,黑色粗豎線表示標記的探針部分;(B)諾卡噻唑菌素生物合成基因簇的基因組成。圖3:提出的諾卡噻唑菌素大環骨架的生物合成途徑。圖4:提出的諾卡噻唑菌素吲哚酸側鏈的生物合成途徑。圖5:提出的諾卡噻唑菌素4-N,N-二甲基-2,4,6-脫氧己糖的生物合成途徑。圖6:iVocaWflsp.WW-12651野生型發酵產物NocathiacinI的高效液相色譜-質譜(HPLC-MS)分析。(A)高效液相色譜;(B)質譜圖7:與諾卡噻唑菌素大環骨架生物合成相關的部分基因對諾肽菌素基因簇中相似基因同框缺失突變株的異源互補。(A)諾肽菌素產生菌S/re/tow,ycesac加o犯sATCC25421野生型發酵產物的HPLC-MS檢測(B)諾肽菌素nosE同框缺失突變株發酵產物的HPLC-MS檢測(C)諾卡噻唑菌素"oc21異源回補突變株發酵產物的HPLC-MS檢測(D)諾肽菌素mwD同框缺失突變株發酵產物的HPLC-MS檢測(E)諾卡噻唑菌素"oc20異源回補突變株發酵產物的HPLC-MS檢測圖8:與諾卡噻唑菌素吲哚酸側鏈生物合成相關的部分基因對諾肽菌素基因簇中相似基因同框缺失突變株的異源互補。(A)諾肽菌素產生菌S/re/7to/w;;cMac加(wtwATCC25421野生型發酵產物的HPLC-MS檢測(B)諾肽菌素"osI同框缺失突變株發酵產物的HPLC-MS檢測(C)諾卡噻唑菌素"oc25異源回補突變株發酵產物的HPLC-MS檢測(D)諾肽菌素"cwL同框缺失突變株發酵產物的HPLC-MS檢測(E)諾卡噻唑菌素朋c27異源回補突變株發酵產物的HPLC-MS檢測圖9:諾卡噻唑菌素生物合成基因簇中部分P450氧化還原后修飾基因對諾肽菌素基因簇中相似基因同框缺失突變株的異源互補。(A)諾肽菌素產生菌S/re;/o/w;;cMa"twiATCC25421野生型發酵產物的HPLC-MS檢測(B)諾肽菌素"o;yC同框缺失突變株發酵產物的HPLC-MS檢測(C)諾卡噻唑菌素"ocl9異源回補突變株發酵產物的HPLC-MS檢測(D)諾肽菌素"osB同框缺失突變株發酵產物的HPLC-MS檢測(E)諾卡噻唑菌素"oc7異源回補突變株發酵產物的HPLC-MS檢測圖10:諾卡噻唑菌素生物合成基因簇中部分P450氧化還原后修飾基因在諾肽菌素產生菌S/re/^o/wycesatc加cwmsATCC25421中的異源表達。(A)諾肽菌素產生菌5^印towycesac加omyATCC25421野生型發酵產物的HPLC-MS檢測(B)諾卡噻唑菌素"ocl6異源表達突變株發酵產物的HPLC-MS檢測(C)諾卡噻唑菌素"ocl8異源表達突變株發酵產物的HPLC-MS檢測諾肽菌素結構類似物A的化學結構諾肽菌素結構類似物B的化學結構。符號說明圖lNocathiacinI:諾卡噻唑菌素I;NocathiacinII:諾卡噻唑菌素II;NocathiacinIII:諾卡噻唑菌素III;MJ347-81F4-B:諾卡噻唑菌素I的去甲基化產物。圖2(A)B3:黏粒pDY2-61-B3,D2:黏粒卩0丫2-61-D2,C2:黏粒pDY2-61-C2,A1:黏粒pDY2-61-A!,C4:黏粒0丫2-61-C4;字母S代表S/mrf限制性酶切位點;(B)suger4-N,N-二甲基-2,4,6-脫氧己糖生物合成基因cyclopeptide諾卡噻唑菌素大環骨架生物合成基因oxidation諾卡噻唑菌素P450氧化還原后修飾基因Indoleacid諾卡噻唑菌素吲哚酸側鏈生物合成基因resistance抗性基因regulation調節基因Unknown未知基因。圖3Noc20、21、22、23分別對應本說明書中描述的諾卡噻唑菌素基因簇中的基因noc20、21、22、23所編碼的蛋白,LP表示諾卡噻唑菌素的信號肽。圖4Noc25、26、27、29分別對應本說明書中描述的諾卡噻唑菌素基因簇中的基因noc25、26、27、29所編碼的蛋白,Ado.表示自由基。圖5Noc6、10、12、13、14分別對應本說明書中描述的諾卡噻唑菌素基因簇中的基因noc6、10、12、13、14所編碼的蛋白。圖6(A)15min為Nocathiacinl的保留時間(B)1437為NocathiacinI的分子離子峰。具體實施例方式以下結合圖1-圖6對本發明進一步詳細說明。1.諾卡噻唑菌素生物合成基因簇中N,N-二甲基酶基因片段的克隆盡管有關硫肽類抗生素生物合成方面的研究早在上世紀70年代末就已開始,但是迄今為止關于它們在微生物體內代謝途徑的研究都未能有效突破。早期的研究者主要完成了硫鏈絲菌肽(Thiostrepton)、諾肽菌素(Nosiheptide)、硫肽霉素I(sulfomycinl)、GE2270A、A10255G/B/E、諾卡噻唑菌素(Nocathiacins)等的氨基酸前體標記實驗(C13、C14、H2、H3、N"等),并由此推測了它們部分主要結構可能的生物合成途徑如認為其中的噻唑或噻唑啉環來源于半胱氨酸和絲氨酸;而吲哚酸或喹哪酸結構則是由色氨酸經過多步轉化得到的;還認為它們核心結構的氮雜六元環是通過[4+2]環加成反應形成的[j:CAew.1979,/W,5069;1988,110,5800;1993,〃5,7557;1993,7",7992;1995,〃7,7606;1996,77S,11363;歷org.MedCTjew.1996,《1135;JJ"riWof.1992,45,1499;2001,5《1066;JC/^/w.Soc.C/ie附.awwm".1993,1612;CAe/M.1993,26,116;rerm/zefifrw72008,49,6265~6268.]。標記實驗同樣也顯示這類抗生素大多具有相似的氨基酸前體,這在一定意義上說明它們在微生物體內可能是采用相似的生物合成途徑得到的。而微生物體內典型的聚肽類天然產物的生物合成途徑大體上可以分為兩類核糖體途徑和非核糖體途徑。Floss小組曾根據氯霉素抑制實驗的結果推測這類抗生素可能是采用非核糖體途徑合成的。隨后研究者們嘗試了大量的方法來克隆這類抗生素的生物合成基因簇,如突變株互補、反向遺傳學、抗性基因為探針、編碼核糖體途徑前體肽的基因片段為探針、非核糖體途徑生物合成基因的保守序列為引物、轉座子隨機中斷等方法,但是都沒有成功。這就提示我們需要尋找一條全新的途徑來克隆這類抗生素的生物合成基因簇。根據糖肽類抗生素的糖基和母體骨架的生物合成基因大都連鎖分布在染色體的同一區域上這一特點,本發明人決定從克隆NocathiacinI中脫氧氨基糖的生物合成基因出發,來克隆整個分子的生物合成基因簇。我們首先根據大量微生物來源的天然產物脫氧糖基的生物合成途徑[J"rtw/croWa/^gew"Jm/C7ie附o^iera;^,1999,U,1565—1573;C/zew&^j&5zo/ogy,2004,77,959—969;Mo/ecw/arMz'cro6/o/ogy,2000,37,752-762.]推測了NocathiacinI中4-N,N-二甲基-2,4,6-脫氧己糖可能的生物合成途徑,并選取可能存在于該途徑催化后期的N,N-二甲基轉移酶的保守序列,設計了簡并性的PCR引物Dimeth-Forl:5'-GCTGACGTCGCCTGCGGSAC(CG)GG(ATCG)(GAT)(ATCG)(ATCG)CA-3和Dimeth陽Rev2:5'-CGCGAACGT(GC)TC(GC)GG(AG)AACCACCA(ATGC)GG(ATGC)TC-3,,然后以iVocanft'asp.WW-12651的總DNA為模板進行PCR擴增,得到約0.3kb的PCR產物,克隆入pSP72載體,經測序分析發現與已知的N,N-二甲基轉移酶基因具有很高的同源性。2.諾卡噻唑菌素生物合成基因簇的克隆,序列分析及功能分析將上述克隆到的N,N-二甲基酶基因片段用地高辛標記為探針,對構建好的iVocflW/asp.WW-12651的基因組文庫進行篩選,共得到6個插入片段互相重疊的黏粒,分別為cDY446-2-47-A"B3、C2、C4、D2、D4,涵蓋了染色體約50kb的DNA區域(圖2-A)。選取限制性酶切物理圖譜中最左端和最右端的黏粒CDY446-2-47-B3、C2進行亞克隆測序,通過生物信息分析發現,測定的45.560kb的DNA區域,GC含量為73.3%,共包含了44個開放式讀碼框(openreadingframe,ORF),其中與諾卡噻唑菌素生物合成相關的有37個。各個基因的功能分析見表l。表1諾卡噻唑菌素生物合成基因簇中各基因及編碼蛋白的功能分析<table>tableseeoriginaldocumentpage19</column></row><table><table>tableseeoriginaldocumentpage20</column></row><table>3.諾卡噻唑菌素生物合成基因簇邊界確定根據基因編碼蛋白的功能分析,我們初步判定諾卡噻唑菌素的生物合成基因簇為從基因"oc7到woc37,共37個開放式讀碼框。其中1個基因("oc2S)負責編碼諾卡噻唑菌素的前體肽,7個基因("oc28,"oc20,woe21,"oc22,woe23,"oc9,"oc24和woc30)負責對"oc2S編碼的前體肽進行修飾,形成整個大環骨架;4個基因("oc25,"oc26,膨27和膨29)負責以色氨酸為前體,合成吲哚酸側鏈;6個基因("oc6,woclO,"ocll,wocl2,"ocl3和"ocl4)負責4-N,N畫二甲基-2,4,6-脫氧己糖的生物合成;5個細胞色素P450氧化還原酶基因(《oc7,wocl5,wocl6,wocl8,wocl9)負責NocathiacinI的氧化還原后修飾;2個甲基轉移酶基因("ocS,"od6)分別負責NocathiacinI的甲基化后修飾和自身的抗性;此外還有2個抗性基因(woc/7,"oc37);3個調節基因("oc5,ttoc^,"oc34);4個與轉錄翻譯有關的基因(nocl,"oc2,wc3,wo^);以及3個未知功能的基因(woc31,《oc32,"oc35)。因為o//60-o//為與甲氧基丙二酸生物合成相關的基因,而基因《ocl-"oc3則分別編碼50S核糖體L18蛋白、DGPFAETKE家族蛋白及ECF亞家族RNA聚合酶信號因子,這些基因可能與諾卡噻唑菌素前體肽的轉錄法翻譯有關。所以諾卡噻唑菌素生物合成基因簇的右側邊界應該在"9之間。該序列右側的基因朋c31-37為一些調節基因及抗性基因,我們還不能確定它們與諾卡噻唑菌素生物合成的相關性,所以諾卡噻唑菌素生物合成基因簇的左側邊界還不是很清楚,有待進一步的探究。4.諾卡噻唑菌素大環骨架的生物合成諾卡噻唑菌素的生物合成基因簇中共有8個基因與其大環骨架的生物合成相關。其中mc2S,編碼諾卡噻唑菌素的前體肽,其C端結構肽序列SCTTCECSCSCSS與諾卡噻哇菌素大環骨架的氨基酸前體順序完全吻合,而N端富含疏水氨基酸的信號肽部分,則主要負責前體肽的識別,并介導其在胞內轉運的。這也從基因水平上證實了諾卡噻唑菌素的大環骨架應該是按照核糖體機制來合成的。該過程類似于細胞肽和蛋白質的合成,首先在核糖體中經轉錄翻譯逐步形成諾卡噻唑菌素的聚肽鏈前體。接著該前體從核糖體上水解釋放,再由"oc2編碼的環化脫水酶催化其中半胱氨酸上的巰基進攻臨位絲氨酸上的羰基,形成5元N雜環,接著脫去一分子水,形成噻唑啉。然后由"oc22編碼的NADH依賴的氧化還原酶作用脫去一分子氫,將噻唑啉轉變為噻唑。接下來在"oc20或"oc"編碼的脫水酶的催化下,脫去絲氨酸殘基上的羥基,形成2,3-脫氫丙氨酸,進一步通過分子內Diels-Alder反應形成羥化脫氫哌啶六元環。然后再在"oc30編碼的未知蛋白及一系列脫水酶和氧化還原酶的作用下經多步反應形成羥化吡啶環肽中心,從而構建了諾卡噻唑菌素中最大的一個環肽結構。整個過程如圖3所示。5.甲基吲哚酸結構單元的生物合成甲基吲哚酸結構單元的生物合成途徑如圖4所示。首先以色氨酸為前體,經woc27編碼的radicalS-adenosylmethionine(AdoMet)類型的蛋白的催化發生一系列分子內重排,再水解脫羧形成3-甲基d引哚-2-甲酸結構。接著通過"o"5編碼的酰基-CoA合成酶活化剛哚酸的羧基,將其轉變成CoA-硫酯鍵。然后在"oc26編碼的酰基轉移酶的作用下,形成吲哚酸側鏈與諾卡噻唑菌素大環骨架間的硫酯鍵連接。進一步由"oc29編碼的甲基轉移酶轉移甲硫氨酸上的甲基到吲哚酸4位的碳上,再由基因簇中的氧化還原酶作用在4位碳上上一個羥基,最后在一系列相關酶的作用下實現吲哚酸側鏈與大環骨架間的酯鍵連接。其中吲哚酸4位的甲基化可能發生在側鏈與大環骨架硫酯鍵連接前或者是連接后。6.4-N,N-二甲基-2,4,6-脫氧己糖單元的生物合成諾卡噻唑菌素的生物合成基因簇中共有6個基因與其糖基的生物合成相關。首先一分子磷酸化的D-葡萄糖在dNDP-D-葡萄糖合成酶的作用下被活化,接著由dNDP-D-葡萄糖-4,6-脫水酶催化脫水在4位形成酮基,再由"ocl3編碼的2,3-脫水酶作用脫去另一分子水形成3,4-酮-6-脫氧己糖中間體,然后在wocl2編碼的3-酮-還原酶的催化下3位被還原成羥基,經3,5異構酶的作用發生差向異構化后,又在"ocll編碼的甲基轉移酶的作用下在3位上一個甲基,再由wocl4編碼的氨基轉移酶催化在4位上一個氨基,然后在wclO編碼的N,N-二甲基轉移酶的作用下在氨基上加兩個甲基,最后由woc6編碼的糖基轉移酶轉移該糖基到諾卡噻唑菌素的大環骨架上,整個過程如圖5所示。7.諾卡噻唑菌素的后修飾過程諾卡噻唑菌素的生物合成基因簇中共有5個細胞色素P450氧化還原酶基因woc7,wocl5,wocl6,wocl8,wocl9,可能與諾卡噻唑菌素生物合成途徑中的一系列氧化還原后修飾相關。其中"oc7和"ocl9分別催化諾卡噻唑菌素吡啶環上的羥化和谷氨酸Y位的羥化,"ocl6和"ocl8分別催化吲哚酸N上的羥化和3位甲基上的羥化。在該基因簇中還存在一個未知蛋白"oc9,可能是負責絲氨酸邊鏈的剪切形成酰胺結構的。8.諾卡噻唑菌素生物合成基因簇的應用在克隆、分析諾卡噻唑菌素生物合成基因簇的基礎上,我們還發展了一套快速克隆其他硫肽類抗生素生物合成基因簇的通用方法。如利用其中與噻唑環形成相關的環化脫水酶Noc23的氨基酸保守序列,設計PCR引物克隆了硫鏈絲菌肽、諾肽菌素、鹽屋霉素等的生物合成基因簇,同時還利用與諾卡噻唑菌素大環骨架生物合成相關的基因序列通過基因組掃描的方法克隆了硫代菌素的生物合成基因簇。在此基礎上,我們進一步分析比較了這些基因簇和生物合成途徑的相似性。如諾卡噻唑菌素與諾肽菌素的生物合成基因簇中一共有15個功能相似的基因(表2),其中包含了8個與大環骨架生物合成相關的基因,4個與吲哚酸側鏈合成相關的基因,2個P450氧化還原酶基因以及1個調節基因,并且這些基因的排列順序和轉錄方向也基本相似。我們首先通過在諾肽菌素產生菌的體系中對部分功能相似基因的同框缺失初步證實了這些基因與諾肽菌素生物合成的相關性,在此基礎上我們又將諾卡噻唑菌素基因簇中的相似基因導入到這些同框缺失突變株中進行異源互補,經發酵和LC-MS檢測,恢復產生了諾肽菌素,進一步證實了這些相似基因與大環骨架及吲哚酸側鏈合成的相關性。同時我們還通過2個P450氧化還原酶基因"ocl6和"ocl8在諾肽菌素產生菌體系中的異源表達,初步證實了它們可能的功能。表2諾卡噻哇菌素與諾肽菌素生物合成基因簇中功能相似基因的同源性比較<table>tableseeoriginaldocumentpage23</column></row><table><table>tableseeoriginaldocumentpage24</column></row><table>以下進一步提供實施實例,這些實施實例有助于理解本發明,僅用作說明而不限制本發明的應用范圍。實施例l諾卡噻唑菌素產生菌諾卡氏菌iVocflrc^sp.WW-12651總DNA的提取將100[iLMcfl/^fl^7.WW-12651菌絲懸液接種到3mLTSB液體培養基中,30°C,250rpm,振蕩培養約36hr,達到對數生長期后期。取3mL接種到50mLTSB中(含5mMMgCl2,0.5。/。甘氨酸),30'C,250rpm,振蕩培養約25hr后達到穩定生長期前期,呈乳白色渾濁,并有大量菌絲懸浮物。將菌液于4t:,3500rpm,離心15min收集菌絲,用裂解緩沖液洗滌兩次,得到菌絲約2.5mL。向2.5mL菌絲中加入10mL裂解緩沖液(含溶菌酶5mg/mL),渦旋至均一,再加入無色肽酶(Achromopeptidase)至3mg/ml,混勻。37。C水浴30min。加入O.lmL蛋白酶K(20mg/mL,用裂解緩沖液新鮮配制)、lmL10。/。的SDS,混勻后迅速放入70'C水浴,15min,至基本澄清,置冰上冷卻。加入2.5mL5M的KAc溶液,冰上冷卻15min。加入15mLTris飽和的酚,輕輕混勻,再加入15mL氯仿,輕輕混勻,20000rpm,4°C,離心20min。用破口的槍頭將水相吸出置于新的離心管中,加入等體積的氯仿異戊醇=24:l混合液抽提,輕輕混勻,12000rpm,4°C,離心10min。再用破口的槍頭將水相吸出置于新的離心管中,加入2倍體積的無水乙醇,混勻,有大團的DNA出現。將其鉤出,置于新的離心管中,加入5mL700/0的乙醇洗滌,將液體傾出,用槍吸干。再加入5mLTE溶解(添加無DNase活性的RNaseA至終濃度為50pg/mL),37'C水浴0.5hr。用等體積的飽和酚抽提兩次,再用等體積的氯仿異戊醇=24:l的混合液抽提兩次,向水相中加入O.l倍體積3M的NaAc溶液,2倍體積的無水乙醇,輕輕混勻,有絮狀DNA出現。用700/。乙醇洗漆DNA沉淀,吸出液體。再加lmL無水乙醇洗滌,吸出液體,超凈臺中吹干,溶于適當體積的TE(pH8.0)中。若難以溶解,可在55'C水浴2hr,最后保存于4'C。實施例2諾卡噻唑菌素產生菌諾卡氏菌sp.WW-12651基因組文庫的構建首先通過一系列的稀釋實驗來確定Sfl"3AI的用量,在此基礎上大量酶切得到的DNA片段略大于40kb,脫磷。載體pOJ446先用從兩個cos序列中間切開并脫磷,然后再從多克隆位點處用B"附HI切開,獲得兩條連接臂,與制備好的長約40kb的DNA片段連接過夜。從一80'C取出包裝試劑盒(PromegaPackageneExtract)放到冰上,待其恰好融化,立即加入5uL上述連接液,輕彈混勻,注意不要產生氣泡,室溫(約22'C)放置3hr。加入445uLPhage緩沖液,上下顛倒混勻。再加入25uL氯仿,上下顛倒混勻,使其緩慢劃過整個液體以終止反應,用離心機輕甩,使氯仿沉于底部,保存于4'C。將試劑盒所帶的Ea^LE392菌種在LB平板上劃線接種進行培養。挑單菌落到3mLLB中(添加30^LlM的MgSO4溶液和30nL20。/。的麥芽糖溶液),37°C,250rpm,振蕩培養過夜。再轉接500pL菌液到50mL的LB中(添加500pL的MgS04溶液和500^20%的麥芽糖溶液),37。C,250rpm,振蕩培養至OD6()()=0.6-0.8。取2.5pL包裝液,加入97.5pLphage緩沖液和100nL五.Co//LE392(OD600=0.67),輕輕混勻,22。C水浴0.5hr。再加入100^L的LB混勻,37°C,水浴75min,涂布到LB平板上(含Aml00pg/mL),37。C培養過夜,至有菌落長出。平板長有超過50000個克隆,用LB刮下,加入甘油(終濃度18%)和Apramycin(終濃度50ug/ml),按每管200uL分裝,于一80'C保存。隨機從平板中調取10個克隆,接種于LB培養基中培養,按大腸桿菌質粒的堿法小量制備抽提重組黏粒。/feelll酶切鑒定,并用0.7%的瓊脂糖凝膠電泳檢測。根據電泳圖譜加合各DNA片段的長度,估算每個黏粒插入片段的大小約為35-40kb,并以此計算文庫的效價約為30000cfii4igDNA。因為大多數放線菌染色體DNA的大小約為8Mb,對于插入片段為20kb的文庫而言,其效價為20005000cfWpgDNA就足以代表整個基因組。根據以上實驗,我們建立的文庫效價達到30000cfi4igDNA,插入片段約為40kb左右,這表明我們建立的文庫具有良好的質量,能夠滿足文庫篩選的需要。實施例3諾卡噻唑菌素產生菌諾卡氏菌A^cflW/flsp.WW-12651的發酵、產物分離純化與鑒定首先將300nL-80。C凍存的iVocaW!》WW-12651菌絲懸液,接種到25mL的種子培養基中(可溶性淀粉2%、葡萄糖0.5%、N-ZCase0.3%、酵母提取物0.2%、魚肉提取物0.5%、碳酸鈣0.3%),32'C,250rpm培養3天。從中取2mL轉接到50mL的發酵培養基中(葡萄糖2%、HY-酵母4121。/。、營養大豆1%),30°C,250rpm培養4-5天。然后將發酵液合并,轉移到離心管中,3800rpm,離心15min,棄去菌絲沉淀。上層清液用等體積的乙酸乙酯萃取兩次,合并有機相。用無水MgS04或無水Na2S04干燥,過濾,37'C減壓濃縮至干。將樣品溶于氯仿甲醇=9:1的混合溶劑中,初步用TLC板檢測發酵液的提取物中是否有Nocathiacins存在(在長波紫外線下NocathiacinI、II、III會發出黃綠色熒光,TLC展開劑氯仿甲醇甲酸=90:10:0.1),進一步可以用S.ceo//co/orM110進行生物活性檢測(Nocathiacins可以抑制S.ceo//co/wM110的生長,形成抑菌圈)。在此基礎上將2L發酵液的乙酸乙酯粗提物,溶于氯仿/甲醇的混合溶劑中,100-200目硅膠拌樣后,用300-400目的硅膠進行柱層析,洗脫條件己烷/氯仿=1:1,100ml;氯仿100ml;氯仿/甲醇=99:1,100ml;氯仿/甲醇=98:2,300ml;氯仿/甲醇=97:3,200ml;氯仿/甲醇=95:5,300ml;氯仿/甲醇=90:10,200ml。其中在氯仿/甲醇=95:5的組分中,檢測到了黃綠色熒光的點。收集該組分,30°C減壓濃縮至干,進行HPLC半制備柱分離純化。檢測波長UV=220nm;柱子AgilentZORAXSB-C185pm4.6x250mm,PN880975-902,SNUSCL024998:LNB07051;流動相條件v=lmL/min;A=H20(0.1%TFA);B=CH3CN;時間(min)03625273032B(%)0154070909015收集HPLC保留時間為15min的組分,進行HPLC-MS(ESI)鑒定,為NocathiacinI,對應的[M+H]+分子離子峰為m/z=1437.3。同時我們還用類似方法從iVocflW/flsp.WW-12651的發酵液中分離純化到了NocathiacinII、III、MJ347-81F4-B等組分,并進行了HPLC-MS(ESI)鑒定,對應的[M+H]+分子離子峰依次為m/z=1421.3、1266.2、1368.3。實施例4PCR克隆諾卡噻唑菌素的生物合成基因PCR體系包含DMSO(8%,v/v),MgCl2(1.5mM),dNTP(0.2mM),兼并性引物(0.2^M),TaqDNA聚合酶(2u)及適量模板iVocarc//asp.WW-12651總DNA。首先95。C,5min,1輪;然后94。C,lmin,63。C,lmin,72°C,lmin,10輪;94°C,lmin,55°C,lmin,72°C,lmin,20輪;最后72。C,10min,1輪。PCR結束后,1.5%瓊脂糖電泳檢査結果。低熔點膠回收預期大小的DNA片段,與載體pSP72的&oRV消化,CIAP脫磷的2.4kbDNA片段連接,轉化大腸桿菌DH5a感受態細胞,涂布在含有適當抗生素的LB平板上,37'C培養至轉化子長出。挑取單菌落到液體LB中培養過夜,抽提質粒,5g/II和五coRV雙酶切鑒定是否含有預期大小的DNA插入片段。并將插入有預期大小DNA片段的質粒進行測序。實施例5核酸分子雜交l)DIGDNA標記將待標記的DNA用無菌水稀釋至總體積15pL,沸水浴中加熱變性10分鐘,立即置于冰鹽浴中冷卻。接著加入HexanucleotideMix(lOx)2pL、dNTPLabelingMix2jiL、Klenowenzymelabelinggrade1蚪L,混合均勻后,37。C水浴約16小時。加入0.8nL0.8MEDTA(pH8.0)以終止反應,加入2.5^L4MLiCl,混合均勻,再加入75jiL預冷的無水乙醇沉淀標記后的DNA,置于一80'C沉降40分鐘。4°C,12000ipm離心20分鐘收集DNA,用預冷的70%乙醇洗滌DNA沉淀,真空干燥后重新溶于5(HiLTE((pH8.0)中。2)DIGDNA探針標記后的質量檢測:稀釋標記的DNA探針至以下六個梯度,1、10"、10-2、l(T3、IO"4、l(T5。稀釋標記的對照DNA分別至以下濃度lpg/mL,100ng/mL,10ng/mL,lng/mL,0.1ng/mL,0.01ng/mL。分別取lpL上述濃度的DNA樣品點在雜交用的尼龍膜上,根據7)所述步驟進行顯色反應,對比標記的DNA探針和DIG標記的對照DNA的顯色強度以決定標記的DNA探針濃度。3)菌落雜交(文庫篩選)的膜轉移從中取50pL,加450nLLB稀釋得到10"的稀釋倍數,再倍比稀釋得到l(T2、l(T3、IO"4、l(T5、IO"6。從中分別取300pL涂一塊規格為15cmxl5cm的LB平板(含阿泊拉霉素50ng/mL)。37'C培養過夜,至有菌落長出。選取合適的稀釋比例,使每塊平板約1200—1500個克隆。用LB照選定的比例稀釋文庫,均勻涂布四塊平板,37'C培養過夜。根據平板的大小剪取尼龍膜,小心地覆蓋于平板表面不要產生氣泡,做好位置標記,1分鐘后取下尼龍膜置于干燥濾紙上,干燥10分鐘直至菌落結合在尼龍膜上。原始的平板置于培養箱中4一5hr,使克隆重新生長作為原平板。將尼龍膜置于變性液(0.25MNaOH,1.5MNaCl)飽和的濾紙上15分鐘(不要浸過膜),轉移至中和液(1.0MTris.HCl,1.5MNaCl,pH7.5)飽和的濾紙上5分鐘。轉移至2xSSC(20xSSC儲備液(L"):NaCl,175.3g,檸檬酸鈉,88.2g,pH=7.0)飽和的濾紙上自然風干。取下尼龍膜置于烘箱中,120'C固定45分鐘。常溫下于3xSSC/0.1%SDS溶液中振蕩洗滌3小時,以除去細胞碎片。4)Southem雜交的膜轉移DNA樣品在適當濃度的瓊脂糖凝膠上電泳至適當距離,做好標記。浸泡于400mL0.25M的HC1中脫嘌呤20min,使溴酚藍變黃,用去離子水洗數次。室溫下浸入堿性緩沖液中(NaOH0.5M、NaCl1M)15min,并輕輕振蕩。更換堿性緩沖液后繼續浸泡凝膠20min,并輕輕振蕩,用去離子水洗三次。取一張每邊都比凝膠大lmm的尼龍膜,用去離子水完全浸濕,做好標記。采用向上毛細管轉移方法,用10xSSC的轉移緩沖液轉移8-24hr。用2xSSC略微洗膜,120'C烘烤30min。5)預雜交和雜交預熱雜交液(20mL/100cm2)至雜交溫度68'C,放入雜交尼龍膜,輕輕振蕩并保溫30分鐘。將DIG標記的DNA探針在沸水浴中變性5分鐘,立即置于冰鹽浴中冷卻。冷卻后,將DNA探針與合適體積的DIG雜交液(2.5mL/100cm"混合均勻。去除預雜交液并立即把DNA探針/DIG雜交液加入,輕輕振蕩保持雜交溫度64'C或68'C約16小時。6)雜交后嚴緊洗脫室溫下用2xSSC/0.1%SDS漂洗兩次,每次5分鐘。68'C,用0.1xSSC/0.1%SDS振蕩漂洗兩次,每次15分鐘。7)顯色反應和檢測嚴緊洗脫后的尼龍膜在洗滌緩沖液(0.1M馬來酸,0.15MNaCl,pH=7.5,0.3%(v/v)Tween20)中平衡1-5分鐘,接著在封閉緩沖液(封閉試劑以10%的濃度溶于0.1M馬來酸,0.15MNaCl,pH=7.5)中封閉30分鐘,然后在抗體中浸泡30分鐘。用洗滌緩沖液漂洗尼龍膜兩次后,用檢測緩沖液(0.1MTris-HCl,0.1MNaCl,pH=9.5)中平衡2-5分鐘,最后將尼龍膜置于10mL新配制的顯色溶液中[NBT(nitrobluetetrazoli鵬chloride)溶于70%DMF,濃度為70mg/mL,BCIP(5-bromo-4-chloro-3-indolyl-phosphate)溶于水,濃度為50mg/mL。用時lOmL顯色溶液中加45pLNBT,35nLBCIP],置于黑暗中顯色。顯色合適后用去離子水漂洗以終止反應。實施例6異源互補突變菌株的獲得及發酵產物分析首先在諾肽菌素產生菌S^ptom少c"ac加cm^ATCC25421的體系中構建目標基因同框缺失的突變株。所用載體為含溫敏型復制子的質粒pKC1139,將構建好的用于同框缺失的質粒,通過五.co/z'S17-l和5^epto7wycesfl"twiATCC25421屬間接合轉移的方法(見下)導入到諾肽菌素的產生菌中,3CTC培養4-5天,篩選具有Am抗性的接合子。然后將獲得的接合子接種到TSB液體培養基(阿泊拉霉素50pg/ml)中30。C振蕩培養2-3天。再涂布于含有阿泊拉霉素100pg/ml的MS平板上,在42'C整合使之發生單交換。將獲得的單交換突變株在30'C進行10—20輪的松弛培養(不加阿泊拉霉素),再通過抗性篩選得到對阿泊拉霉素敏感的突變株。抽提總DNA,進行PCR篩選,獲得發生雙交換的突變株。并對獲得的雙交換突變株進行PCR測序在基因型上加以驗證,確實發生了同框缺失,并且內部基因無突變。然后通過發酵和LC-MS檢測,在表型上加以驗證,不再產生諾肽菌素,就得到了目標基因同框缺失的突變株。在此基礎上,將諾卡噻唑菌素生物合成基因簇中功能相似的基因和來自于pLL6212的紅霉素啟動子ErmE+克隆到整合型載體pSET152的相應位點中,得到用于異源互補的質粒。將構建好的用于異源互補的質粒通過屬間接合轉移的方法導入到諾肽菌素相應基因同框缺失的突變株中,經阿泊拉霉素抗性篩選,得到異源互補突變株。所得的突變株在基因型上進行驗證后,進行發酵和LC-MS檢測,恢復產生了諾肽菌素,說明這些基因的功能是一致的。S17-l和諾肽菌素產生菌S/reptomycejac加o幼sATCC25421及同框缺失突變株屬間接合轉移的方法如下從含有適當質粒的大腸桿菌培養平板上挑取單菌落接種到試管中培養過夜,吸取200-300^1菌液轉接到20mlLB中,置于37'C搖床中培養至00600為0.3-0.4。將菌液離心沉淀,用等體積的LB洗滌兩次,然后用2ml的LB重懸,作為大腸桿菌供體細胞。取50pl凍存于一80'C、20%甘油保存的S/re/7tomycesflc加tmwATCC25421或同框缺失突變株的孢子懸液(2-3xl(^個/ml),用H20稀釋10倍至50(Hd,然后用等體積的TES緩沖液(0.05M,pH8.0)洗滌兩次,重懸于等體積的TES緩沖液中,50。C熱激10min使孢子萌發。然后加入等體積的TSB培養基,37'C溫浴3—4小時,離心重懸于500^1LB中作為鏈霉菌受體細胞。將不同濃度的受體細胞10(HiL與等體積的供體細胞混合,直接涂布在含有10mMMgCl2的IWL—4(SolubleStarch10g/L,K2HP04lg/L,MgS04lg/L,NaCllg/L,(NH4)S042g/L,CaC032g/L,Yeastextract0.5g/L,tryptonelg/L,FeS04.7H200.001g/L,MnCl2.7H200.001g/L,ZnS04.7H200.001g/L,agarpowder20g/L,pH=7.2)或AS—l(Yeastextractlg/L,L-alanine0.2g/L,L-arginine0.5g/L,SolubleStarch5g/L,NaC12.5g/L,Na2SO410g/L,agarpowder20g/L,pH=7.5)平板上,30'C培養12-16個小時。用無菌水輕輕洗滌平板表面以洗去大部分大腸桿菌,然后在每一平板的表面覆蓋lmL含萘啶酮酸(終濃度為50ng4iL)和相應抗生素的無菌水。30'C培養5天以上挑取接合子。諾肽菌素產生菌S/r印to/^cesflc加(w^ATCC25421及突變株的發酵和發酵產物的分析鑒定方法取lOOulS/reptowycMac加tw^ATCC25421或突變株的孢子懸液接種到裝有50ml種子培養基(Sucrose20g/L,cornsteepliquor30ml/L,peptone5g/L,CaCO35g/L;PH7.0)的250ml錐瓶中,30。C,270rpm培養24-48小時,轉接10ml菌絲懸液到裝有50ml發酵培養基(Glucose30g/L,Cottonmeal10g/L,NaCl3g/L,2xtraceelement5ml/L,CaC033g/L;PH7.0)的錐形瓶中,28。C,270rpm培養96-120小時。發酵好的菌液離心,棄去上清,向菌絲沉淀中加入適當體積的THF,攪拌30min,抽濾,去除固體沉淀,收集有機相,旋干得固體粉末,溶于適當體積的THF中。取20nl進行HPLC-MS檢觀!l,檢測波長UV=220nm;柱子AgilentZORAXSB-C185拜4.6x250mm,PN880975-902,SNUSCL024998,LNB07051;流動相條件v=lmL/min;A=H20(含0.1%HCOOH);B=CH3CN(含0.1%HCOOH);時間(min)0361219222830B(%)015404055858515實施例7異源表達突變菌株的獲得及發酵產物分析將諾卡噻唑菌素生物合成基因簇中的目標基因和來自于pLL6212的紅霉素啟動子ErmEt克隆到整合型載體pSET152的相應位點中,得到用于異源表達的質粒。將構建好的質粒通過實施例6中屬間接合轉移的方法導入到諾肽菌素的產生菌S/r印to/^cMfl"wcmwATCC25421中,經阿泊拉霉素抗性篩選,得到異源表達突變株。通過基因型驗證正確后,再參照實施例6中的發酵和檢測方法進行表型上的分析,通過LC-MS檢測新產生的諾肽菌素的結構類^l物來推測目標基因的功能。以下根據本
發明內容提供的基因和蛋白序列氨基酸/核苷酸序列表SEQUENCELISTING<110>中國科學院上海有機化學研究所<120>諾卡噻唑菌素(Nocathiacins)的生物合成基因簇<130>說明書、權利要求書<160>1<170>Patentlnversion3.3<210>1<211>45560<212>DNA<213>諾卡氏菌iVocar&asp.WW-12651<400>1GCTGCAGCGGCCGCACTAGTGGATCCCGAAACCGGACACCGCGGCGCGTCTCGGCCTGCC60CAGCTCCGGCCACGGCCGAGCCTCGGTCAGCAGCGACACCGCGCCCGCCGACCAGTCCAC120CGCCTGCGATGGCGCGTCGACATGCAGGGTCTTGGGCATGACCCCGTTGCGCAGGGCCAT180CACCAGCTTGATGACGCCGCCCACGCCTGCGGCGGCCTGCGTGTGGCCGACGTTGGACTT240GMCGAGCCCAGCCGCAGCGGCTCCTCGCGTTCCTGGCCGTAGGCGGCCAGCAGTGCCTG300CGCTTCGATCGGGTCGCCGAGCCTGGTGCCAGTGCCGTGCGCGTCCACCAGGTCCACTTC360GGATGGCGAGAGTCCGGCGTCGGCCAGCGCCTGGCGGATGACCCGCTGCTGTGACGGGCC420GTTGGGGGCGGTGAGCCCGTTGGACGCGCCGTCGGAGTTCACCGCGGAGCCGCGCACGAC480GGCCAGCACCGGGTGCCCGTTGGCGAGCGCGTCGGAGAGCCGTTCCAGGACGACGAACCC540GGCCCCCTCCGACCAGCCCGTGCCGTCGGCCGCAGCGGCGMCGCCTTGCACCGGCCGTC600GGCGGACAGGCCACGCTGGCGGGAGAACTCGATGMCGTGTCCGGCGTCGGCATGACGGT660GGCCCCGCCCGCCAGCGCCAGCCCGCATTCGCCGCGGCGCAGCGCCTGCACGGCCAGGTG720CACGGCGACCAGCGACGACGAGCAGGCCGTGTCGACCGTCATCGACGGCCCTTCGAGGCC780CAGGGTGTAGGAGACCCGGCCGGAGGCGACGCTGGCCGCGCCACCGGTCACCCCGAAGCC840CTCACCGCCCTGCTCGTCCGCGCCGAGCCCGTAGCGCTGGCCGCGGTGGCCCATCAGCCC900GGCGTAGACGCCGGTCGCGGTTCCCCTGAGCGAGCGCGGATCGATCCCGGAGCGCTCCAG960CGACTCCCACGCGGTCTCCAGCAGCAGCCGCTGCTGCGGGTCCATCGCCAGGGCCTCGCG簡CGGGGAGACCCCGAAGMGCCCGCGTCGMCCCGGGGGCGTCGTGCAGGAAGCCCCCGCC1080GCGGGCGTAGTAGCGGCCGGGCAGTCCGGGTTCGGGGTCGAAAAGGCCGTCGACATCCCA1140GCCGCGGTCGCGCGGGAACTCCCCGATCGCGTCCCCGCCGGAGGCGACGAGCTCCCACAG1200CTGCTCCGGCGTGCCGACGCCACCGGGGAACCGGCAGGCCATGCCGACGATCGCMTGGG1260CGCTCCCTGCACATCGCGCAGCTTGTCGCGCGCCTCCTGCAGCTCGGAGACCGCGCGCCG1320GAGGTAGTCCCGGAGCTTGCCCTCGTTCTCCATCGTGTCGCMCCCCCTGCTGACCGGTG1380ACAGGCGCCAATGGCCMTCCMCCGGGGCAGCAGGCGGTGCGGCGGTGCTGCGGMCCA1440ATTCCGGACCGGGAAACTGGTCTCCCGTCAAGGGCGGGGAGACCGGTCACCGCGGATATG1500ATGCTCGGGCTGAGGTCAGGAGACCCGGGTCGCGGCGGCCGGGGTCGGGAACCCCTCGGG1560CAGGTCGTCCAGGGTCATCGTGGTGATGTGCGGTCTGCCCGCGCCCCATTCGGGCCTGCG1620CAGGMCAGGCCGGGGTCGGCGGCGGCCACCACCAGCAGCGGTGCGGTCGCAGGCGGGTC1680GAGCAGCTCCTCGACGMGTCGAGCATGGCGTCGTCGGCCAGGTGCAGGTCGTCAGCGAG1740CACCACGAGCGGGCGGGGCGCGGCCAGCCCGGCCACGACCGTCCACCAGTCGGCCACCAC1800CGACTCCTCGGTGTGGCAGGTCGMTCCGGCTCGACGMCGCGCGCAGCCGGGACAGCAC1860GCCCGCGGCGGTGCGGCGGTCGCCCACCACGCCGCGCACCGCACGGTGCAGCTTGTCCCT1920GGCCACGTCGCGGCTGTCCTCGCCGCCGACCCCGCAGCAGGCGAACAGGATCTCCCCGCG1980CAGCCGCGCCGTGGTCGCGAGCACGCGGCCGGTCAGCCTCGGGCCGATCGCCGCGATCCG2040GCTCGCACGCCGTTCAAAAGCCGAGAGCAGCCACGACTTGCCCATCCCCGGGCCACCGAG2100CACCGACACCAGGTGCGGTCGTCCCCGGCTGCGGACGCGTTCCAGMCGCTGTCCAGCAC2160GTCGAGTTCCGGCCTGCGGTCCACCGCCACCATCCTCGGGTGGATGCCCGCCCCGATCAG2220CTCGCGGGTGCGTTCGCAGACGGCGATCTCGTTGGTGTCGGCGGCCAGCACCAACGTCTC2280GGACTCCACCAGCAGCGCGCCGCCGATGTCGAGGGCGTCGGTCACGTCCGCGGGCGGCTC2340CCCGGTGACCACGGCCACCCGCAGCACGTGCCGGGCGTGGTGCGGGGACGCCGAGMGCA2400GAGCCGGTCGCGCAGGGCGACGGCGGCGCGCACCGCGCGCTCAGCGCAGCTCGCACGGTC2460GGGTTCGTCCCGGAAGACAGCCAGCGACATGGTTCCCATCGACTGGGTGAGGGTGCCGCC2520GMCAGCGTCACCTCCTCCGCGACCGCGGCGATGACGTCAGCGAGCACACCGTCGACGGC2580CGACCGCGCGCTTGGCCCGACCTCCACCCCGATGAGGATCGCGCTGACCCTGCCGGGCCG2640CTGCGGCCTCGGGGCCAGCCGAACCGGCGCCGTGTCCGACGCAGGCGCCTCGTCCMCGG2700CCGCGGGCCGAGGACCAGCGCCGGGTCGTGGGCGAGGATCGCGTGCTGCAACACCCGCAG2760GTCCCGCCCTGGCTCCAGGCCGAGCGTGCCGACCAGGGCCGAGCGCACCCGCTGGTAGAC2820GGCGAGCGCGTCGGCCTGCCTGCCGCTGCGGTAGAGCGCGAGCATGAGCTGGCGGCCGAG2880CCGTTCGCGCAGCGGTTCCGACTCGGCGACCCTGCCGTTCGCCAGTTCCGCCTCGMGTACACCGCGGTCAGCTCGGCCCAGTCGTAGCCGCGCCACAGGGCCAGCGCGGAGCGCAGGATGAGTTCGGCCCTGCCCTGCTCGGCGAGCTGCTCCATGCGCAGCACGTACCCGGGCGACTGTCCGGCGMCACGACACGCAGCCCGCGCACCGGCGCGTTGTCCTCGCCCCACAGCCCGTCGACATGCMCAAAAGCATCCCGAGCGTGGCTTGGCCGCCGCCATCGGCCTCCAGCGGGCCGCTCACGTCGCCGTGCCCCCGCACGCGGCCGCGCTTCACCACCGGTGTGCGGTTCGGGCGGGGGCGACGGGACCMGTGCAGGTATTCGACGCTCGTGTCAAACCCGGTCAGGCAGCCGCAGGCGACCTCCATCATCCGGTTGCGGTCGGCGGCGCCAGCGGCCTGATCGGTGAGCCAGCCGACCCGGCACGAGGTGGCCAGCAGCTTCAGCATGACCCCGACCGCGCCGTGCGGGCCGACGTGGCGCGGGTCGGAGACGAGCGCGCGCACGTTCATCTGGCTGGTGCGAAGGGTCAGCTCCGTCCCGATGCGCATGACCAAGTCCAGCGGCTCCTCGCGCTCTGCGTCGCGGCGGAAGCCGTCGACGGTCACCACCGCAGGGCTG嫩TTCGCGTCGMGCAGCGCACCTCGGGCAGGTGGTCGTCGATGAACGCMTGGTCTTCAGCGCCGAGTTCGATTTGGCGCCCCAGTGGATGCGCCGCTCCAGCATGGCCCACGCGTGGTCGTTGCCGCGCGCATCCAGTTCCACGATGGTCTCGTCCTCCAGCAGGGTGCCTCGCCACAGCGCGACAGGGTGGTCGGACATGATCGTCTCCCGGCGGTCAGCTCGGCCAGCACGGCGAGATG2940GTCCTCCATGACGTCGAGCCGCAGGTCCTG3000GTCCTCCACCAGGTCGGCGAGGGCGGGACC3060CTTGGCGGCGGTCTTCGTGTGGCCCTCGGC3120CTGGAACTGGMCAGGTCGACCCGTTCCGG3180GGTCMCAGCCTCGGCGAGCCTCCGTGGTT3240CGCGTTCTGCAGCACCTTGCGTGCCGTCGG3300CAGCAGCGCGCTCGTGGGAACGGCTTTGTT3360GCGCTGGCGGCTGCCGCCGAGCTGMCCGG3420MGAACCCGAAAATGCATTCGTCCCCCCGC3480CGCGCTGTCAGGCTGAGGACCACTCGACAG3540CGMCACCGTCATCGTGGTCGGCGCCGCCT3600TCTCCACCCCTACTGTGCCGGCATCCGCAC3660AGTCCGCCTGCTCGMGCCCGCGMTCGGT3720TCCTGCGGMGTCCGCCACAAGGTGGGCCC3780GCAGCAGCACGGTGCCCGCGCCGMGGAGA3840GCCGCCACGCCGCGTCGCCGCGCTCGACGA3900ACCGGTCGGTGAGCGAGATCACCMCACGT3960GGTCGGCGTCCGMTAGTGGATTCCGGTGG4020CCTCGACCCTGGACAGGTCCTCCTCACGGG4080TGCGCAGAAAGTCCTCGTCCGCGCCCGCGT4140CCGCCTGGTACATCTCGCGGCGCCTGCGCG4200CGGGCATATGCGGCAACTGTTCGGCCTGCG4260GGTGGGCCACCTCGGCGCGCTCGGTCGGCA4320CGMGTTCAGCTCCGCGGCGATCTCGCGCA4380GCGGCAGCACGAAGTACTCAGCCACGCCCA4440GGTCGTTGCGGCTGGCCACCGATTGCAGGA4500TGCGCACGGCATCGCTGAGGCGGACCTCGC4560TGTTGTCCAGGTCCCAGACCAGGCACTTCA4620CCGATCAGGGGGCAGCGGCTTCGGCCAGGA4680TCAGCTGGCTGATCTCGGTGCTGCCCTCGACGCGCGCCACCACGTGCCCGTCCGCCGCGCCAGCACCGCGCGCCGCACCGCCCGAGGCGAGCCGCGGCGATCGCTCGTCCCATGCGGCACGCTCGGCGGCGTACAGCTCGGCCACGTGCCTGCCGMCTGGACGCGGGAGCCCGCGTGCTTTCCGACGCAGCCCCAGGCGACCGACAGCCTGGTGACCGGCTGGCCCGCGGCGGCCAGCAGGGTCACCGTGGCGTGGCCCGCCGCCCGACGCACGCCGGGGGCATCGGCGGGAACCACGAAGACGACMCCAGGTCGGCGTAGCAGGCCGCGACGTCGTCGCCGTCCTGGCGAATCGTCGCCGGCTCGCTGAAGGCGACCGCCGCCAGCGCCCGCTGGACGCGGTCGCCGAGGCGCTGGATGACGCTGCGCAGCGAGCTGCACAGGGCCCCACCGGACAGGTCGAGACCGCCGTGCTCGGCACCCAGCCCGCGCAGCACGTCGACCGGGACGTCGCCCACCGTCTCGGTGACGAGCGCGGAGCCGGGTCACCAGCGCGCTCATCGCGCGCGGTCCCTCGACGGCGATGTCGMCGCGCCCAGCGACGACACCACGCCGGAGGCGMCAAGTTGGCGGTCAGGMCTCCACCAGCTGCTCCCTTCCTCCGCTCAGATCGGGTTCTTGCGGGGGCACAGCTCGACCCGGTCATCGGCGCGCATGTCGGCGTCCTGGGCGTCCGGGTCTACGACCGCGAGACCGCCCGGCCGCAGGTGMGCACCTTGTCCGCGTCGATGAAGACGAGGTCGACCGCCGCCGTCCGCGCCCCGTCCCCGACCCGCTCCCAGTAGCGCCGGGCGATCCTGGTCCGTCCGCCTGGCGGGAGGGCACGGGCCATGCTGATCTCCATGAGTTTGGCGTCGCGGTAGG4740CCGCCGAGGCGAGCACCTGCACCGCCGAGG4800CGTGCTTGGCCAGCACCGCGGCGATCGCCT4860TGGCCTCGGCGCAGGTGTAGGTGGCCGAGC4920GGGCCACGAGCTGGTGCTCCAGCAGCCGCG4980CGACCGCCGCGCGCAGGCACGCGCGCAGM5040GCCCGTAGGTCAGGGCGATGGTGGTCAACA5100CGGCGTCTGCTGGCAGCCGCACGCTGTCGA5160AGCCCATCGGCTCGGGCACGCGGTCGATCC5220CCGCGGCGGCGCCGTTTCCGTAGCGGCCGA5280CGGTGATCCAGGTCTTCACCCCGTCGACGA5340TGGCCATCGCGGCCAGGTCGCTGCCCGCCC5400ACCCGCCGGTCAGCGCGGCCAGGTGCGTGG5460TCGTCCAGGCCGCCATGCCCTGCGAGGTCA5520CGGTGTGCGCGGTCAGCTCCCCGTTGTCCA5580CGGCGACCTCGGCGCACAGCAGGCCCTTGG5640TCTCACCCGCGACGTCCCACTCCCCCGCCG5700CCAGGTCAGACACCGGAGGGCTCCACGCGC5760ACCGTCCGGAAGTTGTCCAGCGCCAGGTCC5820TCCACGMCACGACCAGCTCCATCGTGMC5880TCGACGTCGGGTTCCCACACCACCTTGGTC5940TCGATCGCGTACGTCGTCAGGGACGTCATG6000CCAGGGTGATCCCGTCGGCCATCGGCAGCA6060GCGCGGCGTTGAGCCCGCGGATCGCGGTCG6120CGCGGCCGMGAACAGGGTGTTGTCCAGCA6180GCGCTTGCTCGTAGTAGGTCGGGTACCCGG6240ACGACCCCGGACCACGCTCGTCGAGCAGAT6300GCAGGACCACCCGGTCCGCCACCCCGGCGC6360AGCGCTCGCTGATGTCGCAGGTCACCACTC6420ACAGCGTGCCGTAGCCGGTGAACGTGCCCA6480GTTCCAGCACTTCCCGCGCGCCGGTCAGCCCGACCAGCATGGCCAGCAGCTGGCCCTGCT6540CTGGCATGGTGACCATCGCCGCCAGCGCGGGCATCGCCTCGGTCTCGGCGCGCAGGTCGC6600GCAGCAGGTCGTCCTCGCGGACGGACACCGCGCGCACGTACTCCACGAGGTCGTCGGTGA6660GCTGGACCTGACCCGCCATCAGAGGGCCCCGTACTCGTAGAACCCGCGCCCGGTCTTGCG6720GCCGTGGTGGCCGTCGGCGACCTTGCGCAGCAGCAGCCCGCTCGGCTTGCAGCCCTCGTC6780CCCGGTCCGCTCGTAGAGCACCCGCAAGGAGTCGACGAGGTTGTCGATGCCGATGAGGTC6840GGCGGTCTTCAGCGGACCGGTGCGGTGGCCGATGCAGTGCTCCATCAGCGCGTCCACGTC6900CTCGACGCTGGCCCTGCCCTCCTCGACCACCCTGGCCGCGTCGTTGATCATCCGGTGCAG6960GACCCGGCTGGTGACGAAGCCAGGGCCGTCGTTGACCACGATCGCCTTGCGTCCCAGCCG7020CTCCAGCAGCGCGCGCACGGCGACCATCGCCGCGTCCCCGGTGCGCGGTCCGCGCACGAC7080CTCCAGCGTCCCGATCAGGTACGGCGGGTTCATGAAGTGCACCCCGACCAGGMCTCCGG7140CCTCGGCACGTGCCCGGCCAGCTCGTCGACCGGGATGGAGGAGGTGTTGGTGATGCGCAG7200CGCATCCGGGGCGACGACGGCGGCGATCTCGTTCTGTGCCTTGACCTTCAGCTCGGCTGT7260CTCGGTGATCGCCTCGACGACGACCCCCGCGCCCGCCGCCGCGTCGACCGAGTCGGCGAG7320GTCCAGGTCGCCGATCGGGCCGTGTCGGGGGAGCGCGCCGAGGACGTGGGCCAAACGCAG7380CTCGTGCCGCACCCGCTTGCGCGCGGTGGCCAGCCGCTCCTCATCGACGTCCACCAGGGT7440CACCTGGACGCCGCGGCCGATCGCMGAGCGGTGATCCCCACCCCCATCACTCCGGCGCC7500GAGCACCGCGAGCCGGTCGGTCATGCTTCCCCCTCGGATGCGTGGTGTGCCCGGTCAAAT7560GAACACCACGCGGCGCGGGCGGCGAGTGCGCCTGCGCACCAAATCGGGCCTCGGGTTCTA7620GCCCCCGGTTCCAGTACCGCCCGCCGCGGGCCGACCTACCCTGCGAGCACACCGCGAGTG7680AGGAGCGCCATGCCAGACATCGATCCGGCACACTTCCGGCGGACCCTCGGCTACCTCCCC7740ACCGGCGTCACCATCGTCACTTCCACCGACGCGCGCGGTCTGCCGGTGGGCTTGGCCTGC7800MCTCGATCACGTCGGTGTCCCTCGACCCGCCCCTGGTGCTGGTGTGCGCGGCCMGTCG7860TCGTCCACCTGGCCCACCATCCGGCGGAGCGGCACGTTCACCGTCAACGTCCTCGACCGC7920GCGGGGGAACGGATCTGCCGCCGCTTCGCCGCCCGCGGCGTCGACCGCTTCGCCGGMCT7980CCCTGGACCCCGGCCCCCACCGGCCCCGAGCTGGACGAGGCCCTGGCCTGGATCTCCTGC8040GTCATCCACGCCGMCACGACGCGGGCGACCACGTGATCGTCATCGGCCGGGTCACCCGC8100CTCCTGCACTCGCCCCTCTCCGGCCCGCCGCTGGTCTTCCATCGCGGACGCTACGGCTCC8160TTCGCCCAGTCCGCCGTCGTCCCGGTGCCCGGCCTCATCTGACCGAGCGCCGCGAAGAAA8220TCTTGGACGGCGATGTCGAGMCCGGGGGCCTGCTCCGTCCTCGGGGTGACTGCGGCCAG8280AATGGGCCGCACCAGCACGAGGAGMCCACGATGGCCAAGTACCTGCTGCTCAAGCACTA8340CCGGGGCGCCCCGGCCGCCGCCAACGACGTGCCGATGGACCAGTGGACCCCGGAGGAGAT8400CACGGCGCACGTGCAGTACATGCGCGACTTCGCGGCCCGGCTGGAGGAGAGCGGCGAGTA8460CGTCGACGGCCAGGCGCTCGCCCCGGAGGGGATGTTCGTCCGCTACGACGGCGAGGGGCG8520TCCGCCGGTCACCGACGGCCCGTTCGCCGAGACCMGGACCTCATCGCGGGCTGGATGGT8580GATCGACGTCGACAGCCAGGACCGCGCCGTCGAGCTGGCCGGGGAGCTGTCGGCCGCGCC8640GGGGGCAGGCGGGMGCCGATCCACGAGTGGCTGGAGCTGCGCCCGTTCCTCGCCGCCCC8700GCCCACCATCACCGAGTGTCACTGAGCGAGATGGACGAGGTTCTGCTCAGGAGCCTCACG8760CCGAGCGTGATCGGCATCCTCGGCCGCCGCGGAGCTGACTTCGCGGCGGCTGAGGACGCC8820GTCCAGGACGCTCTGGTGGAGGCCGTCCGCGTCTGGCCTGCCGACCCGCCGCGCGACCCG8880MGGGCTGGCTGGTCGCTGTCGCCTGGCGTCGGTTCCTCGACGCGGCCCGGTCCGACTCC8940GCCCGCCGCAGGCGCGAGGACAGCGTCGACGGCGAGCCGGTCCCCGGGGAGGCGCCCGCG9000GTGGACGACACCCTCCAGCTCTACTTCCTGTGCGCCCACCCGTCGCTGACCCCGTCGTCG9060GCGGTCGCGCTCACGCTGCGCGCCGTCGGCGGGCTGACCACCCGGCAGATCGCCCAGGCG9120TATCTGGTGCCCGAGGCGACCATGGCCCAGCGCATCAGCCGGGCCMGCGCACCGTCGCG9180GGCGTGCGCCTGCACCAGCCGGGGGATGTCGCCACCGTGCTGCGCGTGCTCTACCTGGTC9240TTCMCGAGGGCTATTCCGGCGACGTCGACCTGGCCGCCGAGGCCATCCGGCTCACCAGG9300CAGCTCGCCGCCGCGATCGACCACCCTGAGGTCGCGGGCCTGCTCGCCCTCATGCTGCTG9360CACCACGCCCGCCGCACCGCCAGGACCGCCCCGGACGGCAGCCTGGTGCCGCTCGCCGAC9420CAGGACCGCTCCCGGTGGGACAACGCGCTGATCAGCGAGGGCGTCGCGGTCCTGCAGGCC9480GCCCTCTCCCGCGAACGCCTCGGCGAGTTCCAGGCCCAGGCGGCCATCGCCGCCCTGCAC9540GCCGACGCCCCGGCCGCGG(JGGMACCGACTGGGTGCAGATCGTCGAGTGGTACGACGM9600CTCGCCCGCCTGACCGACAACCCGATCGTCCTGCTCMCCGGGCGGTCGCCGTCGGCGAG9660GCCGACGGGCCCAGGGCGGGCCTGGCCGCTCTCGCCGCCCTGGACGACGCTCTCCCCCGC9720CACACCGCCGTCGCCGCCCACCTGCACGMCGCGACGGCGACCGCGCGAGAGCCGCCCGG9780CTCTACGCCGAGGCCGCCAGGAAAGCACCCMCCTGGCCGAACGCGACCACCTCACCCGC9840CAGGCCGCCCGCCTCMCACCCGCTGACCCCCGGCCCATCCGCCCGGTCGCCGTACCGTC9900CGGGGACGAGTCGACAGMGTCGCCGACAGAGAGCAGGMGCGATGCGCAACGAGGCMT9960GGCGCGGTTGGACGTCCTGACCGGATCGTGGCGGGCGACGCTGAGCAACGCCTGGTTCCT10020GGAGCCGCCGGACCAGGAGGTCGAGGGCACGGCGACGGCCGMTGGCTCGCCGACGCGTT10080CGTGGTCTTCGGTCATCGGCTGTGMCCGCCCCCGACCTGGGAGGCGTCGGGCGTAGCGCGTGGCGGCCATGCCAGGTGTCGGCGCAGCGCGGTAGACCTGCGCAGAGGCTCGTAGTGCCGCCTCCTGCAGGGCCGCCGCCCGGACTCCCGACGGCTCGTACGCTCTCGGATGACGTAGGGCGATGATCGGTGCGCGGCTCCMGMCGCCCTCCCCCCGATTGCAGGAGGGTGCGCTGGCGCCCGAGGTTGCTCGCGCAGCCTCCCGCAGCGACCACCCGCCCAGTGCATGTTCGAGGACGCTGGACGACGCAGCGACGGTCTTCGCCATTCCAGCGATCAGGACCGCGCTGCCCGCCCGGTCGGCCGGCGGTGAGGTCCGGGGGACGGCCAGGGCTTCCCTCGTGGGTTGCCMGGCGGGCGCTTGGCGCCACCAGGCGCTCGCGGTGCGGCGGACAGGTGCGTCGACTCTGGACGACCGTCGAGCGGTCGTCGCCGAGGATCTTCAGGMGAACCGCTTGCCMTCCCACTTCAGGCAGGACTCGATTCTCGGCGACGCCGCCCTACTGGCGTGGATGACCGGTCATCGGCCGCGTGTCAGCGGCGACCMCGACGCTGACCTTCGATCGTCGCCGAGCTCGACCTGCGGTCAGTTGGATAGGGCCAGGTCGGGGCGCTCCAGGGCCGGAGCGCCTGGGGGTAGCGGCAGGTCGACCGTAGGAGTTCGAGCGCGTCGGCCCGCGGTGCACGTAGCCGGCGACCGGCGCGCGCGGGCGGACAACCGTGAGGCGCGACGCATGATCTCGTTCCGCCGAGGGAAACAGGCAATCAGATTGCTCCTCAGCGGGCGGTCCGGCTGCACGTCCGTCGACCAGCCACGCTGCCGCGAAACCCAGGCCAGGCACGCTACACCGCCCGCCGCGCGGCGTCACGCCAGCGCAAGGACCTAGCGATCGGCAGGCTTGCCGGTCGGAGAAGCTCGGCGACCGGAGCGGTTTGACCAGGGTCGATGCGCCAGGACGGCGCCTGMGCTGCGTCAGCCGCTCCGGGCTGGGAGCACCTTGGCTGCGCGGCGTTCGCGTTGAGAGACGTCATTGMTCCCCTTATGCCAGGCGCGCCGCGCGCGGAGAGCATGCCTTCGCCGATTGCGGTGTGCCACCTCGAGGGGTCACCGAGTCCGCCGTCGGTGCACCTGCCACGACGGCTCTACCACGTGGACGATGAGGCCGCGTCATTCGACCTCGCCGGGTGGATGCGGCGGGACCCAGCATCGATCATGCGGGCAGAGGGCGAGCGGTCAGCTCGGTCCAGCGCCGGTCTGCACGGGAGGCGGCCGMCGCCCATGCGCACCAGCCGCCTGCTTTCGTGTCCCCTCGCCAGCAGCGTGCGCGACCTCCCCTGTCMCTCACGACCCGCCACTCCCACTTCACGCCGCCACCCGCCGTTCGCCACCGCGCGTGCCGCACGACCACGGGTGACGAGCGACATTCGGAGATGGTCCTACGAGCGC(JGGCCGCGCGGACCGGCCGCTGTCTTCGAGCGGTCCCAGCTCGACGGTGGCCGCGGTGCAGGGCGGACGTCGCATGAGGTGGGCCGAGCAGCGTTGAGGTGGGTCCAGCAGACACCAGATCGGGCGTCCACGTTCGCGGGCCGCGCAGTTGCCCACAGCTCGCGCCAGMCCTTCCAGCGGCGCCCCAGGCTCGGCGTCCCCAGGGAGCGGCTATCGCCACCGTGCCGGATGCTGGTCCACCGAGACCGAGGCACCGGTGTCTGCGCTGGCGCGGCAGTTCG101401020010260103201038010440105001056010620106801074010800108601092010980110401110011160112201128011340114001146011520115801164011700117601182011880CCCMTACGGGCGAAATCGCGAGATAAGCATTGGGCAGGCMCGCCGACGACCGGCATGTACCGCGCCGGMCTGGTCGGGCGATGAGCCTCCCCGTAGGAAGTTGGCCAGACTCGTACGGCCGGGTACGACCACGTGGCGCTCGMGGCTGACGACCTCCAAAGCCCTCTGCCGMGGACGACGCGGCCGGATCGTCGTTGCCCGCTTGCCGCGAGCCTGCACCGCGCCTCTCGCTGAGCGGCGGGCTTCGMCGCCTCGGCGCAGGTCCGAACTCGGCCGGCCAGCTCCGACCAGCCGACGGATCGACGGACGCAGGACCACGGGCMACGGGCCGACGCAGGMGACCGATGCCGTGGGTCGCGCCCTGTAGACCGGTGCCGATCCCCCGCGCGGACCCGGGTCGCCGCAGCACCCGTGACGCGGTGCGTGCGAGGCCCAGGTGGTGGTCCGGCCGGCTGCAGCTCGCAGGTGCCCGGGGGTCGCGGGCCGCCGAGGGGCGTAGCGCGGCGAGCTGGGGTCTCGTACCCGGTCCCCGGCGGGCGACCCATCGATCCGGGCGGGGACGCATGMGTCGGCGCACGGCGCCGCCAGCGCGCCATCGCCGTCGGMGAAATTCGGACGCAGMGACGTAGGATGTTGAGCGCGGCCGAGCCATCGGGCCCGGTCGGGATGGTTCGCCATCGGCGCGCAGGGCCGCCGAGCCGCGCCGGTCGCCCCTGGCCCATGCTGACGGGCAGTTCCGACGGCGGCGCACGCGGGCCACCTGCCGCGCCCAGCGGCGTTCGACGTCCGAGGACTTCCTTCCGGGTGCTCCGGCGATGCTCGGGCCCGCMTTCCCGCGGCCGCGCCGCGCGTAGAGCGACCGGCCCGCGGCCGGACGGTCGTGGTCGGAGCGAGATCATCGACATTCTGGCGGGCGCCCGCTCGCCCAGCCTCGCTGGGCGTCCTGCACTGGCCTTCCGTCTGGACGATGGTCGTAGAATCGCCGCGCGCCCCGGTGATCGGCGACGGACCAGTTCCTMCMGATGTCCGGGTAGMGCAGGCCAGGGCGGCGCGCCCCCTGGCCAGCGAGGGAGATCGCTGGTGTACGACGGCGGCGGMCAGGGCTGAGCAGCACGCACCTCGGCCGGCGTCGTGGCAGCCCGGCCGCAGAGCACCCCGATCGGCACTCGGCGTGCCGGGTCGGCCCACATGCCACGTTGTAAACATTCCCCMGGCTTCTCCGCTGGCGGCCAGTGCGCGCGTGCGGTGTTGTCCGGGCACGCCCCACCAGATCCCTCGGCCAGGCTGCCGCCCCGGTGGCGTACCGCCACGCCCGCTCATCGGGCTGAACATCCAGGCCGCGGGAGGCAGTAGGTCGAACTCGCAGCACCTGGGGTCATCCCGGGCGATGTCGCAGCAGGCCGCACGGTCGACCAGCGCGGGGCAGGGTGCGCCGCCCAGGCGGTCCAGCGGTGAGCCTGCCCGCGGGGGTTGGATGGCGAGGCGCGCCATCGGGTCCCGAGCGMGTCTCGCGTCCTGCTGGGTACTCGGCGCGCGGCGGCGCTCGGCCCAGCCATTCGGCCGGGACGCCTGGAACAGCTCGGACCAGCACCGTCACCCGCCCAGCGTGGGCGCGTCCGTTCGTGCGGCCCAACGAGCGCGGTGCCTGCCGCTGCGGGCGCTGCGTGCGCCGGCGAAACCGGACCTCGCCCGTTGCCGMCTACCMTTCGGAGCACGCCGTATGGCGGCGCTCGMCGCGGAGCCGGMGGACGGCGGCACAGCACCTGGCCCGAAGTCGA119401200012060121201218012240123001236012420124801254012600126601272012780128401290012960130201308013140132001326013320133801344013500135601362013680ACCCGCCGCCCGGCCAGCACGCAGCCGCACTGMCGGGCACCTGGTCATCGGCCGAGACGGAGCGGGCCCGACGCCCTCGGAGCAGGAAGGACGMCTCGCGGCGCGATGGCCGGTGCCGCAGCGCGACGCGCCGCGTTGGGTCTCGCTCAGCGTGMCGGCCGGATCGGCCCGCCTCGACTGGACACCCCCCCAGGTCTGTCGCGGAGTTGGTCGGACTCGCCGACGAGCCCGCTCGMGGMCGTGCGCGTCGCGCCGGCCCGCCGACCTCCCCCTGGCGGGCATGTACGMGGCGCGGCCCGGCTTGCGTGCGCACCCGGGGCGACCCCTGACCGGGCGGTACCACAAGGTCCCAGTTTGGTGMCGGCGTAGCGGGTCGTACGGGCACGTCGACGCTCGGCTCCGGCAGCCCAGGTAGTTCGGGCATACACTTTGGATCGGCCGTCCCGACGCCCCTGMCGCCAGCGCTGMGTACGGGCGGGCGCGCCTTCCGGACGCCTCGACCGGCCAGATCGTAGCCGGGGCGCCGCGCGGGATGCCGTCGCACGGAGTGGGTAGCCGTCGCGACAGGTGCGGCGATGGCGCATGTCGCCAGCAGCCCGCTTGCTCGTGCCGGCTCCTCGCMCGGGTAGGTCGGTCCGGCGCGGGGCGMCGTAGAGGTACTTTGGCCTCCGCCGAGCGCCCGCGTCCCCTGACCGACCACCAGCGCGCGTAGGCGGACCACACCMCTTTCCTCCCTGCTGGCGGGTTGGCCGAGCCCGGCTGCGCTGGGCCGTAGGCGGCCGGTGTTGGGCGTAGTCGCCACAGGATGTGCGCGTCGCTACTGCGCGTGCGTCGGCGAGTGACGCGGGATGMCTCCTGCGGCCATCCAAGCCGAGGCGGGTGCACCTCCCGGGCGGGCGCTGACCAGGGCTGAGCCGTCGCGGCGTCGTCCGGGGTGCGCGGTGTCGCAGCGTCGCGGTCGCGCAGGGCCCGCGGGGGGCGCGCTTGGCCGTGCTCGGCCGGGGGCGGAGGTCCCAGGGACGACCTGTTCGGCGACCAACTCCATCGGCGAGCGCGCGTCGGCGCGTGCCTTCTCGTGCCACCCAGACGCAGGTAGGATCGTCAGGTGGTCGTGCACCGGTGMCAGCCACGAAGTGAGATCACCAGCCGGCCCCCATGGCCACGGCAGGTGACCGCGGCCTGCGCCCCGCCTGCTGCCAGGCGGGTTTCCAGCTCAGGCGCGGGTCCGGCGGACGCATCTCCTCGGCCCGGCGCGGCTGTGCGAGCATGTCGACCACGGGCGCGGCGCCAGGTAGAAGCCGGTCGGGGGGAGMCCGCCGTCCTGGCCGCCACCACGCCTGCGCATCTGCGAGCGGAGCCGATCAGCGTCCCACAGCCTTCTGCCGAGCGCAGCGAGCACCGCCGTCCTGGTCACCGGTGTTGGTCGATGCGCATGGCCGTCCTCGCCACGGCTCGGGCGTCGAGGGTCGMGGTGGATCCGGTCGAAGCGCTCGTGCGCCGGTCGTCCGGCAGGGATGCCGCCCGTGCCGGGCACGCCGCACGCTCCACGCCTGCAGCCGMGTCGGTCGCACTCGCAGCGCTTCTCGACTTGCCGGCCCTCGATCCACCTTGTAACGTCTTGGCGTCGGCGCGCCGGCTCGGCCCCCGTCGGCCCTCGACCACCGTAGACCGCGCAGGCCGGGTCGCGACGGTCCACCCCTTGAGCGAGCCCGGTCGTCCTCGTTGGGTCGCGCCGCACCAGGTACGACCAGCAGCGGCGGTGTCGGCCGAGGTGCGGCGATCT137401380013860139201398014040141001416014220142801434014400144601452014580146401470014760148201488014940150001506015120151801524015300153601542015480CGCGCATGGCCTCGGCAGGCTCGACGCCCGCGACGGCGGCGMGGTCTTGGCGMGGTCA15540CCAGGTGGGCCCCGGTGCCGCAGCCGACGTCCAGCAGGGTCGCCGCCGCGGGCGCGCGGT15600CGCGCACCAGCGCGGCGATCCGCGCGGACTCGGCGGGCCAATCCTTGCCCCGGCTGCGGA15660ACACCAGGTCGTAGTGCTCGGCGTGGGCGTGGCCGTAGGTCATGGCGGCCTCCTCTCTCA15720GGTCGTCTCAGATGACGCGGACTTCGGGGACGTAGGTGATCCAGCGCCCGCCCGCCTCGG15780TGMGGCGTGCTCCTTGGCGAGGATTTCCTCGGTGTGGTTCCAGGCGMCAGCAGCGCGT15840AGTCCGGGTACGGCTCCGCGMGGCCGACGACGAGCGGACGGGGATGCCCGAGCCGGGGG15900CGAGCTTGCCGTGCTTCTCCGGGGTGGAGTCGCAGATGTAGGGCACCAGTTCCGGGGTGA15960TGCCGCAGTAGTTGATGGTGGTGGCGCTCTTGGCCGTCGCGCCGTACCCGACGACGGAGC16020GCCCCTCGGCGCGCAGTCCGCGCAGCAGCGCGACCAGTTCGTCGCGGGCGTGGCGCACCC16080GGCCGCCGAACGCCTCCAGGGTGGCCGGGTCGGCGAGGCCGCCCGCCTGTTCGGCGTGCA16140GCCGCTCGGTCACCGCGGCGCTCGGCTCGGCGCCTGCCCGCGCGATGGTGMCCGGATGG16200TGCCGCCGTGCACCGGCAGCCGGGTGATGTCGACCAGCTCGMGCCGMGCGGCGGGCCA16260GGTTGCGCACCGACGTCACCGAGMCAGGTAGAAGTGCTCGTCGTACACCTGGTCGAAGG16320CGGTGTTCGCCACGATGTCGCCGAGGTAGCGGTCTTCCACGACGMGACGCCGTCCGGGG16380CCAGCAGCGCGTCCACCCCGGCGMGATCGAGTCCAGGTAGGCGATGTGGCTGACCGTGT16440TGGCCGAGAAGACGACGTCGGCCGGACCGTGCTCGGCGCGCGCGGCGCGGGCGGTGCGCT16500CCTCGMGMGTCGACCACCACCGACACCCCGGCCGCCCGCGCGGAGTCTGCCGCGCCGC16560CGGAGGGCTCGMGCCCAGGTGCCGCACGCCCGCGCCGCCGATGGTGCGCAGCATGACGC16620CGTCGTTGCAGCCGATCTCGACCACGMCGGGTCCGCTCCGGCGAGGCGGGTGTCGAGCA16680GGTGGTGGGCGTACGCCTCGMGTGCTTGCGGCTGCCGGAAGACAGCGAGGACCGGTAGG16740GGTACTCGCTGTGGMCATCTGCGCCCGCGGCACTTCGGTCAGCTGCTGCACCATCGCGC16800ATCCGCCGCAGACGCCGATCCTGAGGTCGTAGTGGAACTCCGGGGAGGTGTCCGCCGGGT16860CGCGGMCGCGTCGGACACCGGCTGTCGGCCGMGTCGMGMCTCGCGGACCGGTCCGC16920TGCAGAGTCGACATGCGCCCATGCCGGTGAGGCTACGGTCGTGCTGCGTCATCGTCGTGG16980CTCCTAGAGGGGCGTTATAGCGGCATTCGACCGGTGCTGTGCGCGGTCGCGTGCCTCGTC17040GAGMGTTCCAGCGCGCGCACGCTCACGGCCAGTTCTCCTGCGAGGTGGTCAGCGGATCG17100GGTGCCGCCGCGCACGGCCGAGGCGMCTCGGCCATCACGGCGGCGAACTGGTCGAACGG17160CGCGATCCCGACGCGCCGCGACCCGCCGGGGCGCTCGAGCACCACCTCGGTGGCCGCCGA17220CGGCGGCGGCGTGTACGCCCGCGCCGCGGTGACGGCCCCCGCGGTCCCGCACAGCTCGTA17280GGCGGCGCGGGCTCAGCAGCGCCGTCCAGGGACGTCGAGCCGGCGGGATCCGCGTCGCGCCAGCCCGGCCCGGCTTCTCCCAGGCCGGTGGTAGCCGTGCGCGGCTGGCGGCGGCGGGCGCTGCCGGGCAACCAGGTCCGGTCGGGCCGGAACCGGCCGCAGGACGGCGTGTGCACTGCATGGAGCAGCGTCGCGCACGGGACACCCCGAGACCAGCCCGGCGGAGGTGACCGGGGAGCGTCCTCGGCGAGCTGTCGMCMCTCGCTGCCCCTGCTCGGTCCAGGTACGACGGTCGGCGTAGTGGTGGTAGCGCGCCGCCGCACGTCATAGTGCTCCGCGTCATGCCAGACGACCCGGTCGCTCGGCGCACCAGCACGTGGCACCGCGAACCGCGGCGCACGGCGACCGATGTCGGCGCGGCAGGCCAGCGGCCTGGTGTGTCGGCCGCCCTCCTCGGACCAGGMGCGCGGTCGGCGCCGTGCTGGACCGAGCATGGGCGACCTCGMTGAGTCCGCGTCCAGCTCMGCAGCGGCMGGAGGCGGCGCGTCCGCTCCTGTCCMCTCACTGGCGCACGCACCGCGGCAGAGCTGGACCGATGCCGMCGAGGTCGACGACCGAGCAGCGCCGAGGTCCCGAGAGCACGCTGCGGGTGGCTCGGCGAGGCTTGCCCGCTGTAGACGGCAGCCGAACTCTCACCGTGCTAGCCCAGCACCAGGCTGCGGCAGGGCGACCGCTGTCCTCCCATGGTGGCGGGGCCGGGCCCAGCTCGGCGGCCGCCGATGCTGCGTCCACGMCAGCCCGCAGCGGCGACCAGCTCCCGCACAGGACAGCGACGGTGGCCGCCGCTGTCCGATGACCATGGTCGGCGATGGCCGCCGTGCGCCGTTGCAGGGTCAGGTGCGCCCAGGCGCCAGMGCGCGGGCGCGGTAGCCTGGGCAGGCCTGGTGMCCGCGGCGGCGCGCCAGCGCCCTCGACGGCACGCGCCGMCCGCGCAGGCGCCCGACCCGCGCCTGGATGTCACTTGAACCACGACCAGGTTCGMCAGGATCGGCGGGCAACGTCGAGGCCGGCGCACCATCGGCGACCTCTGTCGTGGCCTGCGCACGTGTCGGGTGCAACGGTGCGGGAGGGTGAGCCACCTCGCTGCTTGCGGTTGCACGCGGGCCGACCCTGGTGTTTGCCCGGCTGCGACCGCGCTCGTCCCGCTGTGTGCAGCGCGMTGTCGTCCGATCTCGCATCCGGTTCTTCGGCGGCGGTCGGCGGCCCTCGTCGGCGAGCGGCGGCCTGCCAGCGCGGAGCGGCCTCATCAGGTAGTGCGGCGCGCTCAGCGGGTGCGCCCGCTCGGCGGMGCCGTAAGCCTGGTTCGGMCGCGACCCCGGCCGCAGGATCGCGCCCGATCTCCGCGGCTGCCGTCCGTCCATGTTAGCAGMGCCTGTCCMCTCGCTTGCGCAGGGTCCGGCTCAGTTGCTGCGCGGCCTTGGCCCCGAGCCGTCCACCACGGCGGTAGTAGCCCGGCGGGGCGCGCGCGCCACCCATCAGCACTGGCCGCCATACTCGGCGTGGCAGCGCGCGTGGCCGCGCTGCAGCGCGCGCCCGTCCGCCGCTGTGCCGCCAGGTCCCCGGGCGTGGTAGGGGCGCGGAGGTTCGCGGGGGGGGCGGACCCAGGCCGACGCGCGCGCACCGTCGGCCTGGCGCGGTGCGCGTCCGCCTCGGATCAGGTCGGTCCCTGGCCGCTGCTGTCCGMCCACGCGCAGGAAGTGCGGTGGCCTGCCTGCATGAGC421734017400174601752017580176401770017760178201788017940180001806018120181801824018300183601842018480185401860018660187201878018840189001902019080AGGTGCAGGATTGATGATCGTGCACGGTGACAGCCGCGCATCGGCCAGCCTCGGCGAGGCCGGTGCGGGCAAAGGCCCTGGCTCGGCCGTAGATGCCGCGCCCAGTAGMGGTCGGCGMCCAGTCTGCCGGGAGMCGAAGCCGCTGGTGGTCGCGGGCTCCACACGCCCGTTGGCCGCCGACCTGGCCGCGCCGCCTCCCGGGCGCGCGCACGACGTCTGCAGGTGTCCCTCGAACTCCGGCGGCCAGCCCAGGATCGGCTGGAGCGCCCACCTGCGCTGTTCTCCGCCGGCGTTGACCGCCGTCGAAGCTGGCTCCAAGAACTTGCCGGTCGGCCAGAGGCGTGCACGGGCGCCGATGGCGAGCGCCGTGCATCGGCGGAGCCGMCCTGGTAGAGGGTAGTGCGAGCTCGCGGTCGCAGCTGCACGGGAGACCTCGCTGCTCCAGGGTGCAGCATGGMGTCGCCGGTCCTCGATGGGGGTGGCCGGACGTGCTCGGCCGTGCGCGGTCGCCCGGCGGCGGACATCGGCGACCCGATTCCTCCGCGTCAGCGGTAGGCCGAGGTCGGCGGGCGCTGGCGCGAGCGGCGCCGGGATGCTCGGCGACGGCCGGGCACCGCTGCGGTGGCGGGACGCGCGTCCGGCGGCCGCGCCCCTGGCCTTGAGCCAGGCAGAGCGGCGGCGACCCTCGCGGGCGACCGCGGTGTCTAGTGCGCCGCAGCCGATGGMGTCCCACCCCGAGGTAGGCCGCCGTCGAMGGTTCCGCAGCAGCAGCCCCGTAGTGCAGCGGTCGGGTGCCACCGCGTCCGACCCCGGAGGTGCCCTCGGACCCTTGCCCCAGCGACGTGCAGGGCGGAGGTCCGGTCGCCGCGCCGACCGGGGCAGATCGACCACGAGCGATGCCCAGGTCCGGCCGCCGATGTCGCTCGACGTGCATCGACGGCGGGCGAGCATCCCGTCGACCACTGCGCTCCGCGGTGCAGCGACCTCGTCGCGCGGCCGGCAGACACCTCGGCCGGCCAGCACAGCGCGTCGCCGAGCTTGCGCCGAGACGGCAGGCGCGGTCCGCGCTCGGTGCACCACCACTGAGCGTGCGTGGCGGCGCTCCAGGCGCATCGCCGACACCCCACCCAGTTGCTGGMCACTGATGGACTGGCGCGGCGAGGGCAGTAGTGACGCGGCCGGTCGCCGTGCGGCACACCGACGGTCGCGCACCGGTCTCCGGTCCACGCCCGTCGGCCCGGACGGTCATCGCCGCGGTGACGGGCGTGGTCCCGGGTAGCGGCAGGTGCGGCCGGCGGCGGGGCGCCGGGTCGTCGTTCATCGGCCCGCTCGCCCGCGCTCGGATCTTGCCGGCCGATGGCGGCACAGCGCGCGCCTTGGTGCGGGTCGACGGACGMGCAGCGCCAGGAACGAGGTGCGCGGGACGCGMGATTGATCATCCGCGMCCCGCAGCCCGCGCCGCGCCCTTGGTCGGCCACCCGGCTCCAGCCTCGGGCTGGGTCGATGCCGATCGGCAGCCCTCGCGCTGCCGCGGCGGACGCCACCCCCGTCGGCGTCGGGCCCCGGGGATAGGTCGTGTGGCAGCTGGAATGTCGACCAAGGAACTCGCACCGAGCGGCGCCTGGGCGAATGTGCTCTGTGGTCGAAGCGAGGCGGGCGGCMTCCGGTGCCGGGGTGATCGCAGAACAACGGTGGGCAGTGGCCTCGGGCGAAGCGGGACCTCGCCCATCGGGCCTCCTCGTCGGCGCAGCGCGGCGACCGMGGTGATTCGCCGGGTCGGACACCGA191401920019260193201938019440195001956019620196801974019800198601992019980200402010020160202202028020340204002046020520205802064020700207602082020880GGCAGTCGCATCGCCTCCTCCGTGCGCCGCCGACGGTGGCCGGCGGCCAGACGCCAGCACAGCGCTGCTTGCGCCGGGMCCACCAGGTCCGGGGGCGMTCGGGTGGTTCGTCCGCGCCGGTCGCGCAGCCCGCCAGAGAGGTGGACGGGACGACGGCGTGCCGCGACAGCCGCGGCGCTCGCGGTTGGTCGATGACCAAGCCCTTCCTCCCGGGTGCCGTGACCAGGGCCGCCCCCGGTCGCGGAGCCCGCTGGTCGGGGCAGGTCGGGCGTAGTCGGCGGCAGGCGGCCGGTGGTGCCGGCTCGGTGCGCCACCCCGCACCGCGATCCACGTCCGCCCGGGGTCGGGCGAGCCGMCGATCACGMCGCCCATGAACGCCTTCGGCGCGCCGCCACCGGCCCCGCGCCGGCGTCGGCCACGGTGTCGCAGGCCGTGCGCAGGGCGGTTCACCGCGTCTCGCCGCGCCGGGTGTCCCGCCGAGCCGACCATCGGCGCGCGACCGCGCCTGGCGAGCGCAGATCATCAGTGAGCGTGCCTGCCGACGGCCCGCATCGGCCGTCGGCGATCGACGACGTCCGGCGMGCCGCCTGCCCTGACCCAGCCGAGCGAGGTCCGCCGGTCTCCACACGGGATCTTCGGGCGCGGGCGGCGCGCTATCAGCACCCCGGMGGTGCGGCAGCGCCTGCTGCGGCGCCGGTACCACAACGGCCGCCCGCCACCTCGTGGCGGCGCCTGTAGCCGCGCCGCCGCGTCGCAGGCAGGACGCCGACGTCGCAGGCACAGCGGCGAGCCTGGGGAACCAGCGTCGACCAGCCCCGGTGCCGCGGGTTGGCGGCTGCGGGCCAGGCGGGCCGGGCCATCAGGCACCGGGCCTCGGCCACAGCGGCCCGGTGCAGATCCCGAGCCCCGACCGCCCTGCGGCACCGCCGTCGGCCCAGCGCCTCGGCGCTGCGGGGTACGACTTTGTCCAGGGCCGGCCAGCTCTGTAGGCCGCGCTCGMGMGGTCGGGGTCGGGTGGTGACGGGTGTCAGCGTCATGMCTACGAGCGCGGGTCGCGCCCCMGGTGTCCGACCAGCCCGCCCCAGCGCCTGCGCGGTCGGGTGCCGMGCAGCACGMCTACCAGGTGGCAGCAGCTCGCTACCCGCTTTTCGGCGAGCAGGCCGGGCGGCCGTCGACGTGCGGACGCGTGMCGGCGGCCTCCGGCCGGGCCCGCGGCGCTCGGCCTGCGGCGGTGGCGCAGGTCGAGCCGCCAGGTTGGMCGGCGCGCCTGGCCCTGGCGCAGGCGGCTGCGACACCGAGCGCGGTGCACCCACTGGCATCGCTCCTCCGGGAAGCGCCAGCATGTGAGCCGMCGTCGTCCGGCCACCGCCGGGATGCGTGGACGGCGCGCACCCTTGAGCACCAGCCAGGTGCTCCGATGAAGTCGGATGCCGCGCCGCCCACGCGCCGGGTAGCCGAGGTCGGCAGCCGGTGGACGGGCTCCGGGCGAGCCGCAGTCAGCAGCGAGCAGCTGCCGCCAGGAACGTCGCGCAGGAACGCCGAGGAGCCTGGTGCCATGMGTCCGGCCTCGMCGTGCTTGMCGGTCGGCACGTCCGATGTGCGTTGGTCTCGGCGCCGGGGTCGACGGCGCCGCGACATGGCCCAGGTGCCGGCTGCGCCGGGCGGCGTGCCGGTCGTAGCGCGGCGTACTGAGCCCTGGTGGCCCGACGCCGCTGGGTGGGCCACGATCCGGCCGGMCGCGCAGCGGGATGGGCCAGCTCCCAGCGCCCGCCGGCGGCTCC209402100021060211202118021240213002136021420214802154021600216602172021780218402190021960220202208022140222002226022320223802244022500225602262022680GGCAGGGCGTTGGCCCACCGGCGMCCAGCTAGTGCGGGTATCGTGGTGGTCGTCGGCGAGTCAGCACGAGTGGCGAGCGCGCATCGACGGGACCGTCCAAGGTGGATGAAGGCCGTCGATTCGGCATGTTGGTTGGCGTGTGCCCGGACGCAGGCCCGGTGTTGGCGCCCCGGGCAGCCCGATCGCCACCGAACCGGMCTGCGTCGACGGCTGGCGATTGAGCGCGGCCGMCGGGGACCGCGGCGMTGMCAGGTGCGCCGATCATCGCCGTCGGCAGGAGTCCGCTGTCCGAGACAGGAGCGCGCCGGAGAACCGAGTCCCACACACGGGTTCTCTCATGGCGGTGCACGCTCTTCGACGTAGCCGGCCGTTGACCCTCGGTCTCGCGGCTCGCGCGGCGATCTGCGTACCACTGCGGGGATGTCGGGTGGTCACTTCTTTGAGGCCGGGCGGTGCAGGCAGTAGGCGCACGGGCGATCGTGCCCCACGTTGCCGCTCGCCTGCGGGCCCCGCCGGATCGGCCAGGTCGGCTTCGCGCGGCCTGCGATGACCAGCGGCGMGGTGGGGCAGCGCGGGAGCGGATGCGTGTACCACGCCGGAGACCGCTGTCGCCGCGACGAGCGCGACGAGCGCGTGCCTCGGCGCTTCAGCTCCGTCCGGGTCGGGTGCCCTGCGGCGTTGAGCGGCCGGGCGCCCCGTCCGGGCAGCGACTTCGTCGMGCCGGGCGGTTCCCTTGTTGTGGGACCMGGCGCTGCCCGCCCCGCGGTCGGCCGGCTCCAGCGMCGGCGGGCCGCAGCAGGCACGATCATCGGTGCTGCGGTGCCAGCAGCCTCGCGCGCGCTTGGCGACCTCTGTCCATGAGCGGCGCGCTGTGAACACCTAGCTCGAAGAACCGCGGCTTMCACCGCGTACCGGGGCGCGCGTCGGCGATCCTCTCAGGGACCAGGTGCGTGGCCTCCAGGCAGCGCCCGTGAAGCTGAAGCAGCATGTCCGGTGAGCTTCCAGGTCGGACGCCCTCGGTTTCCCGGGTTGTCGATGCGGCAGCGCGGCGGCCGAAGGTCGCTCTCGGCGCACGCCCAGTCTGCCGCATCGGGCAGTTCGCTCGATCCCCCATCGCCGAGGTCGGTGAGCGTAGTCGGTTGGTCAGGTTAGAACGGCGACGGCGGCCATTGCGCAGCTCACTGGGTGATGCAGGCCGCGGGCACTGGGCCCGCGCCGCGGGTCGACCGGAGTCCAGCTGGCGCCCGGTCCGTCGACGGTCGGCGCGCGCTCCGCACGCCCCCGGTACTGTCTTCTCGATAGACGAGCAGGTGCGGCCTCGGGTCGTCAGCACGGCGGCCGGCGACCTGGCAGCACCGCGCAGGTTGACGGCACGAGCACGCACTCCTCGCGGGTCGGACGGCCATGAGCGAGCCTGCGGGTCCTTGAGGGACGCCGAGGCGGCCAGTCCGAAGTAGTCGCCGCTCGAACGGTGTTGMCGCTCGGCGTCCAGCATCGGCGTGGGTGGCGCAGCCGCGCGCTCGACGGGGGACCGGGGTGGGCGACGGTCGTTCCACGGGGGCGATCTCCCCTGCCGAGCGGCGCGGCGCCCAGMGCCGCACGGCGMGGTGGCTGGGGCTGTAGGGCAGGATCGATGCCGGCGAGCGGGTTGGCCGCAGCCTCGGTGTGGCTCCGCGAGCGACCTCGCCAGACCATCCAGCTGCCCGAGCGGCGTCGATAGCGCATGAAGCTGCTGCTGCCTCCGGCACGCGCCAGGTATGTCCACATGGCGCGTAGTGCGTTCTCCT227402280022860229202298023040231002316023220232802334023400234602352023580236402370023760238202388023940240002406024120241802424024300243602442024480CCGGCATGGCCGCGCAGCACCCCAGCGCAGGAGTTCCCTGGTCGTAGCGCGCGGGCCAGCCGGGGCGACCGTTGCCGGAGCGGGATGTCCCAGGATCTCCCTCGGGGTGGGCCCGCCATCGTCGTCGTCGGCGGACGATGGMCCCGGACGCTCTCGTTCGTCCGCCATCGTGCCTGGCGGATGCGCCGCCGGGCTGGAGGGTGCGGCTGCCAGGCCAGGGGCGAACTCCCAGGCCCACTGGTCACTGTGATCAGCTGCGGCGCACCCGCAGGCCAAAGCGCCGCGGACGTGCACCCTGGCGTGGCCATGGACGTCGGCCCCCGTCGGGCGGGTAGTAGGAGGTTCGGGAGCCGCGCCGACTGGTGACGTCCGAGCGAGATCGGTGGCGATCCACCGCGCCGGMCAGCGAGCAGCAGGACGGAGCTGGAAGCCCGACGGTGCATGTCGCGGGATGCCCAAGGTCGMCGATCTCGGCGCCAGCGGGTGTCGGTCGGCGGMGCGGTCGTTCCCCGCTCTTCGGGCATGGGTGCTGTCCTTTGTCCTGGGCGCGGTGCGATCAGCACGTGGGTTGTTGTGCGTCATCGCCCCCACGCGCGCCTGCGCGGCAGCGCCGGGCAGCGCGGTGGTGMCAGGTTACCGGGTCAGGGCAGMGTGCGAACTTCTCCGMCACGGTACTTGGCCACCGCCGATCAGCGTAGMCGCTGACCGTGGATGAGCGTGCTCGTAGCGGCCGGCGGGTCAGGCAGGTCGCAACGGCCCGCGGCATCGCGTCGGCCGGGCGGAGMCCCGGTCGCCGAGCGCGCAGCTTCACCGMCGGGCAGGCTGTCTTGTGCTCACTGCGCGGACGCGGGTGGCCCAGGCGTGTGCAGGCGCCAGCCTCGCCCACGGCGTGCGGTCGACTGAGCACCTTCGGCGAGTGCGCTCGCCAGCCAGGCGCAGGCGGGCCGCTGGGCGTCGGGGGCCGCCCGCCCGCGMGCCGCTCGGGCCGCGTTGCCGMCCACCAGCTCCCAGCAGGTCGGATGCCCTGCCTTGGCGGCCGATGATCCGGCGCTTCCAGCGGCCTGCCGCCTGGGAGATCGTCGACGCGGGGCCTTGACGCTGCGCCACCCTTGCGCTCGGCCGTCCTGGGGTCTCCCCTGATTCCAGGCTACCCCAGGATAGGACACGAACCCGGTCCATCGTGCATCGCCCGGTGATGGAGCCGGTTGGACGCTCATGGGGACCGCGTATGCCCTCCTCCGMGGCGACCGMCACCTGGGATGGTGGGTGCCCATCTTCGCGCAGCATGCACGGCGGTCGTTGGACATCGCCGAGGTAGCGCCTCGCAGCTCGGTGAATGGGCAGCTTCGTCGAGCATGGGTGAACGGAGCCGCCGAGCCGCGCCCTTCGCCGTACTGGCTCGTTCTAACGGGTAGGCTGTCCTGGCGTGGTGGTCACCGCGTCGACACGCCTCCAGGCAGCACCTGGCACCGCGGGGGTCGCCCGCATGTGCGGGTCGGCCCGCGTCGATCACCGGCGAGGTCGCCGCATCTCCGCGCTGGCGGGCCCTGGTCGCGCGCCCGGCATGCGCCCAGCGGCGCCAGCTGTGCTCTCGTAGCTGGGTCTCTCTTGCGCTTCGAACGCGGCACTCCGGCCTTGTAGGCGTACCTCCTCGGTCCTTGTTGACAGGTGAACACCGCGGTTGATTGGTGATCAGCCCGCGCCCATCTTGCCGGTCGTCCTGGGTTGGCGTGCCGGGGCGTGCCACTCCGGGATGCGCGCGCCGGACCGGCCTCGGAGCGCGCCC24540246002466024720247802484024900249602502025080251402520025260253202538025440255002556025620256802574025800258602592025980260402610026160262202628046CGGTTGGCCAGCAGGCCAGGGCGMGAACGATGCCGTAGCACCACGATGGCCGTACTTGTTCCTCGGCGGTCGGCGTCGAACCTCCCCGATGCCCGCCCTAGCTCCAGCAACGTGCAGCGGACGMGAACTTCCTGCACGCAGGAACGGGCAGCGCCCACGGCGACGACCCTCGGCCAGCCGGCAGCCGCGGCCGGGGCGGGGCGCGMCCAGCGGGGCCGGTCGGGTCGCTGCACCGAGCAGGCCGAGCCAGCGACCCGGACTCCGTGCGTAGGCGGTGATGCGCCGGGGTCGCGGCGCGGACGGCCTCCGTCGAGGMCGGCCATCTCCCATGCCGGTCGCTGCTGTCCGTGCTCGGGCGGTGCCCTCACTGCTCGGCCGACCGCGTCGCCAGTAGCGCGGGCGCTATCCCGCCACACTCCTCGGCGCACGACGTGACTTGGCCGCGTTCGCGGGTCTCGGMGMCGGCGGTCAGCTCACGAGCGGCAGCCCGGCGCGCGCAGAGGAAGGTCGATCCGCGCGGACGACCGGGGTAGAGCGGCGGTGAGCCAGGTCGACCGGTGGTGAGAGCGCCACGTCGAGCACCAAGGGCCAGCAGGTGTGCGCGGCCGTCGMGGGCGGGCGTCGCGCTTGCTCGCCGMGTAGGGCGTACTCGCAGCGCCGCCCGCCGGGTGCGGCGTCGGTCCAGGMGMCCCCGTCGGTGGGGTTCACCGTCCCGGCGCCCGCCGGGGGTCGAGGTAGTGCGGCGGCGTACGTGCCGGGGCCTGGCGCTCGGTCCAGCACGGTCGAGCTGACCGGTAGAGGCTCACCGTCCGAGGTCGGCCGACCTCCAGTGTCGGCCTGACCGACCGCCTGCCGTTGACGCACGACCGTGTTCGCCGTCCGTGCTGGGCCGCAGCGGAGACGTACGGCGAGGTCGGTGGGACTTGCCGCTCCTCGGCGAACGCGGCGGAATCGTCGGCTTCGGCCAGGTTCGGCGACCCCACCCGTGGAATCAGGGTGTGGCATCGCAAGGAGGCGTAGGGCGCGGGCCCGGCTTGTGCGTCGCGCTCGCAGCCCGGCCCAGCCCGTCCCAGCCCGCCGGTCCCACAGCCATCGGCGCGCTGTGTGGACCAGGGTCAGCCGGGGTCAGCCCTCGGCGTGACCCAGCAGACACGGTGAGGCGGCGGCAGCGGCGCGCTGGGTGCGGGTCGCCGAGTGCTCACCAGATCACCGCACAGGCCCGACCGCGCGCAGCCACGCCCGCTGTCCGGGCGCCTCGCGAGGCGCGCAGGCATCCGCACTCGCGCCGGACCTGGTCGGCCCTCCGGTMCCCTCAGCTCTGCTTGGCCAAGCCGGGCGCCCGTCGGCGCGCGCGCCGCCAGCGCGGGCAAGCCGCACCCCCGCCCCGGTGCGGCCGGGTCACAGGGCCAACGCCGGTCGCTCGGGTGCATGCCTGGCGATCGCAGTAGCTCGTCGGCCTGCGTCGACCATCGCGGACCCCCGACACCGCGGCGAGCAGGGCAGTAGTGGGCGCAGCATCCAGCGCGTCGGTCCGGCCCGCGGGTGGATCGTGGMCTCCCTTGCCATCGCCGGATGTGGCTCGCGCAGCGTAGCGGTGCGGGTGTGCTCCGGGGAGGCAGCACGTGCAGTGCGCGCCTGGCACCGGCGGACGCGTCGMGGTCGGCCACTCGGCCGGTCAGGTGCGGGTACAGGAAGTTGGCGGCGGGTCGCCGGGGCGGGTTGMGTTTCGTGTCGCGGGGAAAAGMGCTGCACCCGCCGAGGCCAGAGCCGAGGAAACATCACCGC263402640026460265202658026640267002676026820268802694027000270602712027180272402730027360274202748027540276002766027720277802784027900279602802028080GCTCGCCTCGCGCGTGGTCCGGCGTCGTCCCAGCAGCGCGGGCGCGCATGCAGCGCGCGCGTCCTCGACGCACGGCCGCCGAGGCCGCGGGGCGGCCAGCGGCGAGCAGAGGGCCGGMCGCGCACGGCGGTGCAGCTGGCTCCCCCGCCCGGCGAGGGCCCGCTTGGCAGTGCACGTCCGGCCAGCGCCCAGCTCCGCGGGGCAGCGGCCACGGCCCTGGCGGGCGCGCGGTGCGCGTCCACGTGCGGAGGACGGACGGGCCAGGTCGAGTGGCGGCCACCCGCGGCGCTCCGGGTTGAGCGGGCGAGATCGCCGAAGCAGCAGCGGCAGGCCGCCAGCGCCTCGCGGGAGCTCGGCCAGCTTGCAGGCAGCCTGCTGGTGGCACAGCCCCGGCGTCGACCGACGAGCACCGTCGTCGGAGGGAGTTGTTGGGTCATCCGCGGGCGCCGTTGMGACGAGGCTTGCGGGTCGCCGGAGATTGCGCGCGCCCGCGCCTGCGGMCCGACGCGCTCGGCGTAGCGGCTCGCGGCACCAGGCCTGMCTCCCCGCCCACGCATCGGGCCGACGGCACACCGCCGCCCGCGMGCGACTCGGCGCGCGGAGAAGGTCGGCGMCCAGGCGCTGTGTCGGCGTGCGGGCGGCGGGCAGCCCGGTCGGTGMCACCGACCTCCTCCGGCGCGGACCGAGCCGGGCCCCGCACCAGCGCCCTCCAGTGAGCCGCACAGGCGAGCAGCCCCCCAGGGCGCGGTAGGCTGGTGTCGMGCTGCACGCCTCTCCAGCTCGCGCCGCGACCGGGAACGCGCGGCCACCTCGGACGGCGCGCCGCCAGCGCCGCTCATCGCCACCTGCGCGGTCGMGCCCCTCCACCACCGTCGACGGGGGAACAGCGCGCGCCTCGTACGMCGCGTACGAGCAGGTCCCGCGCGGGTGGCAGCCGACGGCGCCGCGCGCTCGGCGCAGGGCGACCCGGGAGCTGGTCGGCGCAGGTCGCGGCGAGTTCCGGCCTGCGCCCGCAGCAGCGCCGACGCTGCTGGGCCCCGGMGCTGGTGCGGGTCGCCCGCGCTGGMGGGCGGCGTAGCCACTCGCCGGTCGTTGTGCGGGGACGACGCTCGGCGTCGGGGCAGGCCGGGCATCACCGTGGACCCCTCAGGACGGCGTGCGCCGACGCCCGGTGACGTCGCCGCAGCAAGCTCCACGAAGGCCCAGCTAGGTTCTCCCCCGACGTCCTACCTCCACGAGCGGGCGCGTGCCAGCGCCTTCGGCCTGGTATGGTGCCAGTCCTCGGTGCTTGGCCCGGAACGGAGACGGGCACCCGCGCAGCCGCGCCCATCTCGGTGAATCGTGCTCTGCGTACGCGGTCCTCGCCGAACCTCCTCGGACCCGCTCGGACGTCGCGGCGCGTGCAGGGGCGGCGGCCAATGGTGCCGCCGACCTCCCAGGTCGGCTGGGGCCGCTGAGCGAGCTGGCGGGACGGTGAACCGGGCCGGGCAGGMCACCTCTCCACGATGGTCGCGCTCCGTACAGCGCACCGGGCCACCGGCGAAGGCGCGCGGTGCCCGGGCAGGCCCCGCGGCGTCGGTCGTGGTCTCACCTGGTCCGTGCTCGCCCGTCGACCCGGCGCGACCCGACGCGCCGAACCGCCCTGCGTGACCTCCCGGGGCGACGGCCCAGCGCCTCCGAGGTCGCCGCAGCTTCAGCGTCGGACAGGCAGCTCCCAGCCGGMCAGGTGGGTGCTCCAGGGCGTAGCCGCGCCGCGGGCGCGGTATCGCGGCCAGCGTCGTCCTCG281402820028260283202838028440285002856028620286802874028800288602892028980290402910029160292202928029340294002946029520295802964029700297602982029880GCGACCGGGACGCACGGCGCCGGGCCGCCGGCTCCGGTGATCCAGCGGTCGCGGCCTCGGACCGGGGGCGAGCTCGACCGGCCGCGGCGTGCCGCCCGGCTACTTGTAGGGCGTCGGCGGTCGACCAGCTACGTACGCCTCGCTCCCCCATCGMCCGGACGGCCMGCGCAGTCGACGCTGCTCGGCGACGACCAGTCCTGCGCCGGTTAGGTCAGGCCCCGCGGCCAGCGCGCAGCGTACGACCAGCGTCATCAGCGCGCCGGGTGGCGGTCCGGGTGCGACGAGCCAAGCCGGTGAACGAGCGCGCCAGCACAGCCCCCTCTGCCGCACCGGCGGCCCGCGCACGGCTCAGCGCGCTGCGCGGCGCGCCGCGMCACCCAGGTCGACCCAGCGCGACCGTTCTTCCAGCTCGCCGAGCGTGCCGGTACGGTCGGGTAGGTGCGTCGGCGGCGGTCATGGGTGCGTACGCCAGCCGTCGGTCGCCGGTGGACCGGTAGGCGGTGGCCGGTTGCGGCGCCACGCCGGACGCCGGGCACGCTCGCGGGCCCGGGTCGGCGGAGCACGCTGCGCCCCGGCTGGTACACGGCCAGCTCCGCCGTCGMGCGGGGCCTCCGCGGTGCAGCAGGGTGCGAGCCCGGCGGGCCGGCAGGCCGGGCCTCGGCGGGCGGCCTCGTCGCAGGACGGCGCCCGGTGTCCGAACCGGTTGCGCGGCCCGCCGGGTCGTAGCATCGACCCGCGTCGGGTTGGCCGAAGGTGGCCGCCCGCGGGGGTTGGCGCACGGGMCGGGCAGTCCCGMCGTCATCGAGTTCTGGCAACGGCGACGTTCGGCCAGGGTCGGGCAGCGAGCATGGCCACCGATCAGCTCCGGCGMGAATTCGATACTTTGCGCAGCATACCAGCCGGCCGACCGCGCACGGCCTCGACGGCGCACCATCGACGGCCAAGCCGCCGGAGGCTCGGCCGCGCCCGTCGAATGTCGCCGAACCGCGCCGAGCCACCAGCAAGCGCGGCGCTGGCTGACCCCCGGACGGGATCCGGTGTGGAACAGCAGCATAGACCTTGACCCTGCGGGTGGTGCGGCACCGCCGCCCGCGGACCGCGCCTGGTCTGGTCCGAGGTCGGCCGACCCGCCCCGCCGACCAGGCCCGTCGGCCGTGCAGACCCGCGCGGCCCCCATAGTGGAGCGCGTCCAGGGGCCAGCCCCGCCGGAGACCGTCGGCCAGTGACGCCGGGCCGGCTCGGCCAGCGCGCGAGGCAGTCCCGGGCCGAGCAGAGGCCGCCTCGCCGGGCGGCGCACGGCCGGGGGGCGCGGGGGCCCGCTTCTCGGCCTGCGACGGCATGCCGCCGGTCCAGCCGGCCACGGCGCGGCGCAGGCATCCCGGCCAGGCGGGGCGGGCACGACGGACCACGAGCGCGCAGGTCGCGCATCCGCGGGAGTGGTCTGCGCCTGCGCGCCCGCGATGGTCGTCGAGCCAGGAAAGCCCCCGGCGTCCCTCGACGCGGCGCCGCCAGCCCGCACCGGGGTCCAGCAGGGGGCTGGCGGGCGCTCCAGCCCGACGCCCCGTCCTCGACCGGCGACGCGGGAACTCGCCGGGGCAGCGGGGCGGCCCAGGGGTGTCCACGCGGGGCGTAGGCCCGCCGGGCGCGCCCGCGTCCGTCGGCCCGACTCGGTGTCCTCCCCGTAGGTCGCGGGACCCGCACGCACGTCCATGCGGCTCGCGCTTCCAGCAGGATCCATCCTGGTCGTAGGAGTGCCTGCACCGCTGCTCTCCGCGGMGCGGAGCGCCCACCA299403000030060301203018030240303003036030420304803054030600306603072030780308403090030960310203108031140312003126031320313803144031500315603162031680TGTCGATCTCCGACCTCGCGTGGAGGTGTCGCTCCGGCAGCGGTGTCCCGGGGTGCCCAGCCGGGGCGCTCGATGGTGCGACCGGGTGCCCCTTGAACAGCGGCGGTGCGCCGGCACGGTCCTGCCGGTCCAGGGCCGTCGCACGCCCGGCGCCGCGCAGACCCCGGCACCGMCAGCAGTGCGGTCCAGGCCTGCCCAGTGATCACCGGGTCGCCGAGGGCGGACCGCGGTCGCCGCGCGCCGACGCCCGGGCAGCGCCGAGGAAGCCGAGGCGGCAGGGCCCGCTCCCCCACTCCAGCGGGCAGGGCGCAGCCCGTGCGTAGAGGMCCAGCACCCGCGTCGMCCGGCGTCGTCGGGCCGGCCGCCGGCTGCTGCGGCAGTTCCACCCCCGATCCCGCAGCGAGCGCGTCCGCCTCGGACGGTCGCCCGGACCGCTGCCCGAGGGTGGTCCGGGCCGCCGGCTCGCCCGGCCTGCCACTCGGCGACCCTCGTCGGCGAGCCGAGAGGMCGGCAGCAGCGACCGCCTCCGGCGACGGTCGGCGACCTTCCAGCGCGGTGCACGGGGTGCGAGCGAGGCAGGCCGCGTGCGGCCAGCAAGCCTGCGGTAGCACGGCCTGCGGTCTCACTCGCCGCGGCCGGAAACGGATCGATCGCCCCGGTGCAGCCTAGGTGCGGCGAGCAGGCGCGCGMCAGGTGGGCCGAGCTGCCCCGCCGCGTCACGCCGTTCGGCCATCCMCGTGGCGGMCGGCGAGTCACAGCGGTCGTGCCCMGCAGCACGGTGTAGGMGCCGGGTCACCGGGCGGTGGGTCACCCGGCCAGGTCGCGCAGCAGCGAAGTCCGCTCGCCGTCCACAGCCCCGTGCCGCGGCGACCCGCCGGGCCCGACCTGGTTACCAGGCCATCCTCCGCGGACGTCGTGGCGGCATCGAGTAAGCCCGGCTCGGTCGGCGACCGGCGTAGCGCCCGGCCGATCGATTGGGCTAGTCCTTGGCTGGGCAGCGGAGCTCGCGCACGACCACGGTGCTCGCGCACTGTCGCGCCGTCGCCGTGCGCGATGTAGACACTCCACGATCGACGCCCGCTGCCCGCGACACCTCCCGGGGTCGGCTGGCGGCGACCGGTCGCGTTGCCGGGTGCGCACCCGGGCGTCCCCGGCTCGGCGCGCCCGGTACGACGCCGTGGGCGCGCTTCCCAGGMCGAGGTTGCCGAGCGGGGCCCCAGCGCCCACACCGGCGTAGGACGTCGGCGTAGCTCCAGGCCCGGCGGGCTCGCTGCAGGTCCGACGGTGTCGCACCTCCCTCGGTGGAGTCGCACCTCGCAGCAGCCGCTCGCGAGGACTCCGGTGACCAGGCAGCGAGCGGCAGGTCGTGGGGGCGGGTCGCTGCGGGGCCATGGCGGCGATCGGGCGGGCGGGGCCAGGTACGGCGTGCGCGCGCCCGGTTCGGCGGCGAGACTGCCAGCCACGCCTCCGTCGGCGAGCCCGCGGCGACATCGCGCTCGGGCGCAGCCGTMCGCGGCCCCAGTCCACGAGCCTCGGGGTCAGGCCCGCATCCAGGACGGCGCCTGCCCCTGGCGGACCTGCGTCCAGTTGGGGTGAACAGGCAGCAGCATCCGGGCTGCACGGCGGCCAGGGGCGGTGTCAGTGCGGGCTAGGTGCCGATGCTCGCCGAGCGGAGAGCCGCCACGTGGGGGCACGCGGCGGCCCTGGGCGGGCGACGGCCTGCGTCGATGCAGGCCGGTGGGTGTCGGTTCAGCGACGCCCGACGTCCATGCCAGCGGTCCGCGCGGCA31740318003186031920319803204032100321603222032280323403240032460325203258032640327003276032820328803294033000330603312033180332403330033360334203348050GACGAGCAGCCGGGAGCTGGCCAGCCCGCGCGGGGCCGGGGCCGTGGCGCCGGCTCGGCCGACGTGCTGGGGTGGCCCCGCACTCCGGACCGGGCTGCCGGTCGACGGCCGTGGTCGAGGGGCCTCGGGACAGCGCGGCGGGTCATCCTGGCGCTCGCGCGTTGCCCGCCGGCGCACAGGTTCGTAGGCGGTCGTCGTGGCATGACAGCTACGCGGCTGGGACGCCGAGCGCGACCTTGGTAGACGAGGACCCTCGGCGTGCCTCCCCCGATCCCGTCGGTGCTGGTTGTAGGTTGCGCACTGCTGGCGCTCTGCCTCGCGTGGCGCCGAACGTCCGGGCCTGCACATCGGAGGTGAGCAGCGACGTGCACCGACGGGGGGGCGGCGCGGGTGGCGCGCAAGCACGACCTGTCCAGGCCATCGGTGGAGACGCAGCGCCAGTGACCGGCCATCCAGTCGGAGCGTGTCGATCGGCGACGCCCCTTGCCCCCGGACGMGATCCCGTTCGGGCCGCTCGGCCGACGACGCGCGTCGGCGACCGCCGTGCAGCGMGCGCCCGCCGCCAGGTGGTCGGTCCCGGCCGGGGTCCCGACACCCCGCTCCACCGGCTTCGCCGAGCGATCCGGTCGCACCGGCTCGGTGCCGCCTGCCCGGCGCCGCGCGGCCAGCCGCGACGACCGGCCACCAGGCCGCCACTGCGTCGGTGTCGGTGCGGGTCCGATCCTGGCCCCCGGAGCCGGTCGGCGTGGGGCGTGCTCTCAGCCGGGCTGCGCTCGCCGGATGGAGMACGCGTCGGCGCTGTAGGCGCTCCGGCAGCGGCCACGAGGGCCGGGCAGCCTTCTCGCCGGTAGTCGGTGGCCCAGGCAGCTCCAGCCAGCTGGTCGACGGGAGMGCGCGTCGGCGATCGGAGAGCAGCGGACACCGCGGACCCGCTCGGCCGGTGTGCGTCGAGGTCGCGCGGCCGGGCGAGCGGTGCGTAGCCGGAGCAGGTCGGCGGGGGAACTCGGCGCTCGGCCGGTGGCGATGGCCGACGAGCGTGGTCGAGGGACCGGGTGCGACGGAGCGGGTCGAGGTGGGGAGCCGTGGCTTGACGGCGGCCAGGGCCAGCGGCGCAGTTGCTCMGGCGCGAGCAGGTCCGTCCACGCGAGGCGACGTCAGTCCGGGCACGGCTTTGCGCGACGGCGCTCCCGCACCAAGGCAGGTGCGGGCCGACCAGTCAGCCGCGACCACCGCGGGTGCGCACCAACCTCGGCGAGTCGCCGCCGACGCACTCCCACCGTGGCGAAGGGCGGCCGGCGAACGCCGGCCTCGGCGACCGAACTCGGACCGGGCGGGMCGCCAGGTTCCACGCGCTCTCGGGCCGTGCGMCACGGTCGTTGCGCAMGCAGCGGGGTTCCTCCGGGCTCGCGGACCGGTGTCGGCGGCGCTCGACGGCCTTCCAGAGCCGCCGTTCCGCGACGGCCCGCGACCGGCGGTCTCGGCTCCGGACGCGTGGCCGAGAGCCTGGTCGGTGCGGGTCCTGCCGTCGCCGCCCGGGGCCAGGGCGGGCGAAGGGCCAGCCCAGCACCAGTCGCACGGCGACGGTCGGCGTCCCAGGTCGGCCCACGACGGCCCAGCGCGTCTCCGCACCCTGGGCCGGGTATGAGGMGCCCGGGCAGCCCTCTCCACCAGGCCAGACGCCTGTCGGCGCTCACGCATTCGGTCGTCGGCCGCGGTGGATGGGCCCTCGGGGCAGAGCCTGGCGGCGCAGCGACCGCGCCGGACGCCGACGGGTGCCGTAGCTCGGCGCCC51335403360033660337203378033840339003396034020340803414034200342603432034380344403450034560346203468034740348003486034920349803504035100351603522035280AAGTGCCCGCAGGCACGCCGTCGGCGTGCGAGGCTCGGGAAGCACCGGCGGCGATGGACTGAGGTCGCCAGCCAGGCCGGGCCACGGTGGCGGTAGGCCCTCCCAGGTCGCGAGTGAACGCGGGTTCCCGGCGAGTCCAGGCCAGMCTCCCGCGCCGTCCCTCGCGCTCCGAGCCGCTCACTCCGCGAGCGGGGTTCTCCGGCTCCGGGCGAGCCGCACAGTGGTCCACCGACCGGGCAACGCGGCGATACACCGGGGATCCTGCCTCACCTTGGTGCCCCAGGMCTGCGTCCGGGCTCGCCGAGGAACGGCGGCGAGCGGCCGACCAGCACGGTCATGCATGCCGTCCCCAGGAGTCCACCCCACMGGGCCAGCTCCCACCGCGAAGCTGCGGGGCCGCTCTCCCCCCGCAGCGCCCTGCGCGAGGCGGCCGGGCCCTCGACGGCGGAGGAGCACCCGCGGACTTGGGCAGCGATCCGTGGTGCGCCTCGACCAGGGAAGMGCCGGGCCAGCGGTCAGGGCCGCGCCGGCCGTGGCTGCGCGCCGACTGCCGTCCGCCGATCGGGGCCCGCCTCGCGAGGTCGTCGCCCGGGCTGCAGCGTTATGCGCGGGGACCGTCGTGCGCCGMGMGGMGGCGGAGCAGGGCGTGGCCGCGGGCGCTCCGCGCCCGCCCCAGCGAGACCGACCAGCGCGGCCCCAGCGCCATGCCACCCCCCTTGCGGGGGGTCGTTCTGCGGTGAACGCCGTGCACGCAGCGTGCCGTCTGGCGCGGTCAGCGGCCGGACCCCGMCCGTCAGCACCACCGCCGAGGTACGTACTCCACCGGGCAGGTMGTGGCCGTCCGGCCGCCTATGACGGCCGATGCGGCCCATCCTCGTTGCATGACGCCCGCGGCTCGCGTGCCAGCACGGGGGMGACCAGCGGAGMCTTCGCCGTAGAATGGCCAGCTAGCGGCCCGTGGCCCGGMGAGCGACTCCAGAGCGCTCGCACGCCAGTGTACCCTTCGATTCAGGTAGGACGCGCAGCAGCCTCGGGCGCGGGGGCCGTATGACCAGCAGCGTCGMCTCGGTGCAGCCGCGTCGAGCAGGCGACTCCACGGGAGGCCGCGTGCGGTGTCCGACCGGCACAGGCGGTGCCCGCGCGACATCGCCCACCGAGGATGTGCCGGGGCCTGCGACCAGGCCGATCGACCTGGCGCGATGTCGCGGCAGGTCGCGGCAGCGGMGGGGAGCGCTCTCGCGTTGCCCGACCGGCAGACCACAGCAGGCCCGGCTGCGGCCCCGGTCCCGCGCGCCGCGTCGACGGCCAGCGCGGTCCGCGCGCAGCGTCGTGCGAGGGAGCGCGCCCACGTCGCAGCGCCGTGGCGGTCGTACTCGCCGCGCGMCCAGCTCCGGCGACCAGGTGGCAGGTAGTCCCACCCGGCGCGAGCAGGCCGCGTGATTCCTCGGGTTGGCGGGGCCTGCGCGTCGGCGCGGCGCCTGGTCCGTCCATCGTCCTCGGCGGCCGCGCAGGMCGCAGGTGGCCGTAGTGCAGCGGTGCTGCCCGTCGGCCTCGCACCGTGTCCCGGGTCGACCGAGCAGTTCGGGCTAGGAAACTGTCCCCGGACCGACTCCAGCCGCGCCGAGCGATGTGGCGCCAGCGCGGCCGAGCGCGCTGCCCGCTGAGCGGCGAGTTGACTCCCGGTCGCGCCTCGGCCGGGGCCGAGGCCCGGCGTCGCCCCGACCTGCAGGAAGTCCGGGAGTCGMGTGGCCGAAGGTCGGCGATAGGGCGCCATGGMCTCCT52353403540035460355203558035640357003576035820358803594036000360603612036180362403630036360364203648036540366003666036720367803684036900369603702037080GCGGCTCGCGGGTGGTCAGCACCAGGCGCTGCTCGGGGCAGGTGAAGGCGAGCACGGCCA37140TGAGCCGCATGTACTCGTCGTCCTTGATCCGGGTGCTGTCCCGCGAGCTCATGGCCGGGC37200GCATGCGCGGCACCGACAGGTCCACGACGGCGTCGCGGTCCTTCAGGTGCGCCCCGTGCG37260CGACCAGGGTGACCAGCTCGGCGGCCACATCCAGGTGCAGTCCGATGAGGACACCGGGGT37320TGACGTAGCGGMCCCCTTGTCGAGCCAGCGGTCGMGGACACGACGCGGCGGTCGTAGT37380CGGCCTTGGGCACGCCGCTGACCGTGTCGCCCATGMCTTGCTGTAGGAGTCGCGGTCGT37440AGGTCTCCTGGMCACGCACATGGTGACCGGGTCGTCGCGGCGGACCCACTCGGCGAGCA37500CGTCGATCTCGTCGGGCTCCATGCTGCCGATGTTGMGTAGACCCGCTCGMGCCCATGT37560CCAGCGCGGTGCGGATCGCCCAGCCGATGCGGMGGCGGTCGAGAGCCGGGTGTACTTGT37620CCTCGTACTCGCCGGTGAGGMGCCGACGCCGCGCACGCCCTCGTGCTCGMCAGGATGC37680GCAGCTGGTCGATGATCTCGTCGCGGCCGGAGMCTTGCGCTCCATGCGGGCGTTGCCCT37740TGCGCATCGAGCACATCTTGCACTCGGAGTCGCAGTGGTTGGTCGTGTAGAGCGGGACGA37800ACGTGTGCAGCCGGGGCGTGCGCTCCGCGCAGCGCAGCTCCGCGGCGGCGACCAGCTCCG37860CGGTGCTCACCGACTCGTCCTCCCAGAGCGCCAGCGCGACCGCGGGCCGGGACGCGCCCG37920GCTCGTCGTCCGGGCCCAGCGCGAGCACCGCACGGGTGTCGACGGTCGCCGCCTCGATGC37980GCACCTGAGCCAGATCCGGCAGCACGMGTCGGGATGACCGGTACCGGGGTATTCCGCCA38040TGACTAGTTCCTTCCCGCGTTGCGCGGCAGATCCGCACMATGGGTTCGCTGCTTGATTC38100GACTATCGGGGCCAGATATCGCCGMCCGGCCGCGCCAGTGGCCCAGCACGTTCGAGGTA38160ACACGACCCCGGCAGGCCGTGTCATGGGGAAGTTCCTGCAACTAGGCCGCTGACCAGGGA38220ATTTACTTGTGCCAGTAGCTCAGATTCATGGCGCGTGAGCCGAATCGATGGCGATCGTAG38280AGCGGTTATATAGCGTTCTTTCGTCGCCACCGAGMTCTTGGCCGCMGTTCGGAGACTG38340CTTGACACCCCGGTCGCCGGATCMTMCTTCGGTGTCGGGGCCAGGCGAATCCGGTACG38400MCCACMGCCCATMGAAAGAGGTGTTTCCATGTCCGCTGACCTGTCTGCGCTGMCAT38460CGACTCCCTGGAGATCTCGGAGTTCCTGGACGACAGCCGCCTGGAGGACAGCGAGGTCGT38520GGCCAAGGTCATGTCGGCCTCCTGCACCACCTGCGAGTGCTCCTGCAGCTGCTCGTCCTG38580ATCAGCCCGAGGGGTTTCCCCCCTCGCGTGCGGTGACGTGCGGTCCCGCGACCTTCCCGG38640CCCAGCCTGGCCACCGGAGGGTTGCGGGACCGCCGCCCGCGGTCAGGCGCGGACCACGAG38700AAAGGACCGACCCATGTCGACCGCCGTGTCTCTATCGTCCCTTGTGGACGTGGTGCCCGC38760GCCAGCGCCGMCCTGCCGTCCTCGACCGACGAGCAGCACATGCTGATGCTCTACGTGCA38820CGTCCCGTTCTGCCACTCCAAGTGCACCTTCTGCGACTGGGTGCAGGCGATCCCGACCM38880GGACCTGCTGCGCMGCCCGAGGACTCGGTCCGCAAGMCTACATCCGCGCCCTGGTCAC38940CGAGATCGAGACCCGGGGCGCGCAGCTTCGGGCCGCTGGCCAGGTGCCCTACGTCGTCTA39000CTGGGGCGGCGGCACCGCGTCCAGCCTGGACMCGCCGAGGCCGAGGCGATCTGGGGCGC39060GCTGGACTCCGCGTTCGACCTCAGCACCGTCGCCGAGGCGACCATCGAGTGCAGCCCCGA39120CACCGTCGACAAGGCCMGCTGGAGTTCTTCCGCGGCCTGGGCTTCAACCGCGTCTCCAG39180CGGCGTGCAGTCCTTCGACGACGCGCGCCTGCGCAGGCTCGGCAGGCGCCACACCGCGGG39240CGAGGCCGACCGCATCGTGCACCACGCCCGCGAGGCGGGCTTCGACGAGGTGTCCATCGA39300CATCATGTCCGGCTTCCCCGACCAGGAGCTGGACGAGCTGCGCGCGACCGTCGAGAAGGC39360GGTGTCGCTGCCGCTGACCCACCTGTCGCTGTACTCCTTCCGCCCGACGCCGGGCACGTT39420CATGCGCCGCAAGCTCGCGGGCACCGAGMGCGCGCGTACCTGCGCAAGCAGCAGGCCCT39480GTTCACCGAGGCCCGCCGCATGATCATCGACGCCGGCCTGCCCGAGTACGCCTCCGGCTA39540CTTCGGCAGGGTGTCGCCGTTCGCGGCCATGTACTTCCAGCTGCGCGCCGACACCGCGGG39600CTTCGGCTCCGGCGCGATCTCCCTGGTCGACCGCCAGTTCCTCTCCCACGCCAAGGGCM39660GCTGCACGCCTACATCCAGGACCCGCTGGCCTACGACATCGATGTGCCCGCAGGCCMGA39720CCGCGTGCTGGTCTCGTTCCTGCAGGCAGGCCTCGCCATGTTCGACGGCGTCCTGCGCGA39780GGAGTGGCGCGTCTCCACCGGCACCGACCTCGACGAGGTGCTCACCCGCCCGTCGATCGC39840CCCGCTCGCGGACTTCCTGCGCGGGCGCGGCCTGATCGAGGACGAGCGCGGCATCCGCCT39900CGACCCCCGGCTGGCCGGGCTGACCCTGATCGAGCTGGCCTTCGAGATGGCCATGTCCCA39960GCCGGAGTCGGCGTGACCTGGACGGMCTGGTCTTCCCGGCGACCCAGGACGAGCAGCCC40020GGCCTGGTCGCCGGGGTGCTCGCCCCGCTGCTGGCCGACCTCGACCGCCCCGGCCTGTTC40080CTGCGCGAACTCGGCCCCGAGGGCGCCACCCGACTGCTGCTCCMGTCCGCGACGCCCCA40140CCGGACCTGCCGACCAGGACCGCGGCCCTGCCCGTGCAGCCGACGGCCGTGCGCGCTGCC40200ACCGTCGCCCCGCTGGGCGGCCCGGTCTTCGACGGCCCCGGCCTGGACGAGACCACCCGC40260GGCTTCCTGGCGGACACCGCGCCGGTGGCCGTCGACCTGTCCACCCGCCCCGACCGCACC40320GGCGCGGCCCTGACCCTGATGACCGCCCACCTCGCCGCGGTGGCCGACCCGGCCCGCTCC40380GGCGACGGCCCTCCGCTGAGCTTCCTCAGCTTCCGCTCCCACGCCGAGGCGTTCCTGGCC40440ACCACCCGCGACCCGMCGCCGCCCGGCACGCCTTCGACACCCGCTACACCGACCACCGC40500虹ACCGTCGMGCCGCCGTCCGGGCGATCCTGCTCGACGGCGACCCTGGCGACGCCGCG40560CCCTGGTCCGCCGCGGCCCGCGCCGCGAAACCCCGGTTCACCGCGGGCTTCGCCAGCGCG40620GACCTGGTCGCCCACACCGGCTACACCCGCGACCACCTCCGGGMCGCACGGACTTCGCG40680GGCGCTCGGCCCAGCCGCCGCGCGGACCGCCGAGGTAGCCGCTCGCTCCACCGACACCGGCCACGGCGGCTCGMGTGATGTGGGCGTCGGTCCGCGCCTGGTGAGGACGGMCAGCTGGGCCCACGGCGGTCGATGGCCCCGGTAGGCGCAGTCGATCCTCCACAGCAGTCCTGGCGACGCCTGATGCAACGTCGACAGGCCGCTCCCGCGCTTGCTGCACGCCTCGGCCGCACCGCTTGGGCGGTGCGCGCTGCGCACACGCGGTACATGCCGGTCTCGCCTTGCTCCATCGCCGCAGCGACCGCGGGGTCGAGGTCGGTCGGCCAGGGAGGACGGTCGAGGAGGGCGAGGACCGAGGGACGTACTCGCATGTCGTGGGGCGCCCACCGCGACGGAGACCGTTCTCGTCGGGAGMGAGTGGGCCTGCTCCGAGGTCATCCATCGGCAAGCTCCCGGAGGCGGGCGCGCCGCCTGCTCGCGCTACTTCCATGAGCCTGTCAGCGGGGGTCAGCGCAAGGCACGTGCGGGCAGGCCAGGTCGGGAGAGCGCAGTCGACCCGTCTGGGCAGTTCGAGGCGCTCCGTGATTGAAACGTGCGAGGGGGCACAGTGGAGCGCGMGCGGGCGAAGGGCCGGGTGCGTCGCGGCTCGACCGCGCCCGAGGTTGCCCGTGCCTGGCCCGCGGGGCTCTTGCGGGGACGCGGCCTGCGCCGTGCGGGCTCGGCCTTCGCCGGGCAGTCGCCGCTGGACGGGTCGGTTCCGAGCAGCACCAGCCTGCCTCTGCCACGCTGGCAGACCCGGCGCCGCGGTCGTGAGCACAGTGCTCGTGCGCACGTTTACGCGGCCGGMCTCGGCGACACTCGAAGCTGCGGGTGGGCGTCGACCGCCTCACCGGCCGGTCACGCMGGTGCGGCGGCCGCGTTCGGGGCTTTCGGTCCGCTATGCGTCGCGGCCGGGTTCCACTGCTCGGTTCGGTTCAGGCGTCGCTTGGCCCGTGATGCGGTCGGCGCTCGGCGGACGGTGAGGGTCGMGACGACGGGTCCATGCGCATCMCTACAGGCGTATCTACGTGACCCATAGCCAATGGCGGTCGGGTGTCGGATCGGTCTCGGCAGGTGGTCGGCCCAGCAGGGCTCGTCTCGCACCGACGGCTCACGCCTCGATACTCCMCATGCAGCCTGCGACCGCCGGTCGCCCGCTGGCCTCGATGCGGGGGCGGGAGGGGCGACGGACCTGGTCCACCTCCCGCCCCGCGGGTCGTTGGGGGACAGGCATCTGCTTGGTCGGCCACCGGTGTCCAGACATCTGCGTCTACGTTGCGCTACGACGAACTGTGCCGMCAATGTCCGGTCCCTGGGCGGCCCTGCACTCGGGCCTGCGAGGTAGCCCGGAATCCGTCGCGGGCCCGCTCGGTGCTCGGCGTCGMTCACGCACGTCGGCGGCCGAGACAGGCACGCCGCCCTGGGTTGCGCTCCCCATGGGCGGCGACCGAGGTAGGCGAAGGGGAAGTCAGGTCGGGGCCAGCCGTGCCGCGAGGTAGAACGGCGTCGCACGTCGAGCGAGAGCAGGGGGCTCGGCCGGGGATGCGGAGCGTCGCCGAGCGGCGCCCTCCGATGTCGAGCGTCGCCCTGCCTGCTGGGTACCTCCTGGT40740408004086040920409804104041100411604122041280413404140041460415204158041640417004176041820418804194042000420604212042180422404230042360424204248055TGTCGTAGGGCTGTGATGTCCGCTACGGGGCCGGCGCACGCTGGAGCCGCCCCGCGCTCGGACGACGACCGACCGGGCCGCAGGTCGCGGACGGCGCTGGCACCTGCGCGACCCGCCTGCGGTCCGCCGTGTCGTCCTGGMGCGMCCCACCCTGGCGAGCGGTGCTGGCGCCGAGCCGGCCATGCGGGTCCGGCGGCCATCACCACCGCACGACACCCGCATTCATTGGGGAGCGGGCCGGCGGCGGCACGTGGACAGCCCAGGCGCTCCGGTGAGCGGGCGGGTCGGTGGCCCTGGCGTGTCAATGCMCCAGAGGAACGTCCCCTCTGCTGTCGGCAGCTGATCGCGCGTGGCGAGACGCCACCGGTCACCGCGTGGCCTGCCCCAGCGGCGACCGCCGCCCACCCGCCACGCCTCAACGGGTAAGTCGGCCTTCCTGGCCAAGATCCATCCTCCTTGGCCGCCCATGAAATCCACAACAGCGCGTTTGACCAGGTGCAAAGCGGGGCGGCTGACCACGTTCATCGTATGCGGGATGACAGCGGTGTTCCTTCGGCCGCCGCCTCGGGTGCTGGACGCCGACCGGCGMTMGGCGAGCACGACTCCGACATGGAGCATGCAACTCCCTGGTCCTGCGCCGCGCGCCCGCCAGGCCCGAGGAGCGCGGCGGCCCGCCCTGACCGGCGGCGAGCGACCGGCCTCGCCCCGCGACCGCCACCTGCATGCGCGTACGCGGMCGCCTTCGACCTCGAACGTTCGCCGTCCCCGACGCTGGACCAGGTCGAGCCGCGGTCGGACTCCACACGCCGCGAGGATGMGCGTTCAGGACAGTGGCCCAGGGTGGTCGGTCTGTCTGGGCTGCGCTGGGCTCCGMGGCGTACGAGCGCGGGCGCGTTGTAGCATATCAGGMGGTCGAGGACGGTCCGGCACCGAGCGGGGCGGCCGAGCGCCGTCCGCGCCGMCTCCGCCGGACGCCCGCCCTCCTGGCCCGACCGCATCGTGACGGGCCGTTCTTCGATTACCCTGGTGCGACCTGGTGGGTCGCCCTGGGCATGGGCGGCTGGCCCGCCGAGATACTCCGTGCTGGMAGCCCTGTCCGCAGGGCACTTGTACCGTTCCCACTGCGCGAGGGGCGGATGACGGGGAGCAGGMCCCGACGCGGCGGGATGCGTGGACATCGGACMCGTTGTCGTCGMCCCGCGACGATCGCCCGGGGTGCGCGCGCATCAGCTGGGCGCTACCTGCGAACGCGACCGCGCTGCGCGGGCACCGCCGACCCTGCACGAACGCCGTCACCGCGGCCCAGCGTGGACCGGTGGCGCTGCGTCACCGTGGCCTGAGGGCATCCGTCCGCTCACGGCCGACTAGGCCGTCCGCCGACGGCAGACGTGACGGAGGACGGCGCCATCGATCACCCGAGGTCCGCTTGCGGCCCAGGACCGGGACCGCGGTCGCCCGACGTGCTGGACCGACGAGCGAGTTCCTCACGATGACMCCTGAGCCCGCGAGGCTGACCCTCGGCGAACCGCCTGGCCCCTGCGCCCCGCGGGCGGGCACTCGCGGGCCGACGTCCACCGCCGCCCCGCGCCGAGACCCCCTGCGTGATCTCGTGCGGTCTGTCCGGCCCTGGGCTCCCTTCGCCATGCCCCCGCATCGGACGAGGACGTCCGCGGGCCCTCAGCGTCCGTGCCACGACMCCCCACACTCGATCAAAGGTCGGTACGGAGCTGATCGGGACTGCCCGGAGTTGCGCGCTGTCGGCGCATGCTGGCCCAAGGGCACCA425404260042660427204278042840429004296043020430804314043200432604332043380434404350043560436204368043740438004386043920439804404044100441604422044280TCGAGGCGCTGCCGCTGCCCGCTGGCACGATCGACGTGGTGATCTCCMCTGCGTGATCA44340ACCTGTCGGTGGACAAGCCCGCGGTGTTCGCCGAGATGTTCCGGGTGCTCGCCCCCGGCG44400GCCGGATCGGCGTGTCGGACGTGGTGGCCGAGGATGCGCTCAGCGCGACCGAGCGCGCTG44460AGCGCGGCTCCTACGTGGAGTGCATCGCCGGAGCGCTGACCTTCGCCGAGTACCGCCGCG44520GCCTGGAACGGGCCGGGTTCGCCGACGTCGACATCACCGCGACCCACCAGGTGGCCGACG44580GGATGCACTCGGCGATCGTGCGGGCGGTCAAGCCCGCCACCGGGCCGGTCGCCGAGCCCG44640CGGCCGTCGCGGCCTCCGGATCGTGCTGCGGGGTGAGCGCGTGCTGCACGCCTGCCGAGT44700CGGCGCTGGACCGGTCGAGCACGGTGGCCGAAGCGAAGGCCGCTTCCGGTTGCGGCTGCC44760AGAGCTGAGCACGTGCGGGCGGGCCCGCGGTGCGGACTCGGMGGCAGGCCCACCGCGGG44820CGCGCCCCCGCGACGCCGCACCGCCGGGCCTGGCGGTGCCMGGTCCGTCTATGGTTTGA44880CCGACTCGGGTAGCGCAGCACCGGCCATCCGCGGTGTTCCGGCGATGGCACGGCGGTCCA44940GGTGCCGATGGMGGMCACCCCTGTGACGACCAGGCCGCGGATCACGGCGTCGGCGCTG45000ACCCTGGCGGGCGCCCTGGTGCTGTCCGCCTGTGGCAGCGACGACMCCGGGACACGATC45060AAGTGGACCCTCGACAAGGGGMCGTTCCGGTTCCCACCGCGACGATCCCGATCGACTGC45120GGCGGCACGCGAGCACTGACCGGCGAGGGCTCCACCGCCCAGAAGGGCGCGATGGACGTG45180TTCGTCGCCGCCTACACCCAGCAGTGCCCCGGCCAGCAGATGGCGTACACGGCCAGCGGC45240TCGGGCGCGGGGGTCMGCAGTTCCTCGCCGGGCTGGTCGACATCGGCGGCAGCGACTCG45300GCGCTCAAGCCGGAGCGGGGCGAGGTCACCGACGCCGCCGCGCGCTGCGGCGGCMCCCG45360GCCTGGAACCTGCCCCTGGTGTTCGGTCCGGTCGCCGTGGTCTACCAGATCCGATATCTC45420TAGAGCCGCCCGCAGGACGCTTCCGCMGGCAGCTTTCTGGACCACTCCGGAAGCGGTCC45480TCCGTTGCTGTCGMGGGACCCTGTCCGCCCTGGGAGATCTGGCAGCCCGGGCCCCCGCT45540TTTCGCGTCTTGATCGGGAC45560<210>2<211>49<212>PRT<213>iVocaWflsp.WW-12651<400>1MetSerAlaAspLeuSerAlaLeuAsnlieAspSerLeuGlulieSer151015GluPheLeuAspAspSerArgLeuGluAspSerGluValValAlaLys202530ValMetSerAlaSerCysThrThrCysGluCysSerCysSerCysSer354045Ser<210>3<211>631<212>PRT<213>iVoc^/flsp.WW-12651<400>1ValAlaAlaProGinValAlaGlyThrGlyPheLeuAlaAspGluLeu151015GlyArgArgLeuSerAlaAspProProAlaGlyValAspThrValLeu202530ValAlaGluLeuAspArglieGlyGluHisHisAspLeulieValGlu354045CysLeuGlyThrGlyArgProLeuLeuPheValGlyThrTyrArgSer505560LeuValTyrlieGlyProLeuTrpAlaSerArgValProGlyCysPro65707580HisCysLeuValThrArgThrAlaAsnSerProPheGlyProAspLeu859095ArgGlyAspThrAlaProGluSerSerArgArgAspThrAlaThrPhe100105110ThrLeuGlyProGlyValLeuAlaAlaValGluArgLeuValArgGlu115AlaAspSerGlyArgMet130ThrValValAsp120AspGlyProGlyVal145LeuProAspSerPro135ValThrAlaThr125ProAspCysGluGly150CysAlaSerCysSer140AspArgGinValThr165ThrProArgGluVal155GlyAlaGluAlaValProValPhe180ArgThrAlaGluGly170ProLeuProLysArgTyrSerLeu195PheVal185AspAlaAspThrAsp175GlyLeu160ThrProLeu210SerProlieAlaGlylieGin225ArgArgGluProGlyGlyLeu200LeuPheLysGluLeu190AlaLysAspGly215CysSerValGluVal205ArgGinAspLeuAla230lieGlyArgGlyVal220GlyThrArgTrpAla245LeuGluGlyLeuLeu235ThrTyrArgSerThrlieAlaVal260SerAlaProValArg250ArgTyrAlaGlyGlyArgAla305AspGlyAla290Glu275lieGlu265AlaCysTyrAlaSer255HisGly240ArgArgAspProThrGlyTrpValTrpArg280LeuGlyThrHisLeu270ValAlaAspProGlyPheThr295PheArgArgPheAsp285GluAlaSerTyrArg310TyrSerMetArgPro300ArgAspThrValProGluArgAla340Ala325AlaPheT卬GlyAsp315GlyGluArgValPro345Arg330ArgHisAspArgGlyGlu350Leu335ThrVal320LeuAlaPheLeuTyrAspThrSerAsnGlyCysAlaLeuGlyAsnSerAlaGlu355ValLeuHisGlyGluAla370MetAlaTrpTyrGly360ArgGluValAlaLeu385GlyAlsAspAlaLeu375ArgArgLeuAlaLeu390LeuAspAlaLeuGlu380GluAsn365ArglieAspMetThrGlyPheCysGly405PheArgAlaPhePro395ArgLysAlaGluAspSerPheAspProValArg420TrpLeuValAlaThr435AlaGlyAlaGlyPhe450GlyLeuHisGluGly465TyrGluArgArgLeu470AlaAla455lieGlu440HisLeu425SerLeu410SerThrMetGluLeu415ArgVal400PheMetArgLeuAspAspProAspProTyr430AspGlyProArg445GinAlalieAlaAspGlyLeuArg485MetGluAspHisGlySerValGlyVal460AlaThrArgHisLeuMetThrArg500ArgTrpSerPheAlaArgGlu515AlaAspValProSer505LeuAla490LeuLeu475MetL>euAlaAspValGlyAlaGlyAspAlaAspPro495ProSer480AlaGluAlaLeu530ArgAlaAspLeuAsp545AspValLeuValLeu520ThrLeuArgGluGly535AlaValSerGlyAla525GluVal550AspGinThrMetArg540LeuAlsAleiLeu510GlyArgValProAspLeuVal565LeuThrCysValArgValValValProGlyAlaValProMetThrPhePro570GlyVal555GluLeuArgArgAspGlyAsn575ThrMet560GlyGlyHisArgAsnArgArgThrArgAspLeuProArgLeuAlaGlyGly595600605AlaGlyLeuProTyrArgSerGlyLeuValAspGlyGluGluProGly610615620CysValProHisProPhePro625630<210>4<211>479<212〉PRT<213>A/bcmftflsp.WW-12651<400>1ValThrGlyAspLeuAlaGluHisThrGluSerLeuArgArgAspPro151015GinGlyAlaAsnProAspGlyTrpArgValAspTrpAlaAspGlyPro202530TrpProValLysValTyrAlaGlyGlyValArgThrProLeuGlyArg354045AlaGlyAlaLeuAspArgLeuLeuLe.uPheThrPheGlyMetThrAla505560ValArgPheAspProAlaGlyGlyMetProSerThrProAspAsnPro65707580ThrProThrHisLeuGlyGluArgTyrAlaProArgArgProliePro859095SerGlyGlySerMetTyrProThrGluAlaTyrValValAspThrGlu100105110AlaGlyArg'ValSerHisTyrAspProTyrArgHisGluLeuValAsp61LeuPro145PheGly130Ala115ArgProAlaPro120AlaAlaLeuArgAspAlaProLysArg135ProProAlaVal125AlaLeuGlyGluTrpLysAsnLeu150TyrLysTyxGlyAla140LeuValAlaAsnAla165GlyValAlaLeuLeu155PheAlaAlaArgAlaValAspThr180AlaAlaPheGlyAsplieAla195ValGluAspLeuLeuGlyGly185LeuGlu170ArgAlaAlaArgLeu175AlaArg160GlyGluGlu210ValGluLeu'GlyVal200AspGlyArgValAspLeuAla225GluArgAlaAlaLeu215ArgArgAspCysAspAspVal190AlaAlaAlaAsp205AlaValPheAlaArg230ProProValLeuGlu220AlaGluProProPro245LeuSerAlaLeuPro235ArgSerArgAlaArgLeuProGly260AlaValAspArgGlu250GluAlaAlaArgGluProVal275AspProGlyValThr265AlaAlaValArgVal255ProAla240AlaLeuLeu290ThrGlyAlaProPro280ValArgArgGlyGin270ProLeuAspPhe305HisAlaAlaGluValGlyAlaGlu340Val310AlaMet295ArgLeuAlaAspGly285HisGlyArgArgSer300GluAlaValLeuAla325AlaGlyLeuAlaArgLeuArgCysVal315AlaValSerGlyCys345AlaAlaValSerGlyGly330335AlaValArgArgValGluVal350Leu320AlaGlyLeuAlaProGlyTrpTyrArgPheAspGlyAlaLeuValProValAla355360365GluAspAspProGlyProValLeuArgArgAlaLeuPheAlaGluSer370375380LeuAsnProGluLeuAlaAlaPheThrValHisValThrGlyProVal385390395400AspPheAlaGlyGlyAlaAlaGlyTyrArgAlaArgGinLeuGlyVal405410415GlyAlaValValGluAlaValCysUuAlaAlaThrAlaAlaArgUu420425430SerGlyHisAlaValLeuGlyPheAspValGlyProlieAspLeuAla435440445TyrAlaLeuProAlaAspArgGlyValHisAlaGinValCysValGly450455460AlaValArgProSerThrHisTrpGluValAlaValMetProArg465470475<210>5<211>852<212>PRT<213>iVooiWflsp.WW-12651<400>1ValLeuPheArgArgGlyThrlieGlyLeuProAlaLeuAlaGlyLeu151015ValProThrArgThrTrpGluUuLeuAlaAlaAlaAspAlaGluArg202530AlaValArgGluProLeuArgAlaArgLeuSerAspAlaLeuHisAla354045Arg65ProAsp55AspArgValProValValProGluValAlaAspAlaGluArgArgAlaValLeuLysLeu50ArgAspValHisGlyAspLeuGlyAsn70GluArgValGlyAla60SerValProProArgGlyAlaAla85LeuGluAlaLeuAla75TrpValAlaAlaGlu100AlaArgLysAlaGlu90GluGluValTyrLeuGluSer115ArgGlyValGinPheGin130ThrAla145ArgArgArgAlaAla105LeuAlaAlaValAla120SerGlyGluAspArg95AlaLeu80ArgGluAla110GlyGluAspTyrAlaGlyArgLeu135ProPheAspThrLeu125HisArgGluValAsp150SerThrlieThrVal140ArgLysProAlaGlu165ProPheGlyAlaThr155PheAlaTyrArgPheLysProSer180TrpGlyAlaAlaProAlaAla195GlyLeuLeuAlaSer170ThrGlulieGlyPhe185GluArgValAlaVal175GinLys160ValProSerGly225ArgVal210AlaGlyAlaLeuGly200MetThrHisGinAla190AlaArgLeuGlyGluHisAspGlyPheAla245ProTrp215LeuArgValArgLeu230ValSerValArgArg205HisArgValAspLeu220AsnAsnSerLeuAlaVal235240ArgProLeuGluGlyAlaAsp250255ArgAlaLysAsnSerProLeuArgProAspGinVallieArgAlaLysAsnSer260265270ValArgValLeuValGlyLeuLeuAlaAspHisAspArgThrGluAsp275ArgAlaArgLeuAspLeu290GlyThrlieAspAla305LeuGlyLeuProGin310GinVal295Leu280AspAlaGlyLeuValArgAla285AlaAspAlaAlaArgAlaAspArgAla300LeuCysHisAsp325ValGlyThrAlaArgLeuAlaAla340PheThrGlyLeuGinAlaVal355ArgThrGlyLeuGly315ValAlaGluGluVal330AlaLeuAlaCysGin345AspAlaPheAlaAlaArg370PheValGluValVal385AlaAlaLeuTyrGlu360AlaGluLeuArgArgGly320AlaSer335AlaGluVal350AlaProAlaLeu375CysProProProAsp365LeuValAlaArgGly390AspValGlyThrAla380ArgGluAlaGlu405LeuGluArgAspAla395AlaHisAlaAspArgProAlaLeu420ProLeuLeuAspArg410GluAsnLeuAspArgLeuVal435TyrAlaPhePheAlaAspArg425AlalieValGluMetArg400SerTrp415LeuGinAla450ValGluLeuTyrAsp440PheGlyGluAspLeu430LeuGlyLeuVal465SerAlaValMetAlaLeuArgArg500Arg455AlaPheSerAlaGlu470GlyValGlyAspCys485AspPheLeuGlyTrp505Leu475ProHis490ValArgAspGinLys445HisAlaGlyValPro460SerProAlaGluAla480AlaGinHisValLeu495ArgAlaAsp510Leu515ProThrValValGlyGluLeuValLeuAspProAlaHisLeuAlaSerValValAspAla520TrpArgSerThrLeuPro530GinAlaAspAspLeu545ValPhePheSerPro535ValValAsnGlyThr550TyrCysAspLeuAla540ThrVal525TyrArgV.alGinThrArg565LeuArgAspThrlie555GlyGlyGlyLeuAlaGlySer580■AlaAsplieThrAlaAlaLeu595ProLeuGluValLeu570AlaArgHisThrlie585LeuAsnPheAsnLeuThr610AlaThr625ThrThrGly600TyrProGlySerGlyHisGly560ArgPheAsp575ProArgGin590HisProArgGlyValLeuArgVal615LeuAlaAspLeuLeu605GinArgProGlyArgThr630AlaLeuTrpSerVal620ValArgAlaLeu645LeuAsnPheLeuVal635GinAspGlyGluAspLeuAlaPro660LeuCysAlsPheThr650ProAlaAlaAlaTyrArgPhe675AspGinLeuAspTyr665ProThrArgThrAspPro640Arglie655MetLeuLeuTrp690ArgValArgLeuGly705ProValAlaAspAla680AlaGlyLeuAlaArg695LeuValLeuAspPro670TyrArgGlyGly685AlaAspArgProLeu725GluGly710ProAlaLeuPro700ArgSerTrpAspThrAlaLeuAlaGluPheAspAlaTrpGly730ArgArg715LeuGluArgGinArgLeu720GluLeu735ArgAlaAlaGlyLeuProPhePheArgValArgHisAla755AspTyrAlaAlaGluArg770SerAlaArgLeuHis785LeuLeuHisValGlu775ProVal760ThrHis745AlaProPro750AlaAspGlyArgTyrLys790AlaLysGinAlaValArg765GluTrp.AlaLeuGinAlaArg780AlaAlaLeu805GluCysLeuProValValValGin820AlaGlySerAlaGluGluPhe835CysAspAlaArg850Phe840LeuAsp795ArgAlaThrPro810AlaGluGlyTyrGly825ValGluHisThrLeu845AsnProPhe800GlyGlyHis815AlaSerGly830ThrGlyGly<210>6<211>330<212>PRT<213>iVoc"幽sp.WW-12651<400>1ValTrpArgAlaLeuHisValHisArgTyrAlaAspGinAspThrLeu151015lieThrAspGlylieAlaProValLeuGluLeuLeuArgGluSerGly202530AlalieHisGlyTrpPhePheLeuArgTyrTrpGinGlyGlyHisHis354045lieArgValArgMetArgValAlaGluThrAspAlaAspAlaValVal50GluValAspGlyGly65AlaGluGinPhe55LysLeuArgAlaTyrLeu7075AlaGluGluPheHisArgAsp85GluGlyThrAlaMetAlaAlaLeu100ArgValGluTyrHis90GluGlulieHisSerValArg115GlyValAlaValAla105ProGluHisAsp60AlaGluHisProAla80GluAlaGinProThr95ProAspProlie145ThrAsp130ValValAspAlaGlyMetGlyAla120GluAspTyrPheAla135ArgAlaVal■Leu150GlyMetMetLeuTyrGlyPro110LysTyrGlyGly125AspSerSerAlaGly140LysSerSerTyr165GluMetAlaAlaGly155GlyLeuCysAlaUuThrProAla180TyrValPheAspArg170PheAlaHisTyrTrpSerPro195GluHisSerAlaLeuAla210AsnArgGlyAlaAla225ArgAlaTrpAlaPro215AlaGly200LeuPhe185PheLeuAspAlaLysArg160ThrAsp175VallieCys190ProAlaLeuGlyAspProLeu230ValHisGluAlaArgAlaHisAspTrp205GluAlaValLeuArg245GlyAsp.AspAlaMet235ProThr220HisAspAlaValArgLeuAla260LeuLeuValSerTyrLeuHis275Gly250AlaAlaArgArgThr280Ser265HisAsnAsnArgValGly240AlaValLeuAspArg255GinValPhe285Ala270GlyLeulieProGluLeuGluAlaPheLeuGlyTyrLeuGlyHisHisValLeuSer290295300GlyCysAlaGlyThrProValAspAlaGlyLeuGluSerArgValArg305310315320SerHisArgAlaGinLeulieGlyThrPro325330<210>7<211>366<212>PRT<213>Mowt/!asp.WW-12651<400>1ValLeuAlaLeuGlyProAspAspGluProGlyAlaSerArgProAla151015ValAlaLeuAlaLeuTrpGluAspGluSerValSerThrAlaGluLeu202530ValAlaAlaAlaGluLeuArgCysAlaGluArgThrProArgLeuHis354045ThrPheValProLeirTyrThrThrAsnHisCysAspSerGluCysLys505560MetCysSerMetArgLysGlyAsnAlaArgMetGluArgLysPheSer65707580GlyArgAspGlulielieAspGinLeuArglieLeuPheGluHisGlu859095GlyValArgGlyValGlyPheLeuThrGlyGluTyrGluAspLysTyr100105110ThrArgLeuSerThrAlaPheArglieGlyTrpAlalieArgThrAla115120125LeuAspMetGlyPheGluArgValTyrPheAsn130ProAspGlulieAsp145ValThrMetCysArgValTyrPheAsnlie135140LeuAlaGluTrpValArgVal150PheGinGluThrVal165AspThrValSerLysPheMetGly180ValSerPheAspArgArgVal195ProGlyValLeuGly185TrpTyr170ValVal155AspArgLysLeuAspLysGlySerMetGluArgAspAspAspSerProLysAlaTyr175TyrPro160SerAspValAsn210LeuValThrLeuVal225ValValAspLeuSer245lielie215HisArg200GlyLeuHisLeuAsp190PheArgTyrGly205ValAlaAlaGluAla230ValProArgMetAsp'SerThrArg260ThrCysProGluGlyAlaHisArgLysAspAspAsp220LysAspArgAspLeu235ProAlaMetSerArg250TyrMetArgLeuLeuAlaPhe275GluPheGinAspProGin290ProGlySerProAsp305AsnGluGluThrGin280AlaGlu265ArgLeuValLeuSer255AlaAla240ArgValMet270ThrArgGluGin295AlaProTyrlieGlyLeuVal310SerGinPheLeuGlyArgThr285GlyVallieSerAla300AspSerGinAlaArgHislieLeu340ProThr325GlyArglieGluAla315AlaAspLeuArgVal330GlyGlyThrLysAla345PheAlaAsnProSerValGlyAlaAlaVallieProlieVal350GlyArg335GlyArg320ProHis355<210>8<211>410<212>PRT<213>iVoawfftasp.WW-12651360365<400>1ValArgTrpGlyGlyGluSerAlaThrTrpAspGluLeuLeuAspArg1GlyArgGluAspProThrGlu65LeuVal50LeuAla35AlaArg20Ala5SerAla丄euValGlyLeuGluAspThrValAlaProGlyGluArgProAlaLysLeuHisTyrProMet145ProVal130ThrGlu115LeuAla100Leu85lieLeu70TrpLeu55AlaSer40LeuAla25Leu10ProGinArgAlaValSerTrpSerSerGluAlaAspGlyValAlaGlyHisAlaSerLeuTyrAlaThr.CysValLeuProSer150Leu135LeuGly120ProAsp105AspThr90SerLeu75SerLeuPhe45GlyPro60ProValTyr30AlaGlyAsp15ArgValValAlaGlySerThrTrpGluSerCysSerLeuGinPhePheLeuArgArg155AlaAsp125SerAla140AspLeulie110GlyGlyGlyGly95AlaArgPro80AsnLeuMetProSerPhePheLeuValAlaHisAspTrpSerAlaAlaHisAlaGluAlaAlaGluArgPhe160Asp165lieAlaValUuAlaValProAla180GinValAspAlaMetAspArg195LeuGlyAlaGlu170LeuAlaAlaAlaAla185ArglieThrLeuGlyHis210GlyValSerValArg225AlaValAspGinSer200ValArgMetValArg215LeuTyrGlyThrAlaGlyLysAla260ValAsp245ValAsn230ProGlyHisAsnAlaValAla275AlaGlyGlu290GlyArgPheAspAla305GlyGlyGluLysTrpLeuGluGlyLeuArgArgGin250ThrAla235HisArg220Glu175CysLeuThr190LeuGlyGlyArgPheSerGlyPhe205GluThrGlyAlaValGlyValGlyAspProAspAlaGlyProGly265CysCysLeuGlyAsp280GlyGlyTyrValAsn295GlyArgLeuCysGlu310HisGlyValLeuArgHisLeuLeu340AspLeu325■AlaLeuProGlyLeu315TyrAla300GluThr285SerGly270TrpPro255lieArgAspVal240ValGlyProThrAspTyrProArgAla.Val330AlaAspAlaLysGlyArgValArgHisArgAla355SerThrGlyLeuGlyAlaAspAspVal345HisLeuValAlaVal335AlaAsp320GlulieSerAla370AlaGluArgProSer385Glu360ArgGluHisCysVal350ValValGlyArg390Val375ValGluCysValPro395Arg365AlaAlaLeuProGlu380GluGluLeuAlaLeu400AlaAlaTyrSerProAsnGlyLysLeuSer405410<210>9<211>295<212>PRT<213>iVocflWasp.WW-12651<400>1MetSerArgGluAlaAlaGlyAspGlySerSerProValTyrPheLeu151015HisGlyLeuLeuGlyThrAlaTyrGlyHisPheGlyAlaGinlieAla202530AlaTrpSerGlyArgArgArgValValProValAspLeuProGlyHis354045GlyArgCysProValAspAlaGlyProAspTyrLeuAspThrAlaLeu505560GluTyrValAlaAlaLeuValAspHisPheGlyProGlyHisLeuVal65707580AlaAlaSerHisLeuGlyGlyProLeuAlaValArgLeuAlaGluAla859095ArgProGluLeuValGluSerLeuValLeuThrGlyPhePheProGly100105110AlaAspArgGluSerPheAlaArgLeuLeuAspGlyPheGlyValLeu115120125ValGluGluAsnProGluLeuAlaAlaGluTyrAspArgLeuHisPro130135140GlyArgTrpArgThrThrLeuAlaGluPheSerGlyHisAlaThrAla145150155160LeaLeu210ThrAlaGluPheAspAspArgAlaArglieAla165GlyCysAspValLeuLeuValAsnGly180185GluAlaAlaLeuAlaAlaArgSerTyr195200AspGlyAlaGlyHislieAla215AlaValGluGluPheTrp230GluAsnAspProAlaArg245LeuSerTyrLeuThrArg260265AspArgProSerThrlie280ArgArgSerLeuValSer290295Phe225LeuLeuArgValThrAlaProAlaGly275L>euArgArgAlaGluArgLeu170ThrLeuLysSerGlyProArgVal205SerHisAspAla220LeuGlyAlaAla235ProLeuAspSer250LysGlyLeuAlaGluGlyTrpVal285GlyAlaLeu175GluArgAla190HisGlyValProGluAlaLeuArgAla240LeuGluSer255GinArgGlu270AlaTrpAla<210>10<211>420<212>PRT<213>McaWasp.WW-12651<400>1LeuTyrValHisValProPheCysHis'SerLysCysThrPheCysAspGluAspVal35GinAlalieProTrpVal50SerValArgLysAsn65ArgGlyAlaGinCys40LysAspLeuLeuThr55lieArgAlaLeuThr45LysProTyr70ArgAlaAlaGly60ThrGlulieTrpGlylieTrpLeu85GlyGlyThrAlaSerSer100AlaLeuAspSerVal75ValProTyrValGin90AspAsnAlaGluGly115lieGluCysSerLeu105PheAspLeuSerGluThr80ValTyr95GluAlaAlaThr130PhePheArgGlyLeu145PheAspAla120AspThrValAspAla110ValAlaGluPro135PheAsnArgValThr125AlaLysLeuGluAspGluAlaAspAlaGly150LeuArgArgLeuLys140SerGlyValArg165lieValHisHisSer155ArgArgHisThr180AsplieMetSerGly170ArgGluAlaGlyValSerlie195AlaThrValGluAla185PheProAspGinGinSer160AlaGly175AspGluLeuArg210SerLeuTyrSerPhe225LeuAlaGlyThrGly200AlaValSerLeuPhe190LeuAspGluLys215ProThrProGlyGlu205LeuThrHisLeu230LysArgAlaTyrPro220PheMetArgArgLys240GluLysArgAlaTyrLeuArgLysGinGinAlaLeu245250255PheThrGluAlaArgArgMetlielieAspAlaGlyLeuProGluTyrThr235ArgLysGinGin260AlaSerGlyTyrPheGly275ArgAlaAspThrGinLeu290AspArgGinPheVal305lieGinAspProLeu325SerArgValLeuVal340GluGluTrpValLeuArg355ThrArgProSerValLeu370ArgGlyLeulieGlu385AlaGlyLeuThrLeu405ProGluSer.Ala420265ArgValSerPro280AlaGlyPheGly295SerHisAlaLys270PheAlaAlaMetTyrPhe285AlalieSerLeuLeu310AlaTyrAsplieAsp330PheLeuGinAlaGlyLeuAla345SerThrGlyThrSerGly300GlyLysLeuHis315ValProAlaGlyArgVal360lieAlaProLeu375GluArgGlylieAsp390lieGluLeuAlaPhe410MetPhe350AspLeu365PheLeuAlaAsp380ArgLeuAspPro395GluMetAlaMetAlaTyr320GinAsp335AspGlyAspGluArgGlyArgLeu400SerGin415<210>11〈211〉420〈212〉PRT〈213〉AbcaWasp.WW-12651〈400>1MetThrTyrGlyHisAlaHisAlaGluHisTyrAspLeuValPheArg1SerArgGly5AspTrpProAlaLys20ArgAlaProAla10SerAlaArglieValArgAsp35GlyAlaHisLeuGlu25AlaThrLeuLeu15AlaLeuGlyAla65lieThr50GlyValGluProAla40ThrPheAlaLysAla30ValGlyCysVal55GluAlaMetArgAsp45PheAlaAlaValGlyAlaGlyGlyArgThrAla70ValHisProGlyThr60lieAlaAlaAspGin85AspAlaValThrGlu75MetArgAlaPheMetProAsp115HisLeuSerProGlyGly130GluGluPhelieAsp145GlyLeuValliePhe100ThrAlaAlaLeuAsp90LeuGlyPheAlaCys105AlaAlaValAlaAsp95AlaArg80LeuTyrAsp120ValLeuValValGlu135TyrValGlyGlylie110MetAlaAlaGly150ArgVal'ThrHisSer165ThrHisMetArglieHisPheVal180GluAspGluThrHis155ValPro140LeuArg125TrpTrpGlyProValArgGluArgArgArgAspSer170AlaAspAlaAspThrPheHis195AlaPheGluArgVal185ThrLeuPheThrArg225Ala210AspAlaHisProAsn200GlyLeuAlaValGly190AlaGly175lieGinGly230Ala215TyrLeuValGlyVal235Thr220LysAsp205ArgValHisGlyAsp160AlaArgTyrAsp<210〉12〈211〉414<212〉PRT〈213〉Afecarf//asp.WW-12651<400>1MetThrGinHisAspArgSerLeuThrGlyMetGlyAlaCysArgLeu151015CysSerGlyProValArgGluPhePheAspPheGlyArgGinProVal202530SerAspAlaPheArgAspProAlaAspThrSerProGluPheHisTyr354045AspLeuArglieGlyValCysGlyGlyCysAlaMetValGinGinLeu'505560ThrGluValProArgAlaGinMetPheHisSerGluTyrProTyrArg65707580SerSerLeuSerSerGlySerArgLysHisPheGluAlaTyrAlaHis859095HisLeuLeuAspThrArgLeuAlaGlyAlaAspProPheValValGlu層105110lieGlyCysAsnAspGlyValMetLeuArgThrlieGlyGlyAlaGly115120125ValArgHisLeuGlyPheGluProSerGlyGlyAlaAlaAspSerAla130135140ArgAlaAlaGlyValSerValValValAspPhePheGluGluArgThr145150155160AlaArgAlaAlaArgAlaGluHisGlyProAlaAspValValPheSer165170175AlaAsnThrValSerHislieAlaTyrLeuAspSerliePheAla180LeuLeuAlaProValAspAla195GlyTyr185GlyValPheValTyrLeu210HisPheTyrLeuGlu225ArgPheGlyPheAsplieValTyrAsp200AsnThrAlaPheAla215SerValThrSerVal205GinPhe190GluValAspTyrPhe230Leu.ValAsplieAsp220ArgAsnLeuAlaGlu245PheThrlieAlaVal235ArgLeuProValGlyThrlieArg260AlaValThrGluArgLeuHis275ThrLeuGluAlaThr250AlaGlyAlaGluArg265GluGinAlaGlyHis255SerGlyArgAspArg240GlyAlaProAla290GluLeuValAlaLeu305ValGlyTyrGlyPhe295LeuArgGlyLeu310ThrAlaLysSerAla280GlyGlyArgValPro270LeuAlaAspArgGly285HisAlaArgAspArg300GluGlyArgSerAla325GlylieThrProGluLeuValProTyr340345LysLeuAlaProGlySerAla315ThrThrlieAsnAla330lieCysAspSerTyr335ProVal320CysGluLysHisGly355PheAlaGluProSerAla370HisThrGluGluGly360ProAspTyrAlalie390ThrTyr375LeuAlaLysGluGlylieProTyrThr350ArgSerSerVal365LeuPheAlaTrpAsn385GlyGlyArgTrplieThrTyrValProGluValArgVallieHis395ValLeu380AlaPheThrGluAla400405〈210〉13<211〉328<212>PRT<213>腸aWasp.WW—12651410〈400〉1ValLeu1AlaGlyAla65AlaTyr50ValAspGly145AspAla130MetGlyCysAlaAsplieAla5AlsCysAlaLysAla35ArgAla20AlaSerThrValThrAlaPheAlaLeuLeuProThrGlyGlyLysHisAspAlaAlaMetGluAsn115ValAla100ArgVal85LeuLeu70LeuGlyAla40AlaAsp55HisAlaValGluAlaGluArgMetPheAlaArgGlyThrlieProThrArg120Glulie135ArgProPro150LeuGlyGlyGly'AlaLeuLeuArgArg10ValAla25GluPheAspAlaGluTrpLysPro90AlaGlu105HisProGlyLeuAlsAspAspValArgAlaLeuProAlaLeu15ValAlaSerGlyCysValAla75MetGlu60AlaAla45AlaArg30AlaSerAlaValHisValTyrlieGluAlaLeuAlaAlaThrArgAlaGlyGinHisProAsp155GlyArg140lieArg125ValLeu110ValAla95ValAla80AlaLeuValArgLeuSerAlaArgTyrArgTyrTyrProLeuAla160His165ThrAlaLeuLeuLeuLeuGlyHis180AspGluArgLeu170ValArgLeuAspValGluArg195ThrLeuSer210HisTyrHis225ThrAlaAlaAlaArgArgAlaGlyGly200ValAsp185ValAspLeuAla215TyrGluLeuCysAla230TyrThrProProGlyGly205AlaHisUuThrPhe220ThrAlaArgAla245ValLeuGluArgProGlyGlySer260AlaAlaValMetGly235SerAlsAlsThr175GlyAlaVal190AlaLeuLeuGlylieAspGlyAspGlyGinPhe275ArgSerAlaAspThr290AlaLeuGluLeuArg305SerAsnAlaAlalie325Pro250ArgValGlylieAla280Leu265GluPheAlaAlaVal240GluVal255AlaProPhe270ValArgGlyHis295AspGluAlaArgLeu310ThrProLeuSerAla285AlaGlyGluLeuAlaValSerVal300ArgAlaGinAsp315HisArg320〈210〉14<211〉476〈212〉PRT〈213〉7V固Wasp.WW-12651<400〉1MetLeuAlaArgGlyAlalieGlyAlaArgLeuAlaGluSerAlaAla1SerGlyPro5ThrAlaValGluPro20GluArgAlaTrp10AspValHisAlaGluGinArg35ArgGlyTrpAlaPro25HisValGluArgAspLeu50SerGlyLysPheMet40AspProGluThrArg65AlaGlyProValAla55ThrValHisGlyPhe70GlyTrpSerGinGly60AspVal45Asp15TrpLeuAls30ProLeuAlalieGlyHisGlyValArgAspPro85GlylieAlaVallie75lielieAsnGinValGlyValLeu100GinAla丄ysAlaPro90GluPheAspGlyLeuLeuMet115ProThrValGinAla105ProGlyAsnLeuSer130GlyAlaAlaValGlu120ThrArgSerAsnAspCysPro95LeuPro80GluHisVal110GlyValGinGly145AlaArgVallieAla135TyrLeuGluHisAsn125ThrArgValHisPro150AspValArgGinTyr140LeuGluProAspAla165AsnArgAsnMetPhe155GluGinGlyAlaLeuArgLysArg180SerGluLeuAspSer170lieGluLeuAspLeuAspSer195SerThrAlaAlaAspThr225Gly210ValArgArgLeuSer200AspVal185SerGluValAspTrp175SerPro160PheGluSer190GlyGlyAlaLeu230Arg215AlaGluAspAspGlyPheCysAspAspLeu235Ser205LeuThrLeuAlaTrp220lieAsnMetAspAla240Ser245HisProThrArgArgThrValLeuSerCysLeuProLeuProLeuProGlyGluAlaAspAspGlySerLeu260AlaArgThrAlaAlaGlulie275GlyTrpSerGinPro250LeuGlyLeuSerTrpGlu265ValArgArgSerLeuThr290LeuPhePheGluVal305ValAlaGluTrpThr325ValAsp280AspGlyAlalielie270LeuAla255ThrArgAla295GlyValSerValPro285HisAspSerVal310GinProMetLeuArg300AlaCysGlyArgArg315ValArgAspValValAlaPheLeu340ProArgArglieArgGluProGlyAla330GlyValGinHisGinValArg355GinCysThrProGly345LeuAspValAlaGly335LeuSerGlyGlyGlu320LeuLeuThrVal370ArgProArgPheLeu385Leu'PheAspAlaCys360AsnTyrGlyPheAla350LeuAlaProAla375AlaValLeuSerGlu365ProAlaGluAlaAsp390MetSerGluGluLeu380ProAlaGluArgThr405ArgThrArgTyrLeuValValGlu420LeuGluArgAlaAla395GlyGlyArgPheTyrHis410415SerAlaAlaAspThrGlyThrGlyAsp435AlaAlaAspLeuValArgAsp425PheLysTrpValVal400AlaProAla450SerLeuLeuAla'CysLeuProGlyArgAlaAspHis455ProGly440SerHisTyrLeuAsn460GlyThr430AlaLeuHisGin445lieGinAlaArg465470<210〉15〈211>378〈212〉PRT〈213〉AfecaWasp.WW-12651<400>1ValPheGinProSerLeuGly15ValPheAlaSerAsnT卬Val475GluAlaSerGly65SerAla50ValArg35Asp20PheAlaAlaHisThrCysThrGlyProGlyAlaAlaAsnAspValAspAlaLeuHisLeu145AspPro130LeuThr115GlyPro100ProAla85ArgAsp70ValGlu55AspAlaThrLeuAlaThrLysGinValAspLeulieGluArg135AlaAsp150ArgAlaCysGlyThrPheAlaGluGluLeu10GlyLysGlyPro25LeuGlyValGly40AlaThrPheLeuValValLeuPro75AlaHisGlyAla90AsnProThrAla105AlaValValVal120lieAlaAlaLeuAlaAsnAla'Pro155GlyAspPheGlyAlaAlaValGlyGlu15ArgValAlaGluPhe30HisGlyAla60ThrGly45MetLeuMetArgLeuAlaValCysPheArgProValGluHisLeuCys140AlaHis125ThrVal110TyrGluPhe95GluGlySerAlalieValTrpSerPheVal80CysAlaGlyGlyGly160Asp200910055328.2AspProGluTrp225ValGin210AspHisAla305SerTyr290ArgLeuAla370Glu195Thrlie180His165AlaValSerVallieGluArgSerGlyPhePheGluValLeuAlaAlaLeuThrArgAspLeuVal275PheArg260Asplie245AlaSer230GlyAla215SerGly200GinAsp185Arg170GlyGlyMetLeuLysLeuAlaTyr205AlaCysValGinGluValSerlieProProTyrTrpValAspLeuTyrLeuHisArgAlaAspHisLeuSerAsp355AlaAla340AlaVal325AlaGin310AlaGin295ArgPro280LeuAla265LeuLeu250HisAlaPheGlyGluArgThrAspValThrArgThrAlaGly375Ala360ValLeu345ValSer330CysHis190Leu175AlaArgGlyLeuAlaGluArgPheSerArgArg235GlyAla220SerThrArgTrpValMetAsnArgLeuGlyTyrAspArgProAlaGlyProProHisGlylieTyrThr315ThrLeu300ThrHis285ArgGlu270ArgLeuProMetValAspGlyAlaArgLeu365His350LysGlu255PheAsp240PheAlaAspTyrArgTyrGlySerGluValAlsGluLeuPro335GinPro320GlyGlyAlaAla<210>16<211>392〈212〉PRT<213〉Afecar必3sp.WW-12651<400〉1MetAlsSerHisGlyHisValValProThrLeuGlyValAlaGluGlu1LeuValAlaAlaThrValVal65AlaLeu50AlaAla35ValArg20Val5GlyHisArgValAlaGluThrGlyArgGinAsnPheGluLeu55PheGly40ThrThr25Ala10TyrProAlaAlaArgValLeuGlyAlsLeuLeuAlaGluValArgAlaAspGinMetValProTrpPro145ArgAla130GlyVal115GluAla100ValAla85AsnLeu70TyrGlyAspArgGlylieGlyArg105ThrArg90LeuGly75ProGly60AlaPro45GlyGly30Tyr15AspTyrGluSerGlyAspProAlalieLeuAspLeuVallieAlaAlaGinThrlieAspAsnThrAlaValAlaHisGlylieGluAlaLeuAsn180Asp165lieAla150MetGly135AlaPro120LysProValTyrAlaArgGlyHisAlaArgProValAlaValPheLeuPro185Glu170SerMet155TyrPro140GinThr125MetGlu110AspVal95TrpArg80TyrGlyGinPheGlyArgAspAspAlsLeuLeuAlaAlaAlaPheGinGin190Thr175AspGly160SerAlaGluLysLeuGlyGluArgTyrValPheValGlyProCysLeuProLys195PheLeuGlyGluArgAsp210ValLeulieSerLeu225ArgSerCysValVal200ArgProProAlaTrp215ThrValTyrAsnCys205GluLeuProValGly230AspPheAlaAspSer220AsnValAspPheArg245GlyValAspProGlu235AlaTrpHisValSerLeuGlyAsp260ValHisArgTrpGly250ValLeuGlyGluAsnValGlu275AlaSerAlaLeuValThr290LeuHisTrpAlaThr305AsplieHisAlaSer265SerHisAlaAlaVal255ProPhe240lieProVal280GlyGlyLeuGlyLeu270LeuGluHisHis295ProValValValVal310ValValAlaLeuVal285ValMetThrGlySer300ValThrProLeuArg325GinValGlyArgPro315LeuGlyThrArgValAlaAspVal340ThrAlalieArgGly330ArgGluAlaValAlaAsnAsp355HisAlaGlyGlyLeu345AlaValAlaGluVal335GinVal320GluVallieArg370TyrLeuGlyArgVal385Ala390Ala375lieThr360AlaLysAlaAlaAlaAsp350ArgGluHisGlu380Met365GlulieGluSer<210>16<211〉392<212〉PRT<213〉AbcariZ/asp.WW—12651〈400〉1MetAlaSerHisGlyHisValValProThrLeuGlyValAlaGluGlu1LeuValAlaAlaThrValVal65AlaLeu50AlaAla35ValArg20Val5GlyHisArgValAlaGluThrGlyArgGinAsnPheGluValArgAlaAspGinMetValProTrpPro145ArgAla130GlyVal115GluAla100ValAla85AsnLeu70TyrLeu55PheGly40ThrThr25Ala10Tyr'ProAlaAlaArgValLeuGlyAlaLeuLeuAlaGluGlyAspArgGlylieGlyGinThrlieAspAsnThrAlaValAlaHisGlylieGluAlaLeuAsn180Asp165lieAla150MetGly135AlaPro120LysArg105ThrArg90LeuGly75ProGly60AlaPro45GlyGly30Tyr15AspTyrGluSerGlyAspProAlalieLeuAspLeuVsllieAlaAlaProValTyrAlsArgGlyHisAlaArgProValAlaValPheLeuPro185Glu170SerMet155TyrPro140GinThr125MetGlu110AspVal95TrpArg80TyrGlyGinPheGlyArgAspAspAlaLeuLeuAlaAlaAlaPheGinGin190Thr175AspGly160SerAlaGluLysUuGlyGluArgTyrValPheValGlyProCysLeuProLysLeu305AspTyr385Asp210Leu195PheLeuGlyGlu200ArgProProAlaTrp215ThrValTyrAsnValLeulieSerLeuGly225230ArgSerCysValArgAspPheAlaAsp245SerLeuGlyAspGlyValAspPro260ValHisArg205SerGluLeuProVal220AsnValAspPheGlu235AlaTrpHisPhe240lieGlyAlaTrpHisValVal250255ValLeuGlyGluLeuProProAsnValGlu275AlaLeuValThrTrpSer265SerHisAlaAlaAlaSer290HisVal280GlyGlyLeuGlyTrpHis295ValValValValAlaThrPro310lieHisAlaArgValValAlaLeu325ValAlaAspValGinVal340ThrAlalieLeu270ValLeuGluHis285SerValMetThrGly300ValThrProLeuPro315LeuGlyThrArgAlaAsnAsp355lieArgHisAlaGlyGlyGlyArgArgGly330ArgGluAlaValLeu345AlaValAlaGluVal335GinVal320GluValArg370LeuGlyArgValAla390Ala375lieThr360AlaLysAlaAlaAlaAsp350ArgGluHisGlu380Met365GlulieGluSer<210〉17〈211>402<212>PRT<213〉V固Wasp.WW—12651<400〉1MetThrArgAlaAspAlaAlaThrTyrProPheProValArgCysPro1PheThrLeuAlaProHisPro65GlyGlu50AlaVal35GinPro20Arg5AspGluLeuGluLeuProThrValArgThrArgGluArgLeuAlalieValGlyGinValArgGlyVal145AspPro130LeuGlu115ValVal100LeuAla85LeuAla70AspVal55AlaGly40LeuArg25Ala10LeuSerArgGluProAlaTrpLeu45Phe15ProAlaAspGluLysProGlyProAlaAspAsnProArgAlaGlyAlaAspPheMetCysAlaLeuAlaTrpAlaPheGlyAlaAlaArgLys195Ala180ProAla165MetTyr150GlyAla135AlaAla120GluHis105ValHis90AlaGly75GluArg60GlyGlyPheArgTrpArgGluSerValGlyArgLeuPheAlaPheValProAlaLeuArgGlyArgAlaAspGlyThrLeuVal200His185LeuAla170AspAsp155AlaArg140LeuAla125LeuArg110AspProLeuGlySerMetAlaAlaArgProAlaLeuAla205Glu190GluGlu175LeuValGlu30ValSerGlySerArgArgAspArg95ProArgArgProAlaPhe80LeuAlaGlyAspPhe160AlaValValArgGlyProAspGlyAspArgLeuSerGluThrGluLeuValSerThrVal210LeuLeuVal225AsnGlyLeuSerlieAla230LeuAlaLeu245AlaAlaGlyGluValAsp260AlaGlyThr215GlyTyrGlu220AlaValGinPheThrGlyAlaValGinPheGly235240PheGinHisProAspGinLeuAlaArgLeu250255AlaValGluGluValUuArglieAlaAla265TyrAlaGinAlaGlyThrGlyPheAlaGlyMetThr275280AspValAspLeuGlyGlyThrThrlieProAla290295SerLeuAspAlaAlaGlyArgAsplie'SerLeuAspAlaAla305310HisGluPheAspLeuAlaArgGlyAla325GlySerGlyArgHisTyr340GlyPheAlaVal270TyrThrSerAla285HisAlaGinValLeu300ArgValGluArgCysLeuGly345LeuGinGluGlyPheAlaAlaLeuVal355360ValArgProAspGluValVal375ProAlaGluLeuProThrThr390AlaPhe385AlaAla370TyrArgProGlyArgValGluArgPro315320AlaGlyGlyHisLeuSerPhe330335AlaProLeuAlaArgValGlu350LeuProGlyLeuArg365ArgThrMetPheSer380PheGluArgThrAsp400ArgGlyMetGlyTrpAla395〈210〉18<211〉370〈212〉PRT〈213〉yVocar&'asp.WW-1265191<400>1MetAlaAspThrGinAlaProProHisGlyLeuLeuTrpArgAlaGlu1ThrAsnGinArgAspProLeu65ArgThr50TrpPro35ProTrp20His510ValValThrThrHisGluValAlaAsplieGlyThrGlyAlaAspTyrArgArgAlaAlsTyrGluAlaArgLeuVaJPheArg145LeuMet130ValAla115GlyAla100AspSer85ArgGly70AlaAsp55AlaAla40Val25LeuAspProAspProThrValAsnHisProAlaAlaValGluLeuAlaPhelieAlaPheProAlaLeuMetPheProGinArgArgAspAlaAlaAlaAla195Thr180PheGin165AlaVal150ArgArg135liePro120HisGlu105PheAla90AlaThr75AlaSer60PheArg45GinThr30Ala15ValLeuAlaValPhePheGluLysHisArgPheAlaProLeuProAlsAlaLeuAspGinAlaAsnLysGinArgAlaAlaPheGluAla丄euLeuAlaGinAla200Ala185GluGly170AlaPhe155SerLeu140LeuSer125AlaGlu110ThrAla95GlyLeu80PheAspPheArgLysSerTyrGlyValLeuValLeuAlaProAspProAlaAspGlyGlu205Thr190liePhe175ProAsp160LeuLeuProTrpAlaAspValAlaThrValGlyGinLeuLeuAlaAlaGlyValProGin210215220ValGluThrGlylieAlaValAlaAlaHisAlaLeuLeuThrArgPro225230235240GluAlaValGlyAlaAspLeuAlaGlyValAlaGluGluAlaMetArg245250255LeuAlaProProPheLeuGlyliePheGlyTrpValThrGluProCys260265270AspCysLeuGlyValArgLeuGluProArgThrAlalieValValAsp275280285lieProAlaValAsnAlaAspProAlaLysValAlaAspProAlaAla290295300PheCysProGlyArgSerArgAlaGluAsnlieThrPheGlyLysGly305310315320AlaHisTyrCysLeuGlyAlaAlaSerAlaArgAlaGinValValAla325330335AlaLeuArgGlyLeuLeuAlaAlaArgProAspLeuAspLeuGlyAla340345350LeuGinArgAlaAspAspGlyPheAlaGinSerlieThrAlaLeuHis355360365Tyr'Arg370<210〉19〈211〉412<212>PRT〈213〉yVocaWasp.WW-12651<400>1MetThrThrThrlieProValGluProValAspLeuAlaAspAlaAla1LeuValGlu5ProTyrProHisAsn20ArgSerSerValAlsProVsl35CysHisAlaValAlaGin50ProMetLeuArgTrp40GlyGin65SerTyrAlaLeuPhe55LeuGinAlaAla10AlaArgLeuArgCysTrpPheAspSerArgTyr25Asp15GlyAlaGly30AlaThrHisAla45SerAlsVslGlyGly70GluProProProPhe60ValSerGlyAlaPro85ArgArgThrThrVal75ProAspAlaSerArgAlaGinGly100LeuTrpProGlyGlu90ArgAlaLeuSerValAspGly115LeuAlaAlaArgGly105AlaAlaAlaCysAla95GlyArg80HisTyrAlaAsp130AlalieProLeuAla145AspAlaAspLeuPhe120GlyProValAspThr110GluLeuAl3Pro135ArgLeuLeuAlaArg125VslAlsAspTyrThr150AlaPheArgAlaVal140LeuMetAlaliePro165AlaAlaAspGinAsp155AlaGluSerGlyProProAlaAsp180AlaArgSerAlaTrp170ArglieValArgGluLeuLeu195lieArg185GlyArgLeuArgTyr175lieAla160GlyArgAspGly225Phe210GlyValGlyGluGlyHisLeuGlyGluHis230Val200AlaAsnProGlyGly190ProThrGinVal215LeuGluPheValGlu205LeuThrGlyGlyLeu235Thr220GlyThrGlyLeuMet24094lieSerLeuValAspAleiAspArgAla275ThrValThr245LeuAla260LeuValHisGinArgHisProGlyProAsp305SerSer290GlyGinAlaLeuThrProlieAlaAsnValGlyArgGlyAlaHisSer385LeuMet370GlyThr355LeuArgAsp325AspThr340SerCysPro310ProGly295AlaAlaArgAlaLeuGlyAlaAlaLeuAlaValArgProValHisLeu405Phe390ThrVal375ProPro<210〉20<211〉380<212〉PRT<213>Abca/^'asp.WW-12651<400〉1GlyLeuVal250ProGlyGin265AlaValGlu280ArgLeuAlaGlyGlyLeuGinTrpPro330AlaAlaArg345AlaAlaMet360AspAlaAlaGluPheMetAlaArgSer410LeuSerPheGlyThrLeu255TyrAlaArgGluGlyArgVal315AspAla300LeuLeu285AspVal270ArgArgAlaTyrAspValVallieCysAlaAspThrLeuValHisLeuThrSerArgAspThr395AspAla380ArgGlyGin365ValPhe350AlaPhe335GlyGly320AspTrpMetSerThrProSerGlyTyrThrAla400MetSer1AspAlsGlyLeu5AsnArgLeuLysValAlaLeuAlaAlaThrAlaLeuProAspGlyLeuArgTrp15AlaAspArg20ArgAspProHisLeu10LeuSerProAlaValValLeu35AlaGlyMetAlaThrAla50ThrGinPhePheGlu65PheAsnThrGluVal25lieThrGlyVallie40MetProGluGluAsn55TrpTyrThrValLeu30AspArgSerArg45ThrProSerlieLeu70ArgLysValPheAla60AspAsnTyrLeu85PheGluArgMetSer75lieArgSerAlaTyrValAspMet100GlyAspLeuAlaThr90AlaGluArgAlaProAlaAsp115ThrPheAlaMetAla105AspTyrPheSerAlaPro80AspSer95AlaLeuAspSer130LeuThrLysValAla145LeuGlyValThrAsp165LeuArg120GlyValProGluAla110PhePheMetLys150Tyrlie135LeuVallieHisPro125AspTrpProAsnValMetArgTyrLeuLys180PheValAspAlaGlyAlaArgAspLeu155GinAla140PheLysGinLeuAspSerPro195TrpProlieAlaSerThr210lieGluAla215GlyAla200LeuThr185ArgGlu170AspArgLeuLeuGinLeu160AlaAlaPheAlaAla175GluAlaArgLeuSerGlyAspArgAlaGlyProMetlieValGlyGlyAlalieAlaSerArgMetValTrplieGlyGinLeu220SerAla205LeuAla190MetMet225230235240SerAspProGluLeuProGlyLeuLeuArgAlaGlyGluValAspAla245250255GlyGluValAlaGluGluCysMetArgGinSerProProPheGlyAsn260265270ValPheArgPheValAlaGluProCysSerCysLeuGlyValProLeu275280285GluProGlyThrlieValAlalieAspThrGluAlaValAsnLeuAla290295300GluSerGlyProThrAlaProValArgGlyCysProValArgProThr305310315320AlaValLeuThrPheGlyArgGlyGlyHisTyrCysLeuGlyAlaAsn325330335ThrAlaArgArgGinValAlaAlaAlaLeuArgAlaLeuValThrAla340345350ArgProGlyLeuArglieAspProAlaAlaValArglieAspThrHis355360365AsnAsnLeuLysGluValArgAlaLeuProTyrSer370375380<210>21〈211>426〈212〉PRT〈213〉7V織Wasp.WW—12651<400>1ValThrThrGinAspGlyGinAspSerGinAspGlyGin.AspSerGin151015AspSerThrValGlyLeuThrGlyLysThrTyrProPheGluArgLys20CysProPheAlaMetProGlu35AlaGinValLys25PheAlaTrpAlaProVal50LysTyrGlyAspGlu40GinSerGlyAspThr65ArgThrlieAsnLeu55LysAlaAlaLeu30ArgGluAsnGlu45AlaTrpLeulieVal70GluGlyAlaAla85SerProValPheAlaAspArgSer100HisThrArgTrpArg90PheGly75ValLeu60AspAspArgPheAspGlyThrArgGlyGlyGlySerProProGly115GinAlaAspAlaThr105ArglieValAsnPhe95SerSer80SerGinGinArg130ValLeuAspGluArg120ArgAlaGlulielie110AlaPheThrGlu145AlaAspTyrAlaMet135GluAlaArgGlyLys125ArgHisThrGluLeu150LysLeuProlieAla140SerPheAspLeuTyr165GluSerArgProPro155lielieCysAspGlylieProAsn180ArgAspMetGinArg170PheThrGluLeuLeuThrArg195■LeuGinGly210LysAsnLeuGly225AspAspGluThrGlu185GlyPheAlaAlaLeu175AlaMet160LeuLyslieGlyArgGlyAspGin245Ser200AlaValGlyLeuTyr215LeuLeuSerThrAla190PheGlyGluAla205ValArgLysArgAsp230LeuSerAsnGlulie220lieGinLeuArgGlu250LeulieGinLeuArgAsp235240LeuValSerThrVallieVal255UuLeuUuMetAlaGlyTyrGluSerThrAlaValGinPheGlyAsn260265270AlaPheTyrAlaLeuPheArgHisProGluGinLeuAlaLeuLeuArg275280285GluArgProGluLeulieGlyGlyAlaValGluGlulieLeuArgTrp290295300AlaGinMetGlyThrGlyPheAlaValAlaLysPheAlaThrGluAsp305310315320lieProMetProGlyAlaThrlieProAlaGlyGlyThrValPheVal325330335SerLeuGlySerGlyAsnArgAspGinGluValPheGlyProAspAla340345350GluLysPheAspValThrArgValAlaProAlaArgGinUuAlaPhe355360365GlySerGlyProHisPheCysLeuGlyAlaAlaLeuAlaArgAlaGlu370375380MetGinGluGlylieLeuArgLeuLeuThrArgPheProAsnLeuArg385390395400TyrAspGlyAspLeuAspAlaValProLeuAlaSerAsnLeuPheThr405410415TyrTyrProArgGluLeuProVallieAla420425<210〉22<211>207〈212〉PRT〈213〉AbcaWasp.WW-12651〈400〉199MetSerGluThrAlaLysThrSerArgThrAlaArgSerSerLysLeu151015ValSerLysValTyrAsnAlaAlaTyrLysValGlyPheSerProVal20AspLeuGlyProProMetPro35LeuAlaProGlyTyr25LeuValAlaLeuTrpAspArg50LysSerlieTyrGlu40AlaLeuAspLeuSer30GluGlyProGly65AsplieAlaProArg55AlaGluHisGlylie45CysGlyThrGlyLeu70AlaLeuArgArgGly60SerValThrGlyGlu85ValGluPheValTrp75ArgLysArgAlaAlaGlyValAsp100LeuGlyGlyProAla90CysAspLeuValAlaGlyAla115SerLeuArgAspGlu105AspPheLeuLeuSerHis130GlyValAlaAlaTyr120AlaLysAlaArgAla145LysGlyProLeuGlu135GlyAlaThrLeuAsp125AlaGly95lieGlyGluGlyValAsp110PheAla80AspProCysPro150ValArgProGluTyr140LeuTyrAlaPheSer165LeuValSerAlaTyr155lieAspThrAlaProHisTrpAsp180ProAspAlaGlyProMetTrp195Glu170ProGlySerValTyr200Val185ArgMetThrArgArg205Arg190AlaPhe175ArgAlaThr160AlaThr<210〉23<211>261<212>PRT<213〉W固Wasp.WW-12651<400〉1ValAspSerSerPheGlyValGlyLeuTyrGlyGluGinAspArgAsp151015GlyLeuProAlaGinAlaLeuAlaAlaSerLeuGlyCysGlyAsnPro202530ThrAlaValAlaGluLeuArgAlaGlyGluArgValLeuAspLeuGly354045SerGlyGlyGlylieAspValLeuLeuSerAlaArgArgValGlyPro505560ThrGlyLysAlaTyrGlyValAspMetThrAspGluMetLeuAlaLeu65707580AlaLeuAlaAsnLysAlaSerAlaGlyAlaAspAsnValGluPheLeu859095LysGlyThrlieGluAlaLeuProLeuProAlaGlyThrlieAspVal100105110VallieSerAsnCysVallieAsnLeuSerValAspLysProAlaVal115120125PheAlaGluMetPheArgValLeuAlaProGlyGlyArglieGlyVal130135140SerAspValValAlaGluAspAlaLeuSerAlaThrGluArgAlaGlu145150155160ArgGlySerTyrValGluCyslieAlaGlyAlaLeuThrPheAlaGlu165170175TyrArgArgGlyUuGluArgAlaGlyPheAlaAspValAsplieThr180185190AlaThrHisGinValAlaAspGlyMetHisSerAlalieValArgAla195200205ValLysProAlaThrGlyProValAlaGluProAlaAlaValAlaAla210215220SerGlySerCysCysGlyValSerAlaCysCysThrProAlaGluSer225230235240AlaLeuAspArgSerSerThrValAlaGluAlaLysAlaAlaSerGly245250255CysGlyCysGinSer260〈210>24<211>174〈212>PRT<213>yVoK//asp.WW—12651〈400〉1ValThrThrHisAlaAsnHisProSerHisGluAlaAlaProGluGly151015ValGlyPheAspAsplieProAspMetProAsnPheAlaValLeuLeu202530ValSerAspLeuGluLysSerLeuGinTrpTyrValAspGlyLeuGly354045PheTrplieGluLysLysLeuThrGlyProAspGlyGinlieAlaVal505560lieHisLeuArgArgAlaGln'TyrArgAspMetLeuLeuArgProAla65707580ArgGluProLeuAspGlyProLeuGlyArgGlyValArglieSerPhe859095ThrLeuAsnAlaGluThrGluAlaSerMetArgGlulieAlaAlaArg/114頁AlaGlyAla115TrpAsnThr130ValLeuThr145LysSerVal100LeuProGinGly105ThrValAsn120AlaThrAspValAspValGlu135ThrValAlaAspArgAlaArg150LeuAlaAspAspThrProVal165170110GlyProUuAlaThrPro125ProAspGlyTyrValVal140ThrTrpSerGluLeuLys155160GinLeuAspSer〈210〉25<211〉169〈212〉PRT〈213>AbcaWasp.WW-12651<400〉1ValPheArgArgTrpHisGlyGlyProGlyAlaAspGlyArgAsnThr151015ProValThrThrArgProArglieThrAlaSerAlaLeuThrLeuAla202530GlyAlaLeuValLeuSerAlaCysGlySerAspAspAsnArgAspThr354045lieLysTrpThrLeuAspLysGlyAsnValProValProThrAlaThr505560lieProlieAspCysGlyGlyThrArgAlaLeuThrGlyGluGlySer65707580ThrAlaGinLysGlyAlaMetAspValPheValAlaAlaTyrThrGin859095GinCysProGlyGinGinMetAlaTyrThrAlaSerGlySerGlyAla103GlyValLys115LeuSerAla130CysGly145AlaValGlyVal100GinPheLeuAlaLysProGluArg135AsnProAlaTrp150TyrGinlieArg165105110GlyLeuValAsplieGlyGlySerAsp120125GlyGluValThrAspAlaAlaAlaArg140AsnLeuProLeuValPheGlyProVal155160TyrLeu〈210〉26〈211〉327<212>PRT〈213〉AbcaWasp.WW-12651〈400>1AlaAsnThrValValProLeuAspAlalielieAlaGluLeuTrpGly65707580AspThrThrProArgSerAlaArgAlaValValGinThrTyrValMet859095GinLeuArgLysGinAlaAlaLysValLeuAlaGlyArgValAspAla100105110ProGluSerValAlaArgGluLeuValArgThrGinProGlyGlyTyr115120125ValLeuSerAlaAspGluProSerValAspAlaTrpAlaPheGluArg130135140LeuThrThrAlaGlyHisArgGluArgGluSerGlyAspLeuValAla145150155160AlaSerArgSerPheSerAspAlaLeuAlaTrpTrpArgGlyGlyProLeuLeuLeuGinLeuVal225AlaArg210AsnLeuAspValAlaLeuThrPro305HisAsp290AlaAspVal180GluAla195LeuGlyArgTyrTyrArgArgAla260ArgArg275LeuThr165GinThrGlyAlaHisLeuAsnArgHisProSer245ArgThr230GlyGlyProlieProAlalieAla325Pro310SerTyr215HisLeuHisArgAspThr〈210>27〈211〉141<212〉PRT<213>TfecaWasp.WW—12651Ala200GluMetlieAlaTrp295AlaAsnSer280GinVal185LeuLeuLeuGlyGluGly.Leu170LeuAsnSerTyrAspArgArglie205GluLeu220AlaHisArgArgSerGlu265MetGlu250LeuCys235AlaLeuGluAlaLeuGluLeuValAlaThrValAspLeuAlaAla315SerAsp285ValPro300ThrSer175AlaLysArg190GluValAspThrAlaLeuLeuMetLeu240ValTyrArg255ProSerPro270ArgAlaProProArgLysTrpAsplie320〈400〉1MetArgThrAspProPheArgGluLeuAspArgLeuThrGinGinValPheGlyThrTrpThrArgProAlaAlaMetProMetAspAlaTyrArg202530GinGlyAspGluPheValValValPheAspLeuProGlyValThrSer354045GluAlalieAspLeuAsplieGluArgAsnValLeuThrValLysAla505560GluArgArgProThrAlaValGlyGluGlyAlaGluThrGinlieAla65707580GluArgProHisGlyValPheSerArgGinLeuPheLeuGlyAspGly859095UuAspThrAspArglieGinAlaAlaTyrGluAsnGlyValLeuThr100105110LeuArglieProValAlaGluArgAlaLysProArgLyslieSerVal115120125AlaGlyAlaAspProAlaGluProLysGinlieAspAla130135140〈210>28〈211〉202〈212〉PRT〈213>yVo度Jj'asp.WW-12651〈400>1MetGluTyrGinGluAlaArgAspAspLeuSerProArgTyrGlyAsp151015ValProSerMetGinLeuValGluAspValAlaArgGlyGluAlaAsp202530ProAlaHisValLeuSerAlaLeuValLeuValArgHisLeuArgAla10635GlyGluLeuGluHisLeu50ValSerTrpAlaGly65GinAlaAlaGlu40ProGinLeulieAla55ArgLeuAlaProAlaLeu7075ArgTyrLeuArgLeuArg45AlaArgGluArgAla60GlyValAlaSerArg85GluArgValArgAlaThrGlyGlu100ValThrAlaTrpLeu90GluArgAspProAspAspAspArgAla115AlaGlyGinValAla105AlaArgAsnSerAspArgGlyLeu130ArgThrAlaAspAla120GlyLeuProHis110AlaAsp95AlaLeuArg80HisGlyArgArg145SerAspLeuLeuAla135ValHisThrAlaAla125ThrGlyAspAlaAsp150ProLeuHisAspAla165LeuAlaAspArgAlaHisProGly180ThrArgLeuArgHisAlaSer195Arg200lie185AspLeu140GlyGlyAspArgLeu155AlaAlaProHisLeuArg170175AspAlaValThrAlaGluAla190ArgAla160AlaThr<210>29〈211>378<212>PRT<213>AbcaWasp.WW-12651<400>1MetAspGluValLeuLeuArgSerLeu1LeuGlyArg5GlyAlaAspPheArg20AspAlaLeuValGluAlaVal35LysGlyTrpLeu10AlaAlaGluAspAla25ValTrpProAla15ValGinAspPro50AlaArgSerAspArg40AlaValAlaTrpAla30ProProArgAla65GlyGluProValVal55AlaArgArgArgSer70GlyGluAlaProArg60GluAsp45ArgPheLeuAspPro85CysAlaiHisProArg75ValAspAspThrAspSerValAspLeuTyrPheLeu100LeuArgAlaValAlaValAsdAspThrLeu9095LeuThrProSerSerAlaAlaLeuThr115TyrLeuValProSer105GlyLeuThrThrAsp80GinValGinAla130AlaLysArgThrVal145AlaThrValLeuGly120AlaThrMetAlaGlu135GlyValArgLeuAla150ValLeuTyrLeuArg165GlyAspValAspLeuAlaAlaGlu180lieAspHisProHis155PheGin140GinSer110ArgGinlieAla125ArglieSerArgProGlyAspGlyAsnGluGlyVal170lieArgLeuThrAlaAlaAla195HisHisAlaArgAla185ValAlaGlyUuTyr175GinVal160SerLeuLeuLeu225Leu210ValProLeuAlaGlu200ThrAlaArgThrArg190AlaLeuMetAsp230Arg215GinAspArgSerLeu205ProAspGlySerArg235Ala220TrpAspAsnAlaLeu240lieSerGluGlyValAlaValLeuGinAlaAlaLeuSerArg245GinAlaGinLeuGlyGluPhe260AlaProAlaAlaGlyGluThr275LeuAlaAlaAla250lieAlaAlaAla265TrpValGinlieAspGlu290ValAlaValAsp280AspAsnProlieAla305LeuAlaAlaLeuHisLeuHisGlu340AlaGluAlaAlaArgLysAla355ThrArgGinAlaArgLeuThr295GlyGluAlaAspGlyPro310AspAspAlaLeuPro325ArgAspGlyLeuHis270ValGlu285LeuLeuAspArg370AlaArgLeu375Val300AlaGlyLeuArg315HisThrAlaValArg330AlaArgAlaArg345AsnLeuAlaGluPro360AsnThrArgGluArg255AlaAspTrpTyrAsnArgAlaAla320AlaAla335LeuTyrAlaArg350ArgAspHisLeu365<210>30<211>139<212>PRT<213>;VocaWasp眉一12651〈400〉1LeuAspValLeuThrGlySerTrpArgAlaThrLeuSerAsnAlaTrp151015PheLeuGluProProAspGinGluValGluGlyThrAlaThrAlaGlu202530TrpLeuAlaAspAlaPheValValPheArgTrpThrlieSerGlyGlu354045ProGlyThrAlaThrThrGluMetValLeuVallieGlyArgSerAsp505560AlaAsnAspAlaTyrThrAlaLeuTyrHisAspGluArgGlyValAsn65707580ArgValPheAlaMetThrPheAspAlaAlaArgTrpThrMetSerArg859095AlaAspProAspLeuPheGinArgPheValAlaAspValThrProGly100105110ArgValThrGlyArgTrpGluAlaSerGinAspArgGlySerThrTrp115120125ArgLysAspPheAspLeuValPheGluArgAla130135<210〉31〈211〉147〈212〉PRT<213>AbcaWasp.WW-12651〈400>1Met'GlyArgThrSerThrArgArgThrThrMetAlaLysTyrLeuLeu151015LeuLysHisTyrArgGlyAlaProAlaAlaAlaAsnAspValProMet202530AspGinTrpThrProGluGlulieThrAlaHisValGinTyrMetArg354045AspPheAlaAlaArgLeuGluGluSerGlyGluTyrValAspGlyGin505560ProProValThrAspGlyProPheAlaGluThrLysAspLeulieAla859095GlyTrpMetVallieAspValAspSerGinAspArgAlaValGluLeu100105110AlaGlyGluLeuSerAlaAlaProGlyAlaGlyGlyLysProlieHis115120125GluTrpLeuGluLeuArgProPheLeuAlaAlaPro.ProThrlie■Thr130135140GluCysHis145<210>32<211>117〈212>PRT<213〉W固Wasp.WW-12651〈400〉1MetThrlieThrTrpSerProAlaSerCysSerAlaTrpMetThrGin151015GlulieGinAlaArgAlaSerSerSerSerGlyProValGlyAlaGly202530ValGinGlyValProAlaLysArgSerThrProArgAlaAlaLysArg354045ArgGinlieArgSerProAlaArgSerArgThrLeuThr■ValAsnVal505560ProLeuArgArgMetValGlyGinValAspAspAspLeuAlaAlaHis65707580illThrSerThrArgGlyGlySerArgAspThrAspVallieGluLeuGin859095AlaLysProThrGlyArgProArgAlaSerValGluValThrMetVal100105110ThrProValGlyArg115<210>33<211>151<212>PRT〈213>〃ocaWasp.WW-12651〈400〉1ValHisLeuThrlie'lieLeuTrpAspLeuAlaGluSerAspGinThr151015ValAlaSerLeuArgSerTyrLeuArgAspTyrAlaValGluAlaTyr202530SerAlaThrProGlyLeuArgGinLysValTrpValAlaAsnThrGly354045ProGluGlyGluThrTrpGlyAlaValTyrLeuTrpAspAspGluLys505560AlaAlaTyrGlyArgProProGlyValSerArgValValGluLeulie65707580GlyTyrAlaProThrGinArgSerTyrPheSerValGluAlaGlyAla859095AspGlyProLeuAlaGlyAlaLeuAlaGlyLeuGlyLeuAlaPheThr100105110AspProAlaAlaGluProMetArgArgProMetGluPheAsnProPro115120125GlyAlaSerAlaPheThrLeuArgAlaAspValValAlaGlySerPro130135140LysGinGlyGlyAspGlyArg145150<210〉34〈211>593<212>PRT〈213>;Vocarc(/asp.WW-12651<400>1MetSerAlaAsp1ValArgHisSerlieHisAsp65AsnLeu50GlyArg35AspAsp20GlyThr5AspArgGlyValTrpLysGlyAlaGlyPheLeuTrpMetArgAlaAspLeuVal130Arg115GlyGlu100ProLys85ArgCysPheAlaValLysAlaAspAla10GlyGluProSerArgArgSer70ArgSer55ValGlySerGlyTyr40ValTyrProAlaValThrArgVal135Met120AlaLeu25GluArgValGluHisHis105ThrPro90LeuAsnAspHisLeuValGluAlaAsp丄euAlaArgLeulie75ValCys60AspThr45AlaArgValArgLeuArgAlaAla140Thr125LeuGly30ValGluHisAlaAlaPheLeuAsp110ArgPhePhe15SerPhePheAlaGlyLeuProThrLeuAlaGly80ProAsp95HisHisProValAspAlaLeu113AlaGluPheGlylieAlaThrAlaArglieValSerThrAspPro145AlaAlaValValAla150AlaGluAlaAlaVal165HisAlaAspLeuVal155ArgAspProHisTrpThrLeuAsp180ValValLeuAlaThrAspGlu195LeuGinTrpArgGlu170AlaAlaPheAlaGlu185AspAspAlaAspLeu175ProGlu160AlaAspAlaAsp210AlaThrValSerVal200ArgAlaThrGlyPhe190AlaAlaLeuLeu225ValAspTrpCysLeu215TyrLeuValAlaGly230GluCysValHisPro205SerProValAlaVal220AlaProProSerTrp245ThrGlyLeuAlaAla235SerValValAlaValGlyGlyAla260AlaAlaLeuHisValAlaGin275AspGlyAlaGlyArg250ProAlaAlaThrPro265ValPheAlaArgAla255AlaGly240ProLeuAspLeu290ValArgThrHisHis280LeuThrSerAlaAla270AlaGluValVal305GlyAlaAlaThrLeu295GlyArgArgHisThr310AlaValValGluLeu285GluProLeuAlaPro300MetCysArgArgAla325ProGinAspProPro315ValGluProValAspValProAla340GlyAlaThrAlaArg330ArgLeuThrAlaGly360GluPro345TrpThrAspGinArg335SerHis320ProAspArglieVal355LeuLeuSerLeuGlyGluGlyGluAlaAspGinLeuProLeuSer.AlaVal365ProVal350ValGlyPro370ThrCysLeulieSer385ValCysArgAlaAla390Ser375AspProValGlu380AlaSerArgLeuVal405TrpThrAlaProArgGluAlaAlaLeuGlu420AlaAlaTrpGlyProAlaAsp435AlaValAlaAlaTyrArg450TrpGinSerAlaSer465LeuThrAspThrAla455ProLeuGluAlaLeu500PheGluValAlaGluGlyAspGlyGlu515AlaLeuLeuArgAsn530LeuAlaProProArgGlyArg395ArgAsnGinValAla410LeuAlaAspHisArg425GlyTrpThrSerAla440SerLeuAlaLeuGly430GluVal415ValAlaLeu400LeuGlyTrpAla445ProAlaSerLeuGlu470LeuAlaAlaGlu485ProThrGlyLeuHisGlyAlaGlyGlyPro柳ProValHisGlyAsp475ProTrpThrAlaArg490ArgAlaArgValHis505GlylieAspAlaThr495ThrPhe480AlaAlaVal520ValAlaGlyArgArg510HisAlaValHis545ArgAlaGinGlyProPheLeuGly580ArgAla535AleiThrTrpProAla525AspAlaValAlaVal550ArgProProGluPro565AspAlaAlaCysLeu585Gly540AlaValAlaAlaGlu555AspValThrHisAla570AlaAlalieProGly590Leu575GlyVal560LeuAla<210〉35〈211>246〈212>PRT<213〉yV織Wasp.WW-12651〈400〉1ValGinProThrAlaValArgAlaAlaThrValAlaProLeuGlyGly151015ProValPheAspGlyProGlyLeuAspGluThrThrArgGlyPheLeu202530AlaAspThrAlaProValAlaValAspLeuSerThrArgProAspArg354045ThrGlyAlaAlaLeuThrLeuMetThrAlaHisLeuAlaAlaValAla505560AspProAlaArgSerGlyAspGlyProProLeuSerPheLeuSerPhe65707580ArgSerHisAlaGluAlaPheLeuAlaThrThrArgAspProAsnAla859095AlaArgHisAlaPheAspThrArgTyrThrAspHisArgThrThrVal100105110GluAlaAlaValArgAlalieLeuLeuAspGlyAspProGlyAspAla115120125AlaProTrpSer'AlaAlaAlaArgAlaAlaLysProArgPheThrAla130135140GlyPheAlaSerAlaAspLeuValAlaHisThrGlyTyrThrArgAsp145150155160HisLeuArgGluArgThrAspPheAlaAspAsnProPheHisSerArg165170175AlaGlyAlaSerGluGinLeuGinAlaTyrLeuGlyGlyAspProSerPheLeuAla195SerSerGly210AlaLys225AlsAsp180185190ThrArgLeuLeuThrSerLeuLeuTyrValThrLeuHis200205ValSerLeuMetGinArgTyrPheLeuCysHisAlalie215220AlaCysGluSerlieTyrHisValAspSerMetSerLeuLeu230235240GlyLeuAlaVal245<210〉36<211〉135〈212〉PRT<213>yVbca/Y/Zasp.麗—12651<400〉1MetGlyValAlaThrGinMetLeuGluSerHisProHisAlaSerAsn151015GluThrGlyThrAlaGluLeuAlaAlaCyslieGluAlaCysPheGlu202530CysAlaGinThrCysThrAlaCysAlaAspAlaCysLeuGlyGluPro354045SerVal'AlaGluLeuValAspCysValArgSerAspLeuAspCysAla505560AspValCysGluThrThrGlyArgValLeuSerArgArgThrAlaPro65707580AspGinAspVallieArgAlaLeuLeuGluThrCysAlaLeuAlaCys859095LysArgCysGlyAspGinCysAlaGluHisAlaAspHisHisGluHis100CysArgThrCysAlaGluAla115AspLeuLeuThrThrLeuArg130135Cys120105ArgArgCysGluArg125110AlaCysArg<210>37<211〉153<212>PRT<213>爆aWasp.WW—12651<400>1MetlieThrSerThrLeuAspValAsnAspProAlaValGluArgAsn151015LeuGlyGluTyrValAlaAlaValGlyAspAlaValGlyAlaGlyPro202530AlaAlaSerAlaValAspLeuGlyProProValSerValTyrLeuAla354045ValAspGinArglieAlaGlyArgAspAlaAlaLeuLeuTrpSerGlu505560ArgHisGlyTrpSerValAlaThrGluSerHisProAlaLeuThrVal65707580LeuGlyTyrLeuGlyProAspLeuLeuProProProAsnAlaValAla859095ArgPheLeuAlaAspAlaValArgGlyLeuProLeuArglieGluPro100105110ProHisProArgSerThrAspLeuAspArgArgLeuVal'AlaTyrLeu115120125ProAlaGlyLeuArgAspLeuCysProLeuProArgSerAlaGluArg130135ProValAlaAlaThrGlyGlyGlyArg145150<210〉38〈211〉176<212>PRT<213〉AbcaWasp.WW-12651〈400〉1MetPhePheAspSerTrpThrGlyLeu15Ala140LeuProAlaArgThr■LeuAla65ValLeu35SerTyr20AlaThrLysMetThrLeuAlaGly50GluGlyliePheAlaTrpAlaAla85LeuSerThrProMetArgSerAla130Glu115GlyThr100GinAla70ValLeuValArgSerGlyGlyLeuValLeu25AsnAlaPhe40ThrlieLeu55MetAlaValArgSerProAlaArgHis105ThrArgSer120LeuAspGin135ValArgVal10AlaLeuArgAspLeuValLeuLeuArg90GlyThrSer60ValAla75lieArgArgLeuValAlaAla140ValLeuValGly15LeuVal45AsnSer30ThrGlyLysValAlaValAlaLeuAlaGinPheGlulieLeuArgAspGin125ValAlaGlu110AlaVal95AspAla80LysAlaVaJArgValLeuGluThrAspGlySerLeuSerVallieThrThrGlyLysAlaGlyAspSer145150155160ThrAlaLeuSerAspValThrAspValProArgHisAspThrArgGly16517017權利要求1.一種具有良好抗菌活性的抗生素-諾卡噻唑菌素的生物合成基因簇,其特征在于編碼諾卡噻唑菌素生物合成所涉及的37個基因,具體為1)負責諾卡噻唑菌素I大環骨架生物合成的基因,即noc28,noc20,noc21,noc22,noc23,noc9,noc24,noc30共8個基因noc28位于基因簇核苷酸序列第38434-38581個堿基處,長度為150個堿基對,編碼諾卡噻唑菌素的前體肽,長度為49個氨基酸;noc23位于基因簇核苷酸序列第30980-32875個堿基處,長度為1896個堿基對,編碼雜環化蛋白,長度為631個氨基酸;noc22位于基因簇核苷酸序列第29544-30983個堿基處,長度為1440個堿基對,編碼NADH脫氫酶,長度為479個氨基酸;noc21位于基因簇核苷酸序列第26965-29523個堿基處,長度為2559個堿基對,編碼脫水酶,長度為852個氨基酸;noc20位于基因簇核苷酸序列第25968-26960個堿基處,長度為993個堿基對,編碼脫水酶,長度為330個氨基酸;noc9位于基因簇核苷酸序列第14529-14584個堿基處,長度為456個堿基對,編碼未知功能蛋白,長度為151個氨基酸;noc24位于基因簇核苷酸序列第32902-34683個堿基處,長度為1782個堿基對,編碼未知功能蛋白,長度為593個氨基酸;noc30位于基因簇核苷酸序列第40176-40916個堿基處,長度為741個堿基對,編碼未知功能蛋白,長度為246個氨基酸;2)負責諾卡噻唑菌素I吲哚酸側鏈生物合成的基因,即noc25,noc26,noc27,noc29,共4個基因noc27位于基因簇核苷酸序列第36848-37948個堿基處,長度為1101個堿基對,編碼自由基SAM硫胺合成酶,長度為366個氨基酸;noc25位于基因簇核苷酸序列第34680-35912個堿基處,長度為1233個堿基對,編碼酰基-CoA合成酶,長度為410個氨基酸;noc26位于基因簇核苷酸序列第35933-36820個堿基處,長度為888個堿基對,編碼酰基轉移酶,長度為295個氨基酸;noc29位于基因簇核苷酸序列第38714-39976個堿基處,長度為1263個堿基對,編碼SAM依賴的甲基轉移酶,長度為420個氨基酸;3)負責諾卡噻唑菌素I脫氧糖基生物合成的基因,即noc6,noc10,noc11,noc12,noc13,noc14,共6個基因noc10位于基因簇核苷酸序列第14990-15703個堿基處,長度為714個堿基對,編碼N-雙甲基轉移酶,長度為237個氨基酸;noc11位于基因簇核苷酸序列第15728-16972個堿基處,長度為1245個堿基對,編碼NDP-己糖3位C上的甲基轉移酶,長度為414個氨基酸;noc12位于基因簇核苷酸序列第16984-17970個堿基處,長度為987個堿基對,編碼NDP-己糖-3-酮還原酶,長度為328個氨基酸;noc13位于基因簇核苷酸序列第17988-19418個堿基處,長度為1431個堿基對,編碼dTDP-4-酮-6-脫氧葡萄糖2,3-脫水酶,長度為476個氨基酸;noc14位于基因簇核苷酸序列第19424-20560個堿基處,長度為1137個堿基對,編碼NDP-6-脫氧-D-葡萄糖4位C上的氨基轉移酶,長度為378個氨基酸;noc6位于基因簇核苷酸序列第11505-12683個堿基處,長度為1179個堿基對,編碼糖基轉移酶,長度為392個氨基酸;4)細胞色素P450氧化還原酶基因,即noc7,noc15,noc16,noc18,noc19,共5個基因noc7位于基因簇核苷酸序列第12704-13912個堿基處,長度為1209個堿基對,編碼細胞色素P450氧化還原酶,長度為402個氨基酸;noc15位于基因簇核苷酸序列第20591-21703個堿基處,長度為1113個堿基對,編碼細胞色素P450氧化還原酶,長度為370個氨基酸;noc16位于基因簇核苷酸序列第21696-22934個堿基處,長度為1239個堿基對,編碼細胞色素P450氧化還原酶,長度為412個氨基酸;noc18位于基因簇核苷酸序列第23507-24649個堿基處,長度為1143個堿基對,編碼細胞色素P450氧化還原酶,長度為380個氨基酸;noc19位于基因簇核苷酸序列第24646-25926個堿基處,長度為1281個堿基對,編碼細胞色素P450氧化還原酶,長度為426個氨基酸;5)甲基轉移酶基因,即noc8,noc36,共2個基因noc8位于基因簇核苷酸序列第13909-14532個堿基處,長度為624個堿基對,編碼甲基轉移酶,長度為207個氨基酸;noc36位于基因簇核苷酸序列第43983-44768個堿基處,長度為786個堿基對,編碼甲基轉移酶,長度為261個氨基酸;6)抗性基因,即noc17,noc37,共2個基因noc17位于基因簇核苷酸序列第22956-23480個堿基處,長度為525個堿基對,編碼博來霉素抗性蛋白,長度為174個氨基酸;noc37位于基因簇核苷酸序列第44914-45423個堿基處,長度為510個堿基對,編碼磷酸鹽ABCtransporter,長度為169個氨基酸;7)調節基因,即noc5,noc33,noc34,共3個基因noc5位于基因簇核苷酸序列第10404-11387個堿基處,長度為984個堿基對,編碼SARP家族的轉錄調節蛋白,長度為327個氨基酸;noc33位于基因簇核苷酸序列第42031-42456個堿基處,長度為426個堿基對,編碼熱休克蛋白,長度為141個氨基酸;noc34位于基因簇核苷酸序列第42565-43173個堿基處,長度為609個堿基對,編碼hsp18轉錄調節因子,長度為202個氨基酸;8)負責轉錄翻譯的基因,即noc1,noc2,noc3,noc4共4個基因noc1位于基因簇核苷酸序列第7731-8084個堿基處,長度為354個堿基對,編碼50S核糖體蛋白L18,長度為117個氨基酸;noc2位于基因簇核苷酸序列第8282-8785個堿基處,長度為444個堿基對,編碼DGPFAETKE家族蛋白,長度為147個氨基酸;noc3位于基因簇核苷酸序列第8731-9867個堿基處,長度為1137個堿基對,編碼RNA聚合酶ECF-亞族的信號因子,長度為378個氨基酸;noc4位于基因簇核苷酸序列第9968-10387個堿基處,長度為420個堿基對,編碼ATP酶,長度為139個氨基酸;9)未知功能基因,即noc31,noc32,noc35,共3個基因noc31位于基因簇核苷酸序列第41003-41410個堿基處,長度為408個堿基對,編碼未知功能蛋白,長度為135個氨基酸;noc32位于基因簇核苷酸序列第41492-41953個堿基處,長度為462個堿基對,編碼未知功能蛋白,長度為153個氨基酸;noc35位于基因簇核苷酸序列第43228-43758個堿基處,長度為531個堿基對,編碼未知功能蛋白,長度為176個氨基酸。2.根據權利要求1所述的諾卡噻唑菌素的生物合成基因簇,其特征在于所述的諾卡噻唑菌素的生物合成基因簇中編碼核糖體機制的前體肽包含下述兩個部分信號肽部分和結構肽部分。3.—種根據權利要求1所述的諾卡噻唑菌素的生物合成基因簇的編碼蛋白用于催化合成抗生素諾卡噻唑菌素及類似物。4.根據權利要求3所述的諾卡噻唑菌素的生物合成基因簇的編碼蛋白用于催化合成噻唑環。5.根據權利要求3所述的諾卡噻唑菌素的生物合成基因簇的編碼蛋白用于催化合成羥化吡啶環肽中心。6.根據權利要求3所述的諾卡噻唑菌素的生物合成基因簇的編碼蛋白用于催化合成吲哚酸結構單元。7.根據權利要求3所述的諾卡噻唑菌素的生物合成基因簇的編碼蛋白用于催化合成諾卡噻唑菌素的大環骨架。8.根據權利要求3所述的諾卡噻唑菌素的生物合成基因簇的編碼蛋白用于催化合成4-N,N-二甲基-2,4,6-脫氧己糖。9.根據權利要求3所述的諾卡噻唑菌素的生物合成基因簇的用途,其中的部分基因在S.ac加cw"sATCC25421相關基因缺失的突變株中進行異源互補恢復產生諾肽菌素。10.根據權利要求3所述的諾卡噻唑菌素的生物合成基因簇的用途,其中的后修飾基因在S.a"wcmwATCC25421中進行異源表達產生諾肽菌素的結構類似物。全文摘要本發明涉及諾卡噻唑菌素的生物合成基因簇,具體地說是一類由諾卡氏菌產生的具有良好抗菌活性的抗生素-諾卡噻唑菌素(Nocathiacins)的生物合成基因簇的克隆、測序、分析、功能研究及其應用。整個基因簇共包含37個基因8個與大環骨架生物合成相關的基因,4個與吲哚酸側鏈合成相關的基因,6個與糖基合成相關的基因,5個P450氧化還原后修飾酶基因,2個甲基轉移酶基因,2個抗性基因,3個調節基因,3個未知功能的基因以及4個與轉錄翻譯有關的基因。通過對上述生物合成基因的異源表達可產生一系列新型硫肽類抗生素。本發明所提供的基因及其蛋白可以用來尋找和發現用于醫藥、工業或農業的化合物或基因、蛋白。文檔編號C12P21/04GK101684471SQ200910055328公開日2010年3月31日申請日期2009年7月24日優先權日2009年7月24日發明者瑩丁,文劉,潘海學,沂虞申請人:中國科學院上海有機化學研究所
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
韩国伦理电影