<listing id="vjp15"></listing><menuitem id="vjp15"></menuitem><var id="vjp15"></var><cite id="vjp15"></cite>
<var id="vjp15"></var><cite id="vjp15"><video id="vjp15"><menuitem id="vjp15"></menuitem></video></cite>
<cite id="vjp15"></cite>
<var id="vjp15"><strike id="vjp15"><listing id="vjp15"></listing></strike></var>
<var id="vjp15"><strike id="vjp15"><listing id="vjp15"></listing></strike></var>
<menuitem id="vjp15"><strike id="vjp15"></strike></menuitem>
<cite id="vjp15"></cite>
<var id="vjp15"><strike id="vjp15"></strike></var>
<var id="vjp15"></var>
<var id="vjp15"></var>
<var id="vjp15"><video id="vjp15"><thead id="vjp15"></thead></video></var>
<menuitem id="vjp15"></menuitem><cite id="vjp15"><video id="vjp15"></video></cite>
<var id="vjp15"></var><cite id="vjp15"><video id="vjp15"><thead id="vjp15"></thead></video></cite>
<var id="vjp15"></var>
<var id="vjp15"></var>
<menuitem id="vjp15"><span id="vjp15"><thead id="vjp15"></thead></span></menuitem>
<cite id="vjp15"><video id="vjp15"></video></cite>
<menuitem id="vjp15"></menuitem>

對大腸桿菌o123型的o-抗原特異的核苷酸的制作方法

文檔序號:562013閱讀:380來源:國知局
專利名稱:對大腸桿菌o123型的o-抗原特異的核苷酸的制作方法
技術領域
本發明涉及大腸桿菌O123型(Escherichia coli O123)中控制O-抗原合成的基因簇的核苷酸全序列,特別是涉及大腸桿菌O123型中控制O-抗原合成的基因簇中的寡核苷酸,可利用這些對O-抗原特異的寡核苷酸快速、準確地檢測人體及環境中的大腸桿菌O123型并鑒定這些致病菌中的O-抗原。
背景技術
O-抗原是革蘭氏陰性細菌脂多糖中的O特異性多糖成分,它由許多重復的寡糖單位組成。O-抗原的合成過程研究得較清楚先由糖基轉移酶將核苷二磷酸單糖轉移到一個固定在細胞內膜的脂分子上,然后在內膜的內側合成寡糖單位,O-抗原的寡糖單位再通過轉運酶被轉移到內膜外側,而后通過聚合酶聚合成多糖,再被連接到一個糖脂分子上形成脂多糖分子[Whitfield,C.(1995)“Biosynthesis of lipopolysaccharide O antigens”.Trends in Microbiology.3178-185;Schnaitman,C.A.and J.D.Klena.(1993)“Genetics of lipopolysaccharide biosynthesis inentericbacteria”.Microbiological Reviews,57(3)655-682]。編碼負責O-抗原合成的所有酶分子的基因一般在染色體上相鄰排列,形成一個基因簇[Reeves,P.R.,et al.(1996)“Bacterial polysaccharide synthesis and gene nomenclature”Trends inMicrobiology,4495-503]。在志賀氏菌、大腸桿菌和沙門氏菌中,O-抗原基因簇位于JUMPStart序列和gnd基因之間[Lei Wang.et al(2001)“Sequence analysis of fourShigella boydii O-antigen lociimplication for Escherichia coli and Shigellarelationships”.Infection and Immunity,116923-6930;Lei Wang and Peter Reeves(2000)“TheEscherichia coli O111 and Salmonella enterica O35 gene clustersgene clusters encoding the samecolitose-containing O antigen are highly conserved”.Journal of Bacteriology.1825256-5261]。O-抗原基因簇含有三類基因糖合成路徑基因,糖基轉移酶基因,寡糖單位處理基因,其中糖合成路徑基因編碼的酶合成O-抗原所需的核苷二磷酸單糖;糖基轉移酶基因編碼的酶將核苷二磷酸單糖及其它分子轉到單糖上從而使單糖聚合成寡糖單位;寡糖單位處理基因包括轉運酶基因和聚合酶基因,它們將寡糖單位轉移到細菌內膜外側,再聚合成多糖。糖基轉移酶基因和寡糖單位處理基因只存在于攜帶這些基因的基因簇里。O-抗原中單糖的不同,單糖間聯結鍵的不同和寡糖單位之間聯結鍵的不同構成了O-抗原的多樣性,而單糖的組成、單糖間的聯結鍵及寡糖單位之間的聯結鍵是由O-抗原基因簇中的基因控制著,所以O-抗原基因簇決定了O-抗原的合成,也決定了O-抗原的多樣性。
因為O-抗原是極強的抗原,是大腸桿菌重要的致病因素之一,同時它又具有極強的多樣性,這啟示我們能研究一種快速、準確地檢測大腸桿菌及其O-抗原的特異性好、靈敏度高的方法。以表面多糖為目標的血清學免疫反應自上世紀30年代以來一直被用于對細菌的分型和鑒定,是鑒定致病菌的唯一的手段。這種診斷方法需要大量的抗血清,而抗血清一般種類不全,數量不足,大量的抗血清在制備和儲存中也存在一些困難。另一方面此法耗時長、靈敏度低、漏檢率高、準確性差,所以,現在普遍認為這種傳統的血清學檢測方法將為現代分子生物學方法取代。1993年,Luk,J.M.C et.al用沙門氏菌(S.enterica)O-抗原基因簇的特異核苷酸序列通過PCR方法鑒定了沙門氏菌的O-抗原[Luk,J.M.C.et.al.(1993)“Selective amplification of abequose and paratosesynthase genes(rfb)by polymerase chain reaction for identification of S.enterica majorserogroups(A,B,C2,andD)”,J.Clin.Microbiol.312118-2123]。Luk,et.al的方法是將相應于沙門氏菌血清型E1,D1,A,B和C2的O-抗原內的CDP-阿比可糖和CDP-泰威糖的合成基因的核苷酸序列排列后得到對不同血清型的沙門氏菌特異的寡核苷酸。1996年,Paton,A.W et.al用對E.coli O111的O-抗原特異的源于wbdI基因的寡核苷酸鑒定了一株產毒素的E.coli O111的血清型[“Molecularmicrobiological investigation of an outbreak of Hemolytic-Uremic Syndrome caused by dryfermented sausage contaminated with Shiga-like toxin producing Escherichiacoli”.J.Clin.Microbiol.341622-1627],但是后來的研究表明Paton,A.W et.al的用源于wbdI基因的寡核苷酸鑒定E.coli O111的血清型的方法有假陽性結果出現。Bastin D.A.and Reeves,P.R.認為,這是由于wbdI基因是一個推測的糖合成路徑基因[Bastin D.A.and Reeves,P.R.(1995)Sequence and analysis of the O antigengene(rfb)cluster ofEscherichia coli O111.Gene 16417-23],而在其它細菌的O-抗原的結構中也可能有這個糖,所以糖合成路徑基因對于O-抗原并不是高度特異的志賀氏菌有46種血清型,但只有33種不同的O-抗原,大腸桿菌有166種不同的O-抗原[Reeves,P.R(1992)“Variation in O antigens,niche specific selection andbacterial populations”.FEMS Microbiol.Lett,100509-516],二者親緣關系非常近,并且有12種是大腸桿菌和志賀氏菌共有的[Ewing,W.H.(1986)“Edwards and Ewing’sidentification of the Enterobacteriaceae”.Elsevier Science Publishers,Amsterdam,TheNetherlands;T.cheasty,et al.(1983)“Antigenic relationships between the enteroinvasiveEscherichia coli antigens O28ac,O112ac,O124,O136,O143,O144,O152 and Shigella Oantigens”J.clin Microbiol,17(4)681-684]發明內容本發明的目的是提供了一種對大腸桿菌O123型的O-抗原特異的核苷酸。它是大腸桿菌O123型的O-抗原基因簇中的核苷酸,是源于糖基轉移酶基因和轉運酶基因及聚合酶基因的特異的核苷酸。
本發明的次一目的是提供了大腸桿菌O123型的O-抗原基因簇的全長核苷酸序列。
本發明的另一目的是提供了構成大腸桿菌O123型的O-抗原基因簇的基因轉運酶的基因即wzx基因或與wzx有相似功能的基因;聚合酶基因即wzy基因或與wzy有相似功能的基因;糖基轉移酶基因,包括orf9,orf11,orf15基因。
本發明的又一目的是提供了寡核苷酸,它們分別源于源于編碼轉運酶的基因即wzx基因或與wzx有相似功能的基因;源于編碼聚合酶的基因即wzy基因或與wzy有相似功能的基因(表1);它們是上述基因內的寡核苷酸,長度在10-20nt;它們對大腸桿菌O123型的O-抗原是高度特異的;而且這些寡核苷酸還可重新組合,組合后的寡核苷酸對大腸桿菌O123型的O-抗原也是高度特異的。
本發明的再一目的是提供的上述寡核苷酸可作為引物用于核酸擴增反應,或者作為探針用于雜交反應,或者用于制造基因芯片或微陣列,從而通過這些方法檢測和鑒定大腸桿菌O123型的O-抗原及檢測和鑒定大腸桿菌O123型。
本發明的還一目的是提供了分離大腸桿菌O123型的O-抗原基因簇的全序列的方法。按照本方法操作可以獲得其他細菌的O-抗原基因簇的全序列,也可以獲得編碼其他多糖抗原的細菌的基因簇的全序列。
本發明的目的是由以下技術方案實現的。
本發明對大腸桿菌O123型的O-抗原特異的核苷酸,其特征在于其是如SEQ ID NO1所示的分離的核苷酸,全長17084個堿基;或者所述具有一個或多個插入、缺失或取代的堿基,同時保持所述分離的核苷酸功能的SEQ IDNO1的核苷酸。
前述的對大腸桿菌O123型的O-抗原特異的核苷酸,其中包括命名為rmlB,rmlA,wzx,vioA,orf5,orf6,orf7,orf8,orf9,wzy,orf11,fnlA,qnlA,qnlB,orf15,orf16的16個基因組成,都位于JUMPStart序列和gnd基因之間。
前述的對大腸桿菌O123型的O-抗原特異的核苷酸,其中所述基因中具有高度特異性的基因是轉運酶基因,其包括wzx基因;聚合酶基因,其包括wzy基因;糖基轉移酶基因,其包括orf9,orf11,orf15基因;其中所述的基因wzx是SEQ ID NO1中的2169至3614堿基的核苷酸;wzy是SEQ ID NO1中的8478至9728堿基的核苷酸;orf9是SEQ ID NO1中的7469至8494堿基的核苷酸;orf11是SEQ ID NO1中的9725至10846堿基的核苷酸;orf15是SEQ ID NO1中的13884至15077堿基的核苷酸。
前述的對大腸桿菌O123型的O-抗原特異的核苷酸,其中還包括源于所述的wzx基因、wzy基因以及它們的混合或它們的重組。
前述的對大腸桿菌O123型的O-抗原特異的核苷酸,其特征在于,其中源于wzx基因的寡核苷酸對是SEQ ID NO1中的2627至2646堿基的核苷酸和3275至3294堿基的核苷酸;SEQ ID NO1中的2806至2825堿基的核苷酸和3376至3395堿基的核苷酸;源于wzy基因的寡核苷酸對是SEQ IDNO1中的8986至9005堿基的核苷酸和9484至9503堿基的核苷酸;SEQ IDNO1中的8603至8622堿基的核苷酸和9392至9409堿基的核苷酸。
前述的對大腸桿菌O123型的O-抗原特異的核苷酸在檢測表達O-抗原的細菌、鑒定細菌的O-抗原和細菌的其它多糖抗原中的應用。
前述的對大腸桿菌O123型的O-抗原特異的核苷酸的重組分子,在通過插入表達而提供表達大腸桿菌O123型的O-抗原,以及制備細菌疫苗中的應用。
前述的對大腸桿菌O123型的O-抗原特異的核苷酸的應用,其特征在于,它作為引物用于PCR、作為探針用于雜交反應與熒光檢測、或者用于制造基因芯片或微陣列,供檢測細菌的應用。
前述的對大腸桿菌O123型的O-抗原特異的核苷酸的分離方法,其特征在于,其包括下述步驟(1)基因組的提取在培養基中培養大腸桿菌O123型,離心收集細胞;得到的基因組DNA通過瓊脂糖凝膠電泳檢測;(2)通過PCR擴增大腸桿菌O123型中的O-抗原基因簇以大腸桿菌O123型的基因組為模板通過Long PCR擴增其O-抗原基因簇,將得到的PCR產物,用瓊脂糖凝膠電泳檢測PCR產物的大小及其特異性,合并該1ong PCR產物,并用DNA純化試劑盒純化PCR產物;(3)構建O-抗原基因簇文庫將Long PCR純化產物應用鳥槍法構建O-抗原基因簇文庫;(4)對文庫中的克隆測序從文庫中挑選插入片段在1kb以上的克隆用實驗室常用的DNA自動測序儀對克隆中的插入片段進行測序,序列達到100%的覆蓋率,從而獲得O-抗原基因簇的所有序列;(5)核苷酸序列的拼接及分析應用生物信息學軟件拼接和編輯所有的序列,從而得到大腸桿菌O123型的O-抗原基因簇的核苷酸全長序列;(6)特異基因的篩選針對大腸桿菌O123型的O-抗原基因簇中的wzx、wzy基因設計引物;在每個基因內各設計了兩對引物,每對引物分布在相應基因內的不同地方,以確保其特異性;用這些引物以166株大腸桿菌和43株志賀氏菌的基因組為模板進行PCR,確定wzx、wzy基因對大腸桿菌O123型的O-抗原的高度特異性;(7)引物靈敏度的檢測培養大腸桿菌O123,細菌計數后分別將5×103,5×102,5×101,5個和0個活菌加入到一定量的某種待檢測物中,混入細菌的待檢測物作為檢測用樣品,將樣品加入LB培養基,取一些與樣品混合過的LB培養基過濾,將過濾液進行培養,從培養好的菌液中取數毫升處理后作為PCR模板用寡核苷酸進行PCR反應,檢測其對大腸桿菌O123的靈敏度。
前述的對大腸桿菌O123型的O-抗原特異的核苷酸的分離方法,其特征在于,其包括下述步驟(1)基因組的提取在5mL的LB培養基中37℃過夜培養大腸桿菌O123型,離心收集細胞。用500μl 50mM Tris-HCl(pH8.0)和10μl 0.4M EDTA重懸細胞,37℃溫育20分鐘,然后加入10μl 10mg/mL的溶菌酶繼續保溫20分鐘。之后加入3μl 20mg/mL的蛋白酶K、15μl 10%SDS,50℃溫育2小時,再加入3μl 10mg/mL的RNase,65℃溫育30分鐘,加等體積酚抽提混合物,取上清再用等體積的酚∶氯仿∶異戊醇(25∶24∶1)混合溶液抽提兩次,取上清再用等體積的乙醚抽提以除去殘余的酚。上清用2倍體積乙醇沉淀DNA,用玻璃絲卷出DNA并用70%乙醇洗DNA,將DNA重懸于30μl TE中;基因組DNA通過0.4%的瓊脂糖凝膠電泳檢測;(2)通過PCR擴增大腸桿菌O123型中的O-抗原基因簇以大腸桿菌O123型的基因組為模板通過Long PCR擴增其O-抗原基因簇,首先根據經常發現于O-抗原基因簇啟動子區的JUMPStart序列設計上游引物#wl-1098-ATT GGT AGC TGT AAG CCA AGG GCG GTA GCG T,再根據O-抗原基因簇下游的gnd基因設計下游引物(#1524-TAG TCG CGT GNG CCT GGA TTAAGT TCG C);用Boehringer Mannheim公司的Expand Long Template PCR方法擴增O-抗原基因簇,PCR反應程序如下在94℃預變性2分鐘;然后94℃變性10秒, 退火15秒,68℃延伸15分鐘,這樣進行30個循環,最后,在68℃繼續延伸7分鐘,得到PCR產物,用0.8%的瓊脂糖凝膠電泳檢測PCR產物的大小及其特異性,合并5管long PCR產物,并用Promega公司的WizardPCR Preps純化試劑盒純化PCR產物;(3)構建O-抗原基因簇文庫用被修改的Novagen DNaseI shot gun法構建O-抗原基因簇文庫,反應體系是300ng PCR純化產物,0.9μl 0.1MMnCl2,1μl 1∶2000稀釋的1mg/mL的DNaseI,反應在室溫中進行,酶切10分鐘使DNA片段大小集中在1.5kb-3kb之間,而后加入2μl 0.1M EDTA終止反應。合并4管同樣的反應體系,用等體積的酚抽提一次,用等體積的酚∶氯仿∶異戊醇(25∶24∶1)混合溶液抽提一次,再用等體積的乙醚抽提一次后,用2.5倍體積的無水乙醇沉淀DNA,并用70%乙醇洗沉淀,最后重懸于18μl水中,隨后在此混合物中加入2.5μl dNTP(1mMdCTP,1mMdGTP,1mMdTTP,10mMdATP),1.25μl 100mM DTT和5單位的T4DNA聚合酶,11℃30分鐘,將酶切產物補成平端,75℃終止反應后,加入5單位的Tth DNA聚合酶及其相應的緩沖液并將體系擴大為80μl,70℃反應20分鐘,使DNA的3′端加dA尾。此混合物經等體積氯仿∶異戊醇(24∶1)混合溶液抽提和等體積乙醚抽提后與Promega公司的3×10-3的pGEM-T-Easy載體于16℃連接10小時,總體積為90μl。其中有9μl的10×buffer和25單位的T4DNA連接酶,最后用1/10體積的3M NaAc(pH5.2)和2倍體積的無水乙醇沉淀連接混合物,再用70%乙醇洗沉淀,干燥后溶于30μl水中得到連接產物;用Bio-Rad公司的電轉化感受態細胞的制備方法制備感受態大腸桿菌DH5α細胞,取2-3μl連接產物與50μl感受態大腸桿菌DH5α混合后,轉到Bio-Rad公司的0.2cm的電擊杯中電擊,電壓為2.5千伏,時間為5.0毫秒至6.0毫秒,電擊后立即在杯中加入1mL的SOC培養基使菌復蘇,然后將菌涂在含有氨芐青霉素、X-Gal和IPTG的LB固體培養基上,在37℃過夜培養,次日得到藍白菌落,將得到的白色菌落即白色克隆轉到含有氨芐青霉素的LB固體培養基上培養,同時從每個克隆中提取質粒,并用EcoRI酶切鑒定其中的插入片段的大小,得到的白色克隆群構成了大腸桿菌O123型的O-抗原基因簇文庫;(4)對文庫中的克隆測序從文庫中挑選插入片段在1kb以上的96個克隆用本實驗室ABI3730型DNA自動測序儀對克隆中的插入片段進行測序,序列達到100%的覆蓋率,從而獲得O-抗原基因簇的所有序列;(5)核苷酸序列的拼接及分析用英國劍橋MRC(Medical ResearchCouncil)分子生物學實驗室出版的Staden package軟件包的Pregap4和Gap4軟件拼接和編輯所有的序列,從而得到大腸桿菌O123型的O-抗原基因簇的核苷酸全長序列;序列的質量主要由兩個方面來保證1)對大腸桿菌O123型的基因組作5個Long PCR反應,然后混合這些產物以產生文庫,2)對每個堿基,保證3個以上高質量的覆蓋率,在得到大腸桿菌O123型O-抗原基因簇的核苷酸序列后,用美國國家生物技術信息學中心(The National Center forBiotechnology Information,NCBI)的Orffinder發現基因,找到16個開放的閱讀框,用Blast系列軟件與GenBank中的基因比較以發現這些開放的閱讀框的功能并確定它們是什么基因,再用英國Sanger中心的Artemis軟件完成基因注釋,用Clustral W軟件做DNA和蛋白質序列間的精確比對,最后得到大腸桿菌O123型的O-抗原基因簇的結構;(6)特異基因篩選針對大腸桿菌O123型的O-抗原基因簇中的wzx、wzy基因設計引物;在每個基因內各設計了兩對引物,每對引物分布在相應基因內的不同地方,以確保其特異性;用這些引物以166株大腸桿菌和43株志賀氏菌的基因組為模板進行PCR,除在含大腸桿菌O123組中得到了預期大小的一條帶外,在其他組中都沒有擴增到預期片段大小的正確產物,所以wzx、wzy基因對大腸桿菌O123型的O-抗原都是高度特異的。
(7)引物靈敏度的檢測購買市場上的生豬肉餡,攪拌均勻,分成20g一份,存在-40℃冰箱中備用。將10μl大腸桿菌O123的凍存菌液接種到有20mL LB培養基的三角瓶中,于37℃,200轉/分,培養12小時至飽和,取少量培養好的菌液作106和107倍的稀釋,其余的菌液放于4℃的冰箱中備用,取50μl稀釋菌液涂布LB瓊脂平板,37度,培養12h,對所涂平板計數,計算原液中活菌濃度。在5份生豬肉餡中分別摻入5×103,5×102,5×101,5個和0個活菌,攪拌均勻,加入200mL LB培養基,經6層紗布過濾,過濾液于37℃,200轉/分,培養12h。從培養好的菌液中取3mL菌液于6,000g離心5分鐘,去上清,加100μl MQ超純水吹開沉淀并混勻,放入100度沸水中煮15分鐘,裂解液于12,000g離心8分鐘,取1μl上清做為PCR模板。用4對寡核苷酸對,SEQ ID NO1中的2627至2646堿基的核苷酸和3275至3294堿基的核苷酸;SEQ ID NO1中的2806至2825堿基的核苷酸和3376至3395堿基的核苷酸;SEQ ID NO1中的8986至9005堿基的核苷酸和9484至9503堿基的核苷酸;SEQ ID NO1中的8603至8622堿基的核苷酸和9392至9409堿基的核苷酸,進行PCR反應,PCR反應體系如下MQ15.7μl,Mg2+2.5μl,Buffer2.5μl,dNTP1μl,Taq酶0.3μl,P11μl,P21μl,模板DNA1μl。PCR反應條件為95℃5′,95℃30″,56℃45″,72℃1′,72℃5′,共30個循環。反應結束后,取10μl反應產物電泳,若有與預期大小相符的擴增帶,則結果為陽性,若沒有,則結果為陰性。參入了5×103,5×102,5×101,和5個活菌的每份豬肉餡均在4對引物的PCR反應中得到陽性結果。參入0個活菌的豬肉餡在4對引物的PCR反應中得到陰性結果。說明使用上述方法時,這4對引物對豬肉餡中的大腸桿菌O123的檢測靈敏度均為0.25個菌/g。
也就是,本發明的第一個方面,提供了大腸桿菌O123型的O-抗原基因簇的全長核苷酸序列,它的全序列如SEQ ID NO1所示,全長17084個堿基;或者具有一個或多個插入、缺失或取代的堿基,同時保持所述分離的核苷酸功能的SEQ ID NO1的核苷酸。通過本發明的方法得到了大腸桿菌O123型的O-抗原基因簇的結構,如表3所示,它包括命名為rmlB,rmlA,wzx,vioA,orf5,orf6,orf7,orf8,orf9,wzy,orf11,fnlA,qnlA,qnlB,orf15,orf16的16個基因組成,都位于JUMPStart序列和gnd基因之間。
本發明的第二個方面,提供了大腸桿菌O123型的O-抗原基因簇中的基因,即轉運酶基因(wzx基因或與wzx有相似功能的基因);聚合酶基因(wzy基因或與wzy有相似功能的基因);糖基轉移酶基因(orf9,orf11,orf15基因)。它們在O-抗原基因簇中的起始位置和終止位置及核苷酸序列都列在表4中;本發明尤其涉及到糖基轉移酶基因、轉運酶基因和聚合酶基因,因為糖合成路徑基因即合成核苷二磷酸單糖的基因現在被預示對較多胞外多糖是常見的、共同的,對細菌的O-抗原并不是很特異的,而本發明涉及的糖基轉移酶基因、轉運酶基因和聚合酶基因對大腸桿菌O123型O-抗原是高度特異的。
本發明的第三個方面,提供了源于大腸桿菌O123型的O-抗原基因簇中的wzx基因或與wzx有相似功能的基因和wzy基因或與wzy有相似功能的基因的寡核苷酸(表1),它們是這些基因中的任何一段寡核苷酸。在表1中也列出了這些寡核苷酸對在O-抗原基因簇中的位置及以這些寡核苷酸對為引物所做的PCR反應的產物的大小,這些PCR反應可用表中的退火溫度進行。這些引物除在第13組中得到了預期大小的一條帶外,在其他組中都沒有擴增到任何產物,所以wzx、wzy基因對大腸桿菌O123型的O-抗原都是高度特異的。
所述的對大腸桿菌O123型的O-抗原特異的核苷酸的分離方法包括下述步驟1)基因組的提取;2)PCR擴增大腸桿菌O123型中的O-抗原基因簇;3)構建O-抗原基因簇文庫;4)對文庫中的克隆測序;5)核苷酸序列的拼接及分析;6)特異基因的篩選;7)引物靈敏度的檢測。
本發明的其他方面由于本文的技術的公開,對本領域的技術人員而言是顯而易見的。
如本發明所用,“寡核苷酸”主要指來源于O-抗原基因簇中的編碼轉運酶的基因和編碼聚合酶的基因內的一段核苷酸分子,它們在長度上可改變,一般在10到20個核苷酸范圍內改變;更確切說這些寡核苷酸是源于wzx基因(核苷酸位置是從SEQ ID NO1中的2169至3614堿基的核苷酸)、wzy基因(核苷酸位置是從SEQ ID NO1中的8478至9728堿基的核苷酸);源于以上基因內的寡核苷酸對大腸桿菌O123型是高度特異的。
此外,有時兩個遺傳相似的編碼不同O-抗原的基因簇通過基因重組或突變產生新的O-抗原,從而產生新的細菌類型,新的突變株。在這種環境中,需要篩選出多對寡核苷酸同重組基因雜交以提高檢測的特異性。因此,本發明提供了一整套多對寡核苷酸的混合物,它們源于轉運酶和聚合酶基因,包括wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因。這些基因的混合物對一個特殊的細菌多糖抗原來說是特異的,從而使這套寡核苷酸對這個細菌的多糖抗原是特異的。更具體地說,這些寡核苷酸的混合物是源于wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因中的寡核苷酸的組合。
在另一方面,本發明涉及寡核苷酸的鑒定,它們可以用于檢測表達O-抗原的細菌和在診斷中鑒定細菌的O-抗原。
本發明涉及到一種檢測食品中的一個或多個細菌多糖抗原的方法,這些抗原可以使樣品能與以下至少一個基因的寡核苷酸特異性雜交,這些基因是(i)編碼糖基轉移酶的基因;(ii)編碼轉運酶和聚合酶的基因,包括wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因。在條件許可的情況下至少一個寡核苷酸能與至少一個表達特殊的O-抗原的細菌的一個以上的那樣的基因特異性雜交,這些細菌是大腸桿菌O123型。可用PCR方法檢測,更可以將本發明方法中的核苷酸標記后作為探針通過雜交反應如Southern-blot或熒光檢測,或者通過基因芯片或微陣列檢測樣品中的抗原及細菌。
本發明設計者考慮到以下情況當單個的特異的寡核苷酸檢測無效時,寡核苷酸的混合物能與靶區域特異性雜交以檢測樣品。因此本發明提供了一套寡核苷酸用于本發明所述的檢測方法。這里所說的寡核苷酸是指源于編碼轉運酶的基因和聚合酶的基因,包括wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因的寡核苷酸。這套寡核苷酸對一個特殊的細菌的O-抗原來說是特異的,這一特殊的細菌O-抗原是由大腸桿菌O123型表達的。
另一方面,本發明涉及到一種檢測排泄物中的一個或多個細菌多糖抗原的方法,這些抗原可以使樣品能與以下至少一個基因的寡核苷酸特異性雜交,這些基因是(i)編碼糖基轉移酶的基因;(ii)編碼轉運酶和聚合酶的基因,包括wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因。在條件許可的情況下至少一個寡核苷酸能與至少一個表達特殊的O-抗原的細菌的一個以上的那樣的基因特異性雜交。這些細菌是大腸桿菌O123型。可用本發明中的寡核苷酸作引物通過PCR的方法檢測樣品,也可將本發明中的寡核苷酸分子標記后作為探針通過雜交反應如Southern-blot或熒光檢測,或者通過基因芯片或微陣列檢測樣品中的抗原及細菌。
一般一對寡核苷酸可能與同樣的基因雜交也可與不同的基因雜交,但它們中必須有一個寡核苷酸能特異性雜交到特殊抗原型的特異序列上,另一個寡核苷酸可雜交于非特異性區域。因此,當特殊的多糖抗原基因簇中的寡核苷酸被重新組合時,至少能選出一對寡核苷酸與多糖抗原基因簇中特異基因混合物雜交,或者選出多對寡核苷酸與特異基因的混合物雜交。甚至即使當一個特殊的基因簇中所有基因都獨一無二時,此方法也能應用于識別此基因簇內的基因混合物的核苷酸分子。因此本發明提供了一整套用于檢測本發明方法的多對寡核苷酸,在這里多對寡核苷酸是源于編碼轉運酶和聚合酶的基因包括wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因,這套寡核苷酸對一個特殊的細菌多糖來說是特異的,這套寡核苷酸可能是糖合成中必須基因的核苷酸。
另一方面,本發明也涉及到一種檢測源于病人的樣品中的一個或多個細菌多糖抗原的方法。樣品中的一個或多個細菌多糖抗原可以使樣品能與以下至少一個基因中的一對寡核苷酸中的一個特異性雜交,這些基因是(i)編碼糖基轉移酶的基因;(ii)編碼轉運酶和聚合酶的基因,包括wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因。在條件許可的情況下至少一個寡核苷酸能與樣品中的至少一個表達特殊的O-抗原的細菌的一個以上的那樣的基因特異性雜交,這些細菌是大腸桿菌O123型。可用本發明中的寡核苷酸作引物通過PCR的方法檢測樣品,也可將本發明中的寡核苷酸標記后作為探針通過雜交反應,或者通過基因芯片或微陣列檢測樣品中的抗原及細菌。
更詳細地說,以上描述的方法可以理解為當寡核苷酸對被使用時,其中的一個寡核苷酸分子能雜交到一個并不是來源于wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因的序列上。此外,當兩個寡核苷酸都能雜交上時,它們可能雜交于同一基因也可能雜交到不同基因上。也即,當交叉反應出現問題時,可選擇寡核苷酸的混合物來檢測混合的基因以提供檢測的特異性。
本發明者相信本發明不必限于以上所提的核苷酸序列編碼的特定的O-抗原,而且廣泛應用于檢測所有表達O-抗原和鑒定O-抗原的細菌。而且,由于O-抗原合成和其他多糖抗原(如細菌胞外抗原)合成之間的相似性,本發明的方法和分子也應用于這些其他的多糖抗原。
本發明首次公開了大腸桿菌O123型的O-抗原基因簇的全長序列,而且可從這個未被克隆的全長基因簇的序列中產生重組分子,通過插入表達可產生表達大腸桿菌O123型的O-抗原,并成為有用的疫苗。
具體實施例方式
下面結合具體實施例,進一步闡述本發明。應理解這些實施例僅用于說明本發明而不用于限制本發明的范圍。下列實施例中未注明具體條件的實驗方法,通常按照常規條件如Sambrook等人,分子克隆實驗室手冊(NewYorkCold Spring Harbor Laboratory Press,1989)中所述的條件。
實施例1基因組的提取在5mL的LB培養基中37℃過夜培養大腸桿菌O123型,離心收集細胞。用500μl 50mM Tris-HCl(pH8.0)和10μl 0.4M EDTA重懸細胞,37℃溫育20分鐘,然后加入l0μl 10mg/mL的溶菌酶繼續保溫20分鐘。之后加入3μl 20mg/mL的蛋白酶K、15μl 10%SDS,50℃溫育2小時,再加入3μl 10mg/mL的RNase,65℃溫育30分鐘。加等體積酚抽提混合物,取上清再用等體積的酚∶氯仿∶異戊醇抽(25∶24∶1)混合溶液提兩次,取上清再用等體積的乙醚抽提以除去殘余的酚,上清用2倍體積乙醇沉淀DNA,用玻璃絲卷出DNA并用70%乙醇洗DNA,最后將DNA重懸于30μl TE中。基因組DNA通過0.4%的瓊脂糖凝膠電泳檢測。
實施例2通過PCR擴增大腸桿菌O123型中的O-抗原基因簇以大腸桿菌O123型的基因組為模板通過Long PCR擴增其O-抗原基因簇。首先根據經常發現于O-抗原基因簇啟動子區的JUMPStart序列設計上游引物(#wl-1098-ATT GGT AGC TGT AAG CCA AGG GCG GTA GCG T),再根據O-抗原基因簇下游的gnd基因設計下游引物(#1524-TAG TCG CGTGNG CCT GGA TTA AGT TCG C);用Boehringer Mannheim公司的ExpandLong Template PCR方法擴增O-抗原基因簇,PCR反應程序如下在94℃預變性2分鐘;然后94℃變性10秒, 退火15秒,68℃延伸15分鐘,這樣進行30個循環。最后,在68℃繼續延伸7分鐘,得到PCR產物,用0.8%的瓊脂糖凝膠電泳檢測PCR產物的大小及其特異性。合并5管long PCR產物,并用Promega公司的Wizard PCR Preps純化試劑盒純化PCR產物。
實施例3構建O-抗原基因簇文庫
首先是連接產物的獲得用被修改的Novagen DNaseI shot gun法構建O-抗原基因簇文庫。反應體系是300ng PCR純化產物,0.9μl 0.1M MnCl2,1μl1∶2000稀釋的1mg/mL的DNaseI,反應在室溫中進行。酶切10分鐘使DNA片段大小集中在1.5kb-3kb之間,而后加入2μl 0.1M EDTA終止反應。合并4管同樣的反應體系,用等體積的酚抽提一次,用等體積的酚∶氯仿∶異戊醇(25∶24∶1)混合溶液抽提一次,再用等體積的乙醚抽提一次后,用2.5倍體積的無水乙醇沉淀DNA,并用70%乙醇洗沉淀,最后重懸于18μl水中。隨后在此混合物中加入2.5μl dNTP(1mMdCTP,1mMdGTP,1mMdTTP,10mMdATP),1.25μl 100mM DTT和5單位的T4DNA聚合酶,11℃30分鐘,將酶切產物補成平端,75℃終止反應后,加入5單位的Tth DNA聚合酶及其相應的緩沖液并將體系擴大為80μl,70℃反應20分鐘,使DNA的3′端加dA尾。此混合物經等體積氯仿∶異戊醇(24∶1)混合溶液抽提和等體積乙醚抽提后與Promega公司的3×10-3的pGEM-T-Easy載體于16℃連接10小時,總體積為90μl。其中有9μl的10×buffer和25單位的T4DNA連接酶。最后用1/10體積的3M NaAc(pH5.2)和2倍體積的無水乙醇沉淀連接混合物,再用70%乙醇洗沉淀,干燥后溶于30μl水中得到連接產物。
其次是感受態細胞的制備參照Bio-Rad公司提供的方法制備感受態細胞大腸桿菌DH5α。取一環大腸桿菌DH5α單菌落于5mL的LB培養基中,180rpm培養10小時后,取2mL培養物轉接到200mL的LB培養基中,37℃250rpm劇烈振蕩培養到OD600 0.5左右,然后冰浴冷卻20分鐘,于4℃4000rpm離心15分鐘。傾盡上清,用冷的冰預冷的去離子滅菌水200mL吹散菌體,于4℃4000rpm離心15分鐘。再用冷的冰預冷的去離子滅菌水100mL吹散菌體,于4℃ 4000rpm離心15分鐘。用冷的冰預冷的10%的甘油懸浮細胞,4℃6000rpm離心10分鐘,棄上清,最后沉淀用1mL冰預冷的10%的甘油懸浮細胞,即為感受態細胞。將制得的感受態細胞分裝為50μl一管,-70℃保存。
最后是電轉化感受態細胞取2-3μl連接產物與50μl感受態大腸桿菌DH5α混合后,轉到Bio-Rad公司的0.2cm的電擊杯中電擊,電壓為2.5千伏,時間為5.0毫秒-6.0毫秒。電擊后立即在杯中加入1mL的SOC培養基使菌復蘇。然后立即將菌涂在含有氨芐青霉素、X-Gal和IPTG的LB固體培養基上37℃倒置過夜培養,次日得到藍白菌落。將得到的白色菌落即白色克隆轉到含有氨芐青霉素的LB固體培養基上培養,同時從每個克隆中提取質粒并用EcoRI酶切鑒定其中的插入片段的大小,得到白色克隆群構成了大腸桿菌O123型的O-抗原基因簇文庫。
實施例4對文庫中的克隆測序從文庫中挑選插入片段在1kb以上的96個克隆用本實驗室ABI3730型DNA自動測序儀對克隆中的插入片段單向進行測序,使序列達到100%的覆蓋率,從而獲得O-抗原基因簇的所有序列。
實施例5核苷酸序列的拼接及分析用英國劍橋MRC(Medical Research Council)分子生物學實驗室出版的Staden package軟件包的Pregap4和Gap4軟件拼接和編輯所有的序列,從而得到大腸桿菌O123型的O-抗原基因簇的核苷酸全長序列(見序列列表)。序列的質量主要由兩個方面來保證1)對大腸桿菌O123型的基因組作5個Long PCR反應,然后混合這些產物以產生文庫。2)對每個堿基,保證3個以上高質量的覆蓋率。在得到大腸桿菌O123型O-抗原基因簇的核苷酸序列后,用美國國家生物技術信息學中心(The National Center for BiotechnologyInformation,NCBI)的Orffinder發現基因,找到16個開放的閱讀框,用Blast系列軟件與GenBank中的基因比較以發現這些開放的閱讀框的功能并確定它們是什么基因,再用英國Sanger中心的Artemis軟件完成基因注釋,用ClustralW軟件做DNA和蛋白質序列間的精確比對,最后得到大腸桿菌O123型的O-抗原基因簇的結構,如表3所示。
通過檢索和比較,發現orf1編碼的蛋白與Escherichia coli中rmlB編碼的dTDP-D-glucose 4,6-dehydratase(AAK60448)的氨基酸序列有92%的一致性和95%的相似性,通過對Pfam蛋白基序數據庫的搜索,發現orf1編碼的蛋白與已知的NAD dependent epimerase/dehydratase family共有序列的同源性預期值為1.3e-210。因此我們可以確定該基因為rmlB。orf2編碼的蛋白與Salmonella enterica subsp.enterica serovar Typhi Ty2中rmlA編碼的glucose-1-phosphate thymidylyltransferase(AAO68468)的氨基酸序列有80%的一致性和90%的相似性,通過對Pram蛋白基序數據庫的搜索,發現orf2編碼的蛋白與已知的Nucleotidyl transferase的共有序列的同源性預期值為2.6e-109。因此我們可以確定該基因為rmlA。orf4編碼的蛋白與Escherichia coli中vioA編碼的VioA(AAD44154)蛋白的氨基酸序列有60%的一致性和76%的相似性,通過對Pfam蛋白基序數據庫的搜索,發現orf4編碼的蛋白與已知的DegT/DnrJ/EryC1/StrS aminotransferase蛋白的共有序列的同源性預期值為1.7e-87。因此我們可以確定該基因為vioA。orf5編碼的蛋白與Shigelladysenteriae中編碼的WbnG(AAR97959)蛋白的氨基酸序列有38%的一致性和60%的相似性,由于這個基因的確切功能還不能確定,因此我們將其暫命名為orf5。orf6編碼的蛋白與Chromobacterium violaceum ATCC 12472中編碼的conserved hypothetical protein(AAQ61692)的氨基酸序列有26%的一致性和45%的相似性,由于這個基因的確切功能還不能確定,因此我們將這個基因暫命名為orf6。orf7編碼的蛋白與Bacillus cereus ATCC 14579中編碼的Acetyltransferase(AAP10400)的氨基酸序列有33%的一致性和56%的相似性,通過對Pfam蛋白基序數據庫的搜索,發現orf7編碼的蛋白與已知的Acetyltransferase(GNAT)family的共有序列的同源性預期值為5.6e-07。由于這個基因的確切功能還不能確定,因此我們將這個基因暫命名為orf7。orf8編碼的蛋白與Caulobacter crescentus CB15中編碼的MaoC familyprotein(AAK22689)的氨基酸序列有48%的一致性和70%的相似性,通過對Pfam蛋白基序數據庫的搜索,發現orf8編碼的蛋白與已知的MaoC like domain的共有序列的同源性預期值為5.5e-29。由于這個基因的確切功能還不能確定,因此我們將這個基因暫命名為orf8。orf12編碼的蛋白與Shigella boydii中fnlA編碼的L-QuiNAc synthase(AAR24274)的氨基酸序列有84%的一致性和92%的相似性,通過對Pfam蛋白基序數據庫的搜索,發現orf12編碼的蛋白與已知的Polysaccharide biosynthesis protein的共有序列的同源性預期值為1.7e-42。因此我們可以確定該基因為fnlA。orf13編碼的蛋白與Shigella boydii中qnlA編碼的L-QuiNAc synthase(AAR24275)的氨基酸序列有54%的一致性和71%的相似性。因此我們可以確定該基因為qnlA。orf14編碼的蛋白與Shigella boydii中編碼的L-QuiNAc synthase(AAR24276)的氨基酸序列有72%一致性和86%相似性,通過對Pfam蛋白基序數據庫的搜索,發現orf14編碼的蛋白與已知的UDP-N-acetylglucosamine 2-epimerase的共有序列的同源性預期值為1.3e- 123。因此我們可以確定該基因為qnlB。orf16碼的蛋白與Escherichia coli中編碼的WbuC protein(AAN60465)的氨基酸序列有42%一致性和62%相似性。由于這個基因的確切功能還不能確定,因此我們將其暫命名為orf16。
orf3和orf10是大腸桿菌O123中僅有的兩個編碼存在跨膜片段的蛋白的基因。orf3編碼的蛋白與Escherichia coli編碼的O-抗原轉移酶(AAD44153)的氨基酸序列有44%的一致性和66%的相似性,通過HMMTOP2.0程序分析蛋白的拓撲結構發現其含有11個均勻的跨膜片段,這是Wzx蛋白的典型特征。所以命名orf1為wzx。orf10編碼的蛋白與Escherichia coli的O-抗原聚合酶(AAO39700)有23%的一致性和48%的相似性,通過HMMTOP2.0程序分析蛋白的拓撲結構發現其含有9個跨膜片段,并且有一個大的胞質內親水環(loop),這是Wzy蛋白的典型特征。所以命名orf10為wzy。
orf9,orf11,orf15三個基因編碼的蛋白與其他已知的糖基轉移酶有31-55%的序列一致性和50-71%的序列相似性。通過對Pfam中糖基轉移酶基序數據庫的搜索,這三個基因編碼的蛋白與已知的糖基轉移酶的共有序列的同源性預期值很高,因此我們推測這三個基因編碼糖基轉移酶。由于這三個基因的確切功能還不能確定,因此我們將這三個基因暫命名為orf9,orf11和orf15。
實施例6特異基因的篩選。
針對大腸桿菌O123型的O-抗原基因簇中的wzx、wzy基因設計引物,在每個基因內各設計了兩對引物,每對引物分布在相應基因內的不同地方,以確保其特異性;用這些引物以166株大腸桿菌和43株志賀氏菌的基因組為模板進行PCR,除在含大腸桿菌O123組中得到了預期大小的一條帶外,在其他組中都沒有擴增到預期片段大小的正確產物,所以wzx、wzy基因對大腸桿菌O123型的O-抗原都是高度特異的;這些基因在核苷酸序列中的位置見表1。
實施例7引物靈敏度的檢測。
購買市場上的生豬肉餡,攪拌均勻,分成20g一份,存在-40℃冰箱中備用。將10μl大腸桿菌O123的凍存菌液接種到有20mL LB培養基的三角瓶中,于37℃,200轉/分,培養12小時至飽和,取少量培養好的菌液作106和107倍的稀釋,其余的菌液放于4℃的冰箱中備用,取50μl稀釋菌液涂布LB瓊脂平板,37度,培養12h,對所涂平板計數,計算原液中活菌濃度。在5份生豬肉餡中分別摻入5×103,5×102,5×101,5個和0個活菌,攪拌均勻,加入200mL LB培養基,經6層紗布過濾,過濾液于37℃,200轉/分,培養12h。從培養好的菌液中取3mL菌液于6,000g離心5分鐘,去上清,加100μl MQ超純水吹開沉淀并混勻,放入100度沸水中煮15分鐘,裂解液于12,000g離心8分鐘,取1μl上清做為PCR模板。用4對寡核苷酸對,SEQ ID NO1中的2627至2646堿基的核苷酸和3275至3294堿基的核苷酸;SEQ ID NO1中的2806至2825堿基的核苷酸和3376至3395堿基的核苷酸;SEQ IDNO1中的8986至9005堿基的核苷酸和9484至9503堿基的核苷酸;SEQ ID NO1中的8603至8622堿基的核苷酸和9392至9409堿基的核苷酸。,進行PCR反應,PCR反應體系如下MQ15.7μl,Mg2+2.5μl,Buffer2.5μl,dNTP1μl,Taq酶0.3μl,P11μ1,P21μl,模板DNA1μl。PCR反應條件為95℃5′,95℃30″,56℃45″,72℃1′,72℃5′,共30個循環。反應結束后,取10μl反應產物電泳,若有與預期大小相符的擴增帶,則結果為陽性,若沒有,則結果為陰性。參入了5×103,5×102,5×101,和5個活菌的每份豬肉餡均在4對引物的PCR反應中得到陽性結果。參入0個活菌的豬肉餡在4對引物的PCR反應中得到陰性結果。說明使用上述方法時,這4對引物對豬肉餡中的大腸桿菌O123的檢測靈敏度均為0.25個菌/g。
通過對O-抗原基因簇的克隆和在減毒的疫苗菌株中的表達,可以組建重組疫苗。O-抗原為最主要的革蘭氏陰性菌的表面抗原,可以引起強烈的免疫反應,是制造重組疫苗的最好的靶分子之一。在1993年Viret實驗室成功的將志賀氏菌Sonnei的O-抗原基因簇在一株沙門氏菌Tyziai疫苗菌中表達,動物實驗證明可以引起兔子的免疫反應(Molecular Microbiology1993,7239-252)。中國軍事醫學科學院的小組也在從事與Viret實驗室類似的工作。王磊實驗室在1999年成功的將大腸桿菌O111的O-抗原基因簇在沙門氏菌疫苗STM-1中表達,并證明組建成的菌株可以引起小鼠的血液和體液反應(Microbial Pathogenesis 1999,2755-59)。所以本發明大腸桿菌O123的O-抗原特異基因序列可以應用于組建重組疫苗。
根據本發明的對大腸桿菌O123型的O-抗原特異的核苷酸序列(SEQ IDNO1所示),構造特異核酸探針,將其固定到芯片的載體上制成生物芯片,將要檢測的樣品適當處理后,與生物芯片進行雜交反應,然后利用生物芯片信號分析設備就可以得到樣品中相應的細菌情況。這種大腸桿菌O-抗原鑒定的DNA芯片將可以直接用于臨床和其它檢驗場所(如食品加工和生產行業,畜牧獸醫行業海關檢疫等的微生物檢驗)。這種芯片只需要擴大產量,在完全相同的條件下就可以產業化。
表1列出了大腸桿菌O123型的O-抗原基因簇中轉運酶基因和聚合酶基因及基因內的引物及PCR數據。在表中列出了大腸桿菌O123型的O-抗原基因簇的轉運酶基因和聚合酶基因及它們的相應的功能和大小。在每個基因內,我們各設計了兩對引物,每對引物分布在相應基因內的不同地方以確保其特異性。在表中還列出了每個引物在SEQ ID NO1中的位置和大小。以每對引物用表中所列的相應的退火溫度以表2中的所有菌的基因組為模板進行PCR,得到了相應的PCR產物,其大小也列于表中。
表2是用于篩選特異基因的166株大腸桿菌和43株志賀氏菌及它們的來源,為了檢測的方便,我們將它們每12-19個菌分為一組,總共12組,它們的來源都列于表中。
在第13組中含有大腸桿菌O123型的基因組DNA作為陽性對照。以每組菌做模板,用表1中的每對引物按如下條件做PCR在95℃預變性5分鐘后,95℃變性30秒,退火時間是30秒,溫度見表1,72℃延伸2分鐘,這樣進行25個循環。最后在72℃繼續延伸5分鐘,反應體系是25μl。模板為1:20稀釋,取1μl。反應完畢后,取10μlPCR產物通過0.8%瓊脂糖凝膠電泳檢測擴增出的片段。
對于wzx、wzy基因,每個基因都有兩對引物被檢測,每對引物除了在第13組中做PCR后得到了預期大小的正確的一條帶外,在其他組中都沒有擴增到任何大小正確的帶,也就是說,在大多數組中沒有得到任何PCR產物帶,所以wzx、wzy基因對大腸桿菌O123型及其O-抗原是高度特異的。而這些基因內的任何一段10-20nt的寡核苷酸對大腸桿菌O123型的O-抗原是特異的,尤其是上述每個基因中的引物即寡核苷酸對經PCR檢測后證實對大腸桿菌O123型是高度特異的。所有的這些寡核苷酸都可用于快速準確地檢測人體和環境中的大腸桿菌O123型,并能鑒定它們的O-抗原。
表3是大腸桿菌O123型的O-抗原基因簇的結構表,在表中列出了大腸桿菌O123型的O-抗原基因簇的結構,共由16個基因組成,每個基因用方框表示,并在方框內寫入基因的名稱,數字表示的是O-抗原基因簇中的開放閱讀框(orf)的順序。在O-抗原基因簇的兩端是JUMPStart序列和gnd基因,它們不屬于O-抗原基因簇,我們只是用它們的一段序列設計引物來擴增O-抗原基因簇的全長序列。
表4是大腸桿菌O123型的O-抗原基因簇中的基因的位置圖,在圖中列出了大腸桿菌O123型的O-抗原基因簇中的所有開放閱讀框在全序列中的準確位置,在每個開放閱讀框的起始密編碼子和終止密編碼子的下面劃線。在大腸桿菌中開放閱讀框的起始密編碼子有兩個ATG和GTG。
SEQ ID NO1 序列(SEQUENCE LISTING)&lt;110&gt;天津生物芯片技術有限責任公司&lt;120&gt;對大腸桿菌0123型的O-抗原特異的核苷酸&lt;130&gt;對大腸桿菌0123型的O-抗原特異的核苷酸&lt;160&gt;1&lt;170&gt;PatentIn version 3.2&lt;210&gt;1&lt;211&gt;17084&lt;212&gt;DNA&lt;213&gt;Escherichia coli&lt;400&gt;1attggtagct gtaagccaag ggcggtagcg tgcattaata cctctattaa tcaaactaag 60agccgctaat ttaacagcat gctctgaagt aatatggaat aaattaagtg aaaatacttg120ttactggtgg cgcaggattt attggttctg ctgtagttcg tcacattata aataatacgc180aggatagtgt tgttaatgtc gataaattaa cgtacgccgg aaacctggaa tcacttgctg240atgtttctga ttctgaacgc tatgtttttg aacatgcgga tatttgcgat gctgctgcaa300tggcgcggat ttttgctcag catcagccgg atgcagtgat gcacctggct gctgaaagcc360atgtggatcg ttctatcact ggccctgcgg catttattga aaccaatatt gttggtactt420atgtcctttt agaagccgct cgcaattact ggtctgctct tgatagcgac aagaaaaata480gtttccgttt tcatcatatt tctactgacg aagtatatgg cgacttaccc catcctgatg540aagtaaatag taatgaagcg ttaccgctat ttacggaaat gacagcttat gcaccaagta600gcccatattc tgcttctaaa gcatccagcg atcatttagt ccgcgcgtgg aaacgtacct660atggtttacc gaccattgtg actaattgtt ctaacaatta tggtccttat catttcccgg720aaaaactgat tccattggtt attcttaatg ctctggaagg taaggcatta cctatttatg780gtaaggggga ccaaattcgc gactggttgt atgtagaaga tcatgcccgg gcattgtaca840ccgttatgac ccagggtgta gtaggtgaaa cctacaatat cggtggtcgt aacgagaaaa900aaaacctgga cgtggtaaat actatttgcg atctgcttga tgagattgta cctaaacaag960ggtcttatcg cgatcaaatt atctacgtta ctgaccgtcc tgggcacgat cgccgctatg 1020cgattgatgc atcaaaaatc agcgatgagc tgggctggaa accgcaggaa acctttgaat 1080cgggaattcg aaaaactatt ggttggtatt taaataattt agagtggtgc cgtcgtgtgc 1140aagacggtag ctatcatcgt gaacgtttag gattacagta aatgaaaggt atcatacttg 1200caggtggttc aggaactcgt ttatatccag tcacaatggc tgtaagtaaa caattgttgc 1260cagtttatga taaaccaatg atttattacc cattaagtac attaatgttg gctggtatac 1320gaaatatact tattataagt acacctcaag atattcctcg ttttatgggg ttattaggtg 1380atggtagtca atggggactt cagttagaat acaaaataca gaatagtcct gatggattag 1440cgcaagcatt tatattaggt gaggatttta ttggaaacga taattgtgca ttgattttag 1500gggataatat attctatgga catgatctcc agaaacacct agaaatagcg ctctcaaaag 1560ataaaggtgc tacagttttc gcttatcatg ttaaagaccc tatgagatac ggcgttgtag 1620agtttgataa acaaggtaaa gccatttcac ttgaagagaa acctgaaatt ccaaaaagta 1680attatgcagt aacgggattg tatttttatg ataataatgt tgttgagata gcgaaatcat 1740taaaaccctc gaagcgagga gagctagaaa taacggatgt taatcgactc tatttggagc 1800ggggtgagct ttctgtagct atgatggggc gaggttatgc ttggctagat actggaactc 1860atgaaagtct aattgaagct agcaatttca tccagacaat tgaagctaga cagggtttaa 1920aagtatcctg ccctgaagaa atagcattta ataaaaaatt tattgataaa acgcagttaa 1980taaaattagc taagcctttg gagaaaaatt catacggaaa atatttaata aaactggcag 2040agtcgaattg attttttatg aatgattaat ttgttcatag aataaaaagt gaatgcctcc 2100atggttaatg agttaattta acaactaaga aggtgagtat ctatctctaa gtgttattga 2160gaaggtatat gaattcaaat gtaaaaaaaa atattagcgc tgtaaatgga ttgaagtgga 2220gtgcgatcga aagaatatgt tcacaaggta tccagctact tttaatgata gtcttggcta 2280gacaattagg gcctggtgca tttggcctta ttggaatgct gacaatattt attacaatag 2340gtcaggtctt tattgatagt ggttttagtg ccgctctcat tcgaaaaaat gaaagaacag 2400aatcagacta tgcaactgtt ttttacttta acatgacagt tgccattctg ttttatgcag 2460tgttattttt ttgcgcccca ttcatagctg aattttataa gcgtaacgaa ttaattgaat 2520taacaagagt tctgggttta acaataataa taagtgcttt tattattgtt caacgaatac 2580aattaagtgt cattttggat ttcaaaactc aagctatatc gtcattatcc agtgtcataa 2640tctcaggagg gtgtgcacta ttaatggcat ataatggttt tggtgtatgg tcgttagtta 2700tacagactat taccatgggg cttgttaatt tagttatttt aaatatatat aatccatggt 2760taccgaagag gagtttttca aaaaaatcat ttcatggatt tttttctttt ggctccagac 2820ttctgatttc atcactgata gattcaatat acactaatat ttatttggta gttataggga 2880agtcctttag cgctagcaca ctgggccaat ttacacaagc taatttatta tcaaatacgc 2940
cggccatgac gttaacgaca gttgtacaaa gagttaccta tccattatta agtaatgtga 3000ataatgctaa ggggaatatt gacgagatat atcttaggat attaaggctt actgccgcag 3060ccgtttttcc agtaatgttc ctattggcaa taattgctaa accttttgtc gttctatttc 3120ttggccaaca atgggaacct gttgcggaat taatgagcat attatgtata ggatactgtt 3180tatatccagt acatgctatt aatctaaact tattacaggt aaaaggacga actgatttat 3240ttttgaagtt agaaataata aaaaaaactc tcatcacggt tattctaata gtaacaatac 3300catatggtgt taaaataata tgtataggta tttttgcaca gtattatata tccttgttga 3360taaatacata ctatacaggg aaactcagca gcttaagtgc aattgcacag ataaaggcat 3420tattgccaat ttggttaatg gcatctatca gttcggcaat tagttggttc ttaataccaa 3480gagagatatt ttcggaatta tatcaaataa taggaatatt gataaccaat atttcattat 3540atggaatagg aatgtatctt ttccaaaaag atatttatga aatggtaaag tttttattta 3600taaaaacaaa ataattttat gaacaaagag atgaaaatgt taaatggcaa gattttagta 3660acgcaaccat ttttacctga actaagagag tttattccct atctggaaaa aatatgggaa 3720aataaatggt taacaaacaa tggtccattt catcagcaat tagaaaatga tttgtgccgt 3780tatttaggcg tggagtacgt ctccttattt aataatgcta caattgctct gattacggca 3840gtccaatcat tagaattgac tggtgaagta attacaaccc cgtattcatt tgtggcaaca 3900actcactcat tgatgtggaa taatctaaat ccagtatttg tcgatgtcag tagagataca 3960tttaatatca atccgtctca aattgaagcg gcgataacag aaaaaacaac agccataatg 4020gcagtccatt gttatggtaa tccttgtgat gtgattgcaa tagaaaaaat agccaaaaag 4080tataaactta aagtgatata tgatgctgct catgcttttg gggtaaattt taagggggaa 4140agtttattaa aatacggaga tttatcggtt gttagttttc atgcaactaa agtatttaat 4200acatttgaag gtggcgtgat tatttgccca aatgcagaaa ctaagctcaa aatagatcag 4260ctaaaaaact ttggttttga agatgagcta acaataaaat caattggtat taatggaaaa 4320atgagtgagg tcaatgcagc atttggcctt gtacagttga aacatgttaa tgaagctata 4380agtaaaagaa aagaaattaa tgatttatat ggcaagttat tagggaatgt gaaaggcata 4440tcattagcaa aatttgataa actagctacg aaaaattttt catactaccc gattcttatt 4500gaagatgact atgggatgag tcgagatgaa ttatgtcatt tacttcaaaa aaataatata 4560tttgctagga aatattttta tcctttaata agcgatatgg atttatataa aaatatggag 4620tcagcgagaa aagaaaatct acacattgct cgagatattt ccaacaaagt actttgctta 4680ccaatttatg cagatcttga tttagacatt gtgagattta tagcgagagt aataggtaat 4740aaaaaatgaa attagcaata atgcaaccct atctatttcc ttatctaggt tattatcaat 4800taatgtcatc agttgataag tttattattt atgatgatgt ttcatacatc aaaaatggtt 4860ggataaacag aaatagaatt cttgttaatg gtaatgctca ttattttact gtgccagtta 4920taggtgggag ttgtaataat aaaataaata ctgttaaaat tgacaagaca aagaaaaaag 4980ctatcaataa aatcattatt acaattgaac aagcctataa aaaatccgtt ttttttgatg 5040aggtctttcc agtcatttat ggtgtgttat ctaaagagta tgatttcata tccgatctgg 5100caataacgtc attattgtca ataaaaaaca aacttgatat tggagcagaa gttgttttga 5160cttcgaccaa ctatggtaac aataatttaa cttcgcaaga tcgcgtcatt gatattaatg 5220taaaagagca tgcgtccact tatattaatt ctgaaggcgg gagattactt tatgataaaa 5280agacattcaa actaaatggc gtaaatttga aatttataca tccagaaatt ttaccttaca 5340aacaactttg taatggtgag tttgtaccat ccttatcaat tatagatgta gtaatgaata 5400atggttggga tactacaaag cagttagtaa atagctttga actgaaggat tgaacaatgc 5460gtgagcataa ttatgcgatc ggaggatatt tttcactaga attgcaggcg cttaaaaata 5520acactgcaaa tgaaaaagta tatttacaat cagcgagggc atgttttcaa ttactgctag 5580aaagcattga agttagtaga gtatggttac catattatat atgtgatgtc gtcgttgata 5640caataaatga aattgggatt gaaatcttgt attatagtat ttctaaagat tttattccgc 5700agacgtttcc agttttagaa gaaaatgatg tttttgtcta tgttaattat tttggggtgt 5760gtgatgagca aacaaagtta attttgcaaa aatatcctcc agagaaagtt atcttagata 5820actcacaagc tttttatagc ggacacaata ataatttagg aacaatttat tcacctagga 5880aattttttgg cgtccctgat ggtggtattc tgataactaa tcagactata atattacctt 5940cttcacagga taatgattca tcacagtata taaatcatct cattgggcgt ctaatatccc 6000atcccagcga atactatact gattatatta aagctgaaga acgattaaaa aaaattaaaa 6060aagccaaagt gatgtcttat ttaactcgga aattattaga ctccatcaat tatcatgaga 6120ttaaaaaaat aagggatgat aattttaaat tccttcacca tgccctcgaa aagataaatg 6180gaataaaaat tccggagata gtcaatggtc cattatgcta tccattgctt tcaaaaaaca 6240acaaactgaa agatatttta atcaagaatg aaatttatgt gcctacatat tggaaagatg 6300tattgaatcg agtagatata aactcgacag aatttgaatt tgtctcaaac ttaatacctc 6360tgccatgtga tcaacgttac tcatctatcc agatgaagaa aataatcaat attgtacttg 6420aggaaaacta atgaatatca taggaaaaac agttaagttg cgtgctgtgg aaattgatga 6480tttagaattg ttaaataaat gggctaacga tccggaaatt tggtatatgc ttggtggttg 6540gcatttcccc tattccaaaa ataatactga aaaatggata aaaaatattg ataataatga 6600ttcgaaaaat caaatattcg ctattgaaac tgaagagcat ggattgattg gcactgctaa 6660cttagtaaat attgattgga aaaataaaaa tgcatttcat gggataatgt tgggaaatgt 6720tgaaacacga ggtaaagggt acgcgcaaga cgttgtaatg agtctgatga gatatgcctt 6780tgatgaatta ggattaaatc gacttgatgg tgatatgatt gaatataata aattatcaat 6840
taatttttac atcaaaagat gtggttggaa aatcgaggga attaagaaag agtggttctt 6900tagaaagggg caatattttg ataaagtagt tgttggaata accaaaaaag aatatttaga 6960acatattgag aaaagcaagt attgggagac aaaatgatgg aacgttttaa attgggggac 7020acagcaactt atactcaaac tataactgat gcagatatta aaagcttcgc aggtatatct 7080ggggataata atccagtaca tatgagtgac gaatatgcag aaggttcaag gtttaaaaag 7140cgtatagctc atggtctgat atctgctagt tttttttcag ctctatttgg tacaaaatta 7200cctgggcctg gatgtgtata tgtaaatcaa agcttgaaat ttcttagacc tgtttatatt 7260aatgatacgg ttacagcgcg tgtagtctta acagacattg atgttgtaaa aagaagactc 7320ttttttgata cgatttgtga agttaaccga aaaaaagtta tcacggggaa ggctgaaatt 7380tacttgccag aataaagcgc tttaaatttg atgttaactt gctacatatt gatgttttat 7440ctctttttat ctttgaagtt tatcaaaaat gaatgtttcc atgtcagata taaaagttag 7500tgtatgtatt atttctttta accaacaaaa ctatatacga cagtgcttgg atggtgtctt 7560ttctcagaaa acaaattttg agtatgaggt tattatacgt gatgattgca gtaccgataa 7620tacatattta acaataatgg aatatattga cactttagat gaagagaaaa aaaagaacat 7680aaaaataacg gtacttgatg gcacgaaaaa tattggagca aataataatt ttatcgaaac 7740atttaagact tcagtaggtc aatggctagc tatatgtgag ggagatgatt attggtgtga 7800tcaggggaaa ttacaaaaac agtacgacta cgctatttca catagtgatt gctcattagt 7860cgtgcatccc gctctgataa gtgaaaataa tgtaatacgt aaaacatctt gggcgtgtat 7920gaataaaaca ataaatcagc ttagcgatgt aatacgtgca aaaggacagt tctcaccaac 7980tggctcctat tttttcaaac gagaaatctt aaatgttcta ccattgtggt tttcaacagc 8040tcctgttggt gactattaca tggaaatctt tgctacatcg cttggatctt gtcatacaat 8100tcctgatgct atgtcagttt atagaatcaa ttcaacgggg tcttggtctg acctgttaaa 8160aaaagataga aatggccaac ggattattaa tacttatctt tctcaattgg agtatttgga 8220taaacttgcc gaaatctttc cttcttgtgt cgatgatatc acaataaaaa gatcgcatgc 8280acaatatgca gcagcaatgg gttatcttgc aaatggtgat tatactaatt ttcgtatatt 8340aatggataag tcagatacaa acggctggta tgataatatg cattctattt tttattattt 8400aagaaatagc agggcgcttt ccatgttaat gttcagattc aagcctgcaa ttaaatctgc 8460tgtcatgtgg gggcgtcgtg tatttaacaa ctaattattg cgactttttg tcccgaactc 8520gaatcgttag gcgcatattt ttgttagttt atttgatttc aaatgtttac gcctatatag 8580tgtttactga aacaggagta ttaatagggg attatcaagg agtactcata atatataaag 8640atcaggttgt gtatttattg atgttaacaa taatgtcata ttatattgtt tgtggtcctg 8700tttttaactg tctatcaaaa gtaaaaatta gactaaggac atttaaaggc ttaaactctt 8760ttgcttatat cctgtttttt tttcaaatcc tatttgctgt ttttaatatt tcaacaggtt 8820cgaatgccgc gggcactgat tttcaaactg gtggagtcat aagactatta tggctttttt 8880taccagttga ctatctattt tatatatatt atttcgtagg ccgagagaaa aaagtaagta 8940aaatatatct ggccaatgtg gttattttta ttctatcaat gttaagtaga ggatggcttg 9000ggtggacttt ggttttgctt tatgcagagt tatgtttctt tttttattca caaaaaaaaa 9060ttaaaataaa atatcttatc ttattgtttt tcttgcttat tgttgcacca ttagcattta 9120gtctaaaaat tcaattgcgt gctgatttgt attccagtgg tattggtggg gttatatcaa 9180ctttaagtaa tattgattac attcaatctt ataataattt catcgctggt ttcttatcca 9240gaatacaaca gttatcaaat attgttttct tttatgacca tcaacaagaa ttatataaat 9300ttgtttcttc agatattgta tcaaactatg cttgggaagg attacctcaa caaactgtag 9360ctaaacttct aggattagat cctggtgttg atatgcatat ttttctttat agtcattata 9420tttcttcaac ttcagaggct gtaactacat tgcaagttgg attcatttct tggctctttt 9480taggcaccct gtcatccgta ttttatccac tgtttgtctt tgctattata tgcatatcct 9540tatttttatc taaaaaactt ggaggggaaa aactatgtgc acttacgtgg attatgattt 9600ttctttctat tatgtgcggg tggtataatg cttatttggt atatatgcag gcattaatta 9660cattttattt tatcatgggt tttttgaatt taattactct agaaaaaaca aaaattaatc 9720atacatgatg gatgacgaga aatatatgag taatttagta atagttaacg caacagcttt 9780agcgtctagc ggcgctttga cgattttgaa ccagttttta gaacacgcac taaatgattc 9840taagcataag tatctttgtt ttatacatga gagtgttaaa aaaaagagtg ttaataatgt 9900caccgttatt actataaaaa aacaaagttt tattcaacga gtatggtggg atctatatgg 9960attgaataaa tatataaaga aaaataattt gaaacctaaa aaaatagttt ccttgcagaa 10020tacatctgta aatagtaatt tcgagcagat aatatatcta caccagtcga ttccctttag 10080caattttaga ataaaaatta aatttcaata tgctatattt ttcatgtata aatacgtgta 10140tccttttttt atattcttta gaactaaaaa caccactttc gttgttcaga ccgattggat 10200gaaagatgct atcgtagcaa agaaaaaaat tgccaaagaa cgagttcatg taattaaacc 10260tgatataata ttaccggtta ataatcttgc ttaccctgat gaacatgaca aagataattc 10320atctgaagtg ttttttttat atccggccac gccacttttc tataaaaacc atttgattat 10380cttagatgca atgaggattc taaaaacaga aggaatactt gctaatacaa aattccaagt 10440gacttttaaa caagatgata atgatgagtt agcaattaaa atagccaaat atgatttagt 10500tgataatata agcttcttgg gagtattatc ctatgaagaa ttgtttcata aatacttaaa 10560agcagatgct atactttttc ctagctactt ggaaagcttt ggtttaccgt tagcagaggg 10620cgcaatgctt gggaaatata taatttgtag cgatttgcca tatgcaagag atgtgcttaa 10680caattattca aatgtagaat atataaatca tgatgatgcc agtaaatggg cattagctat 10740
gaaggaaata atattaaaga atagaaataa tactttatct gaaagtgaaa atagctatat 10800gtattgtccg aaaacaagct gggcagattt cttcgagtta atctaattga ggtatacgat 10860gtttaaaaat aaggtacttc tcattactgg tggcacaggt tcctttggga atgccgtttt 10920acaacgcttt ttagattcag atattggcga aattcgaatc tttagtcgtg atgagaaaaa 10980acaagatgat atgcgtaaaa aatacgcaag tgataagtta aaattttata taggggatgt 11040gagggactat agcagtgttt taacagcgac tcgtggggtt gattttattt atcatgcagc 11100agcattaaag caagtacctt catgtgagtt ttatccaatg gaagctgtca agactaacgt 11160tattggaact gataacgtac ttgaagctgc aattgcaaac aaagtttcac gtattgtttg 11220tttgagtacc gataaagctg tttatccaat taatgctatg ggtacatcta aggctatgat 11280ggaaaaagtt atcgtagcta agtcaagaaa cttacctaaa gatattacta tttgtgcgac 11340gcgatatgga aatgtaatgg cttcccgtgg ttcggtcatc cctctgttta ttaatcaaat 11400acttgaagga cgcccaatca ctatcaccga tccgtgtatg actcgattca tgatgacttt 11460ggatgatgct gtagatcttg tattacatgc ttttgaacat ggtactaatg gtgatatttt 11520tgttcaaaag gcaccagctg caacaataga tacacttacc aagtcattac ttaagttaac 11580taaacaacat tctcacccaa ttaatatcat tggcactcgc catggtgaaa aactatttga 11640ggtactctgc agtcgggaag aaatgttggt tgcagaagat caaggtaatt actatcgtat 11700acctagtgat aaacgtgatc taaattatga aaaattcttc gacaaaggga ctaaagaaat 11760tcagtttgtt gaagactata attctcataa tacccgtcgt ttagatgttg atgaaatggt 11820tgctcttctt agaaaattag attacatcaa taaaattgag gctggtgaaa aggcagatcc 11880cgatgcgtaa aaaaattcta attgttggcg caaatggcat gttaggtagt agtttactac 11940gctacttttc atcaattgga gattatgaag ttcttggtac gacaagaagt atggtcgttg 12000caaaacaact tgagcaaaag cacaatgtga aaattattga caacgttgat gttattgatt 12060ttaaacgatt agagactgta gtagtagagc ataagccaaa tattgttttc aactgcgttg 12120ggataattaa acaacttgat gcagcaaaaa acaatatatt atctattgaa attaactcat 12180tacttccaca taaattagct caattatgtt cagctcatag tgctaaactc atacattttt 12240caacagattg catttttaaa ggtaccaaag gtaattatgt tgaggatgat gagtctgatg 12300caattgattt atatggtaaa tctaagttct tgggtgaagt tgaatataat gggcatttaa 12360ctttgcggac ttctattatt ggccatgagt tgggatcaaa tcatagtctt gttgactggt 12420ttttatcaca gaaaaaatcg gtgaaaggat ttactaatgc gatattctca ggcctcccaa 12480cttgttatat ggcagaggtt atccataaat atgttcttcc caacaatctt gctggtttat 12540ttcatttaag tgtagagcca attagtaaat atgatttgtt aaatattatt aaaatagtat 12600atggagtaag tactgatata gagccaacca acgaatttaa aatagaccgc agcttgaatt 12660ctacgctatt tcgtaataag acaaattttg tcccagaatc ttgggataaa ttaattgaaa 12720agatgaaaga tgaatacaat aaatatttct aattcaaaaa tacgggttgt tactgtagtt 12780ggcactaggc ctgaaatcat tcgtttatcg agggtaattg ctgttctcga tgagtacact 12840gaacattttc ttgttcatac cggacaaaac tatgattacg agcttaatga ggtattcttt 12900aatgagcttg aaatcagaaa acctgatttt ttcatgaatg ccgcgggcca gaatgctgct 12960gagaccatcg gaaatgtaat tattgaagct gataagatat ttgataaatt gcaacctgaa 13020gctttactta ttcttggtga tacaaatagt gctctagttt ccattgcagc taaaagacga 13080aaaattccta tctttcatat ggaagcgggc aaccgatgct ttgattacag agttccggag 13140gaaataaata ggaagattgt tgatcatatt tcagatatta atttaacata tagtgagata 13200gctagggatt atcttttgag ggaagggctt cctgctgatc aaataatcaa aaccggtagc 13260cctatgcgag aggttctaaa tttttataag gataaaattt catcttcttc tattcttgaa 13320aaacttaacc ttcaagcatc tagttatttc cttgttagta gtcatcgaga agagaatgtt 13380gattcgcctg agaagttgcg ctctcttatt gagacgttaa atatagtatc tgagaaatat 13440aaactgccag taatagtatc aacgcatcct cgtactcgta atagaattga tgctttaggt 13500atcacggtaa gtaataatat cattttttct aagccattcg gatttttaga ttatataaaa 13560ctgcagcaaa atgctcgtgt cgtgctctct gatagtggaa ctataactga agaatcatca 13620gttttgaatt ttccagcctt aaacctgcga gaagtacatg agagaccaga aggatttgaa 13680gaagctgttg ttatgtttgt cgggctagat agaaacagaa ttattcaggg aatcgatatt 13740ttgcagggtc aaaaacgtgg tgataatgat cgtgaccttc atatggttac agattatcag 13800gcagacaatg tttcaattaa aattcttaga attattatga gctatacaaa ctttattaat 13860caaaaggttt ggaaaaaatt ctaatgcgta ttgcgttaat atgtgatgac tatttgcctg 13920atagtactcg tgttagtgct aagatgatgc atgaattggc ttgtgaactt ttagaaaaag 13980gacatgagcc aatcgttatt tgtccttgca ataaaataca gacgctcgaa attttgaatt 14040tggatggtgt cgtcgtttat aagttcccta atggtgctat aaagaatgta tctaaaatat 14100caagagcaat aaacgaatcc atgctatcat tcaacgcatg gcgatttatt ggaaaatata 14160ttcgagaaac taaaattgat ggtgttgtgt actactcacc atctattttt tttggaaaat 14220tagcaaataa aatcaaagaa aattggcatt gtaaatcata tttaatctta agggattctt 14280ttcctcagtg gctggtagat caggggataa ttaaggaggg agggcttgcg gaacgatatt 14340ttaggtactt cgagcagatc aattatgatg ctgcagatta tattggttta atgtcggata 14400gaaacaaaga tattttcatt aataaatatc agaataaata caaggtgcaa actttattca 14460attgggctga ctttaaaggt atagataata ttcccagtgc gactctacga tcaaaattag 14520cacttcaaaa caaagtaatt tttttttatg gaggcaatat tggtcatgct caggatatga 14580tgaatttaat gaggttggtt agatcagcat cttatcgtga tgatgtgcat tttttattga 14640
ttggacaagg tgatgaagtt tcccttgtaa agcagtttat tatagataat tctttaaaaa 14700actgtacgta tttaccatcc ataacacaat cagagtttaa gtctgtatta aagattgttg 14760atgttggttt gtttagcctt gctaaaaatc atactgttca taacttccct gataaattgt 14820tagggtatat ggcaaataaa ctccctatat taggtagtgt taatgcaagc aatgatgtta 14880tggagattat caatggggca aaggccgggt ttgtttttgt taacggaaat gacgaggctt 14940tacttaatgc tgcaataaat cttgcggatg atactcagct aagaaaaaac ctgggatgta 15000atgcttactc tttattacaa gaaaaattct ctgtggaaat ggctgctgaa aagatattaa 15060gcagcttatt ttcctaacag taatatggtg gttttatgaa agtgtctttt gtaagtcagg 15120atgatttcga gaatttaatt caggaagcat ttgcatccgt tcgcttgaga tctcacttac 15180tcctccatga aagccctaat gatgctgtcc agagaataat gataggactt gtcaaaggaa 15240cgtatatccc gcctcatttt catgaatttc agcatcaatg ggaacatttc catgtgtttc 15300aaggtgaggt tgaattaatg ctatttgata gtaacggctg tttaaataaa aaggttattc 15360ttggtgggca gagtaagaat attattgcac aaatttcacc actcacccca catacactag 15420tttgtagatc tcctacagca gttatcatgg agattaaaga aggtcctttt gatgaaaaat 15480gcgctaaagt catcccctca tggtcatata gtgaagatta ttccatttta tccagagata 15540ggatcatcgc aatgatgggc caattatcaa ttggagatag atttagtctc taaacttcac 15600agcaattagc gaagtaatct tctttttcat accttctata ttatatttat ccactactat 15660tatagctttg aatactgagt taacatctac actacattca agccgtgcat acgtcgcggt 15720gaccacccct gacaggagta aataatgtca aagcaacaga ttggcgtagt cggtatggca 15780gtgatggggc gcaaccttgc gctcaacatc gaaagccgtg gttataccgt ctctattttc 15840aaccgttccc gtgaaaagac ggaagaagtg attgccgaaa atccgggcaa gaaactggtt 15900ccttactata cggtgaaaga gtttgttgaa tctctggaaa cgcctcgtcg catcctgtta 15960atggtgaaag caggtgcagg cacggatgct gctattgatt ccctcaaacc atatctcgat 16020aaaggcgaca tcatcatcga tggtggtaac accttcttcc aggacaccat tcgtcgtaac 16080cgtgagcttt ccgcagaagg ctttaacttc atcggtaccg gtgtttccgg tggtgaggag 16140ggcgcactaa aaggtccttc cattatgcct ggtgggcaga aagaagccta tgaacttgtt 16200gcgccgatcc tgaccaaaat cgccgcagtg gctgaagacg gtgagccatg cgttacctat 16260attggtgccg atggcgcagg tcactatgtg aagatggttc acaacggtat tgaatacggc 16320gatatgcagc tgattgctga agcctattct ctgcttaaag gtggtctgaa cctcaccaac 16380gaagaactgg cgcagacctt taccgagtgg aataacggtg aactgagcag ctacctgatc 16440gacatcacca aagatatctt caccaaaaaa gatgaagacg gtaactatct ggttgatgtg 16500atcctggatg aagcagcaaa caaaggtacg ggcaaatgga ccagccagag tgcgctggat 16560cttggcgaac cgctgtcgct gattaccgaa tctgtgtttg cacgttatat ctcttctctg 16620aaagatcagc gtgttgccgc gtctaaagtt ctctctggtc cgcaagcgca gccagcaggc 16680gacaaagctg agttcatcga aaaagttcgt cgtgctctgt atctgggcaa aatcgtttct 16740tacgctcagg gcttctctca gctgcgagcg gcgtctgaag agtacaactg ggatctgaac 16800tacggcgaaa tcgcgaaaat tttccgtgct ggctgcatca tccgtgcgca gttcctgcag 16860aaaatcaccg atgcttatgc cgaaaatccg cagatcgcta acctgctgct ggctccgtac 16920ttcaagcaaa ttgccgatga ctaccagcag gcgctgcgtg atgtcgttgc ttatgcagta 16980cagaacggta tcccggttcc gaccttcgcg gctgcggttg cctattatga cagctaccgc 17040gccgcagttc tgcctgcgaa cctaatccag gcacagcgcg acta 17084表1大腸桿菌O123型的O-抗原基因簇中的寡糖單位處理基因及其中的引物及PCR數據

*只在大腸桿菌O123型中得到正確的一條帶表2 166株大腸桿菌和43株志賀氏菌及它們的來源組號該組中含有的菌株來源1、野生型大腸桿菌01,02,05,07,08,09,012,013,014,015,016,017,018,019ab, IMVSa020,021,022,023,0242、野生型大腸桿菌04,010,025,026,027,028,029,030,032,033,034,035, IMVSa036,037,038,040,041,042,043
3、野生型大腸桿菌 06,044,045,046,048,049,050,051,052,054,055,056, IMVSa057,058,060,061,062,0534、野生型大腸桿菌 063,065,066,069,070,071,074,075,076,077,078, IMVSa079,080,081,082,083,0685、野生型大腸桿菌 084,085,086,087,088,089,090,091,092,098,099, IMVSa0101,0102,0103,0104,0105,0106,0976、野生型大腸桿菌 0107,0108,0109,0110,0111,0112ab,0112ac,0113, IMVSa0115,0116,0118,0120,0125,0126,0128,01177、野生型大腸桿菌 0129,0130,0131,0132,0133,0134,0135,0136,0137,IMVSa0138,0139,0141,0142,0143,0144,0145,01408、野生型大腸桿菌 0146,0147,0148,0150,0152,0154,0156,0157,0158,IMVSa0159,0160,0161,0163,0164,0165,0166,0153b9、野生型大腸桿菌 0168,0169,0170,0171,0172,0173, c痢疾志賀氏菌 D1,D2,D3,D4,D5,D6,D7,D8,D9,D10,D11,D12,D13d10、鮑氏志賀氏菌 B1,B2,B3,B4,B6,B7,B8,B9,B10,B11,B12,B13,B14,B15,dB16,B17,B1811、福氏志賀氏菌 F1a,F1b,F2a,F2b,F3,F4a,F4b,F5(v4),F5(v7),F6,dDS,DR12、野生型大腸桿菌03,011,039,059,064,073,096,095,0100,0114,0151,0155, IMVSa0124,0162,0167,0121,0127,0149,011913、第6組菌株加上大腸桿菌標準菌株0123 IMVSa*為了檢測的方便,我們將每13-19個菌分為一組,總共12組a. Institute of Medical and Veterinary Science(IMVS),Anelaide,Australiab. Statens Serum Institut,Copenhagen,Denmarkc. O172和O173來自于Statens Serum Institut,Copenhagen,Denmark,其余來自于IMVSd. 中國預防醫學科學院流行病學研究所表3大腸桿菌O123型O-抗原基因結構圖Escherichia coli O123 O antigen gene cluster orf# rmlB rmlA wzx vioA orf5 orf6 orf7 orf8 orf9 wzy orf11 fnlA qnlA qnlB orf15 orf16 gndG+C% 43.0 35.3 31.9 30.7 29.4 31.2 31.2 35.3 34.1 29.8 30.0 36.4 31.8 34.9 33.737.6表4大腸桿菌O123型O-抗原基因簇基因位置ATTGGTAGCT GTAAGCCAAG GGCGGTAGCG TGCATTAATA CCTCTATTAA TCAAACTAAG 60orf1的起始AGCCGCTAAT TTAACAGCAT GCTCTGAAGT AATATGGAAT AAATTAAGTGAAAATACTTG 120TTACTGGTGG CGCAGGATTT ATTGGTTCTG CTGTAGTTCG TCACATTATA AATAATACGC 180AGGATAGTGT TGTTAATGTC GATAAATTAA CGTACGCCGG AAACCTGGAA TCACTTGCTG 240ATGTTTCTGA TTCTGAACGC TATGTTTTTG AACATGCGGA TATTTGCGAT GCTGCTGCAA 300TGGCGCGGAT TTTTGCTCAG CATCAGCCGG ATGCAGTGAT GCACCTGGCT GCTGAAAGCC 360ATGTGGATCG TTCTATCACT GGCCCTGCGG CATTTATTGA AACCAATATT GTTGGTACTT 420ATGTCCTTTT AGAAGCCGCT CGCAATTACT GGTCTGCTCT TGATAGCGAC AAGAAAAATA 480GTTTCCGTTT TCATCATATT TCTACTGACG AAGTATATGG CGACTTACCC CATCCTGATG 540AAGTAAATAG TAATGAAGCG TTACCGCTAT TTACGGAAAT GACAGCTTAT GCACCAAGTA 600GCCCATATTC TGCTTCTAAA GCATCCAGCG ATCATTTAGT CCGCGCGTGG AAACGTACCT 660ATGGTTTACC GACCATTGTG ACTAATTGTT CTAACAATTA TGGTCCTTAT CATTTCCCGG 720AAAAACTGAT TCCATTGGTT ATTCTTAATG CTCTGGAAGG TAAGGCATTA CCTATTTATG 780GTAAGGGGGA CCAAATTCGC GACTGGTTGT ATGTAGAAGA TCATGCCCGG GCATTGTACA 840CCGTTATGAC CCAGGGTGTA GTAGGTGAAA CCTACAATAT CGGTGGTCGT AACGAGAAAA 900AAAACCTGGA CGTGGTAAAT ACTATTTGCG ATCTGCTTGA TGAGATTGTA CCTAAACAAG 960GGTCTTATCG CGATCAAATT ATCTACGTTA CTGACCGTCC TGGGCACGAT CGCCGCTATG1020CGATTGATGC ATCAAAAATC AGCGATGAGC TGGGCTGGAA ACCGCAGGAA ACCTTTGAAT1080CGGGAATTCG AAAAACTATT GGTTGGTATT TAAATAATTT AGAGTGGTGC CGTCGTGTGC1140orf1的終止 orf2的起始AAGACGGTAG CTATCATCGT GAACGTTTAG GATTACAGTA AATGAAAGGT ATCATACTTG 1200CAGGTGGTTC AGGAACTCGT TTATATCCAG TCACAATGGC TGTAAGTAAA CAATTGTTGC1260
CAGTTTATGA TAAACCAATG ATTTATTACC CATTAAGTAC ATTAATGTTG GCTGGTATAC1320GAAATATACT TATTATAAGT ACACCTCAAG ATATTCCTCG TTTTATGGGG TTATTAGGTG1380ATGGTAGTCA ATGGGGACTT CAGTTAGAAT ACAAAATACA GAATAGTCCT GATGGATTAG1440CGCAAGCATT TATATTAGGT GAGGATTTTA TTGGAAACGA TAATTGTGCA TTGATTTTAG1500GGGATAATAT ATTCTATGGA CATGATCTCC AGAAACACCT AGAAATAGCG CTCTCAAAAG1560ATAAAGGTGC TACAGTTTTC GCTTATCATG TTAAAGACCC TATGAGATAC GGCGTTGTAG1620AGTTTGATAA ACAAGGTAAA GCCATTTCAC TTGAAGAGAA ACCTGAAATT CCAAAAAGTA1680ATTATGCAGT AACGGGATTG TATTTTTATG ATAATAATGT TGTTGAGATA GCGAAATCAT1740TAAAACCCTC GAAGCGAGGA GAGCTAGAAA TAACGGATGT TAATCGACTC TATTTGGAGC1800GGGGTGAGCT TTCTGTAGCT ATGATGGGGC GAGGTTATGC TTGGCTAGAT ACTGGAACTC1860ATGAAAGTCT AATTGAAGCT AGCAATTTCA TCCAGACAAT TGAAGCTAGA CAGGGTTTAA1920AAGTATCCTG CCCTGAAGAA ATAGCATTTA ATAAAAAATT TATTGATAAA ACGCAGTTAA1980TAAAATTAGC TAAGCCTTTG GAGAAAAATT CATACGGAAA ATATTTAATA AAACTGGCAG2040orf2的終止AGTCGAATTG ATTTTTTATG AATGATTAAT TTGTTCATAG AATAAAAAGT GAATGCCTCC 2100ATGGTTAATG AGTTAATTTA ACAACTAAGA AGGTGAGTAT CTATCTCTAA GTGTTATTGA2160orf3的起始GAAGGTATAT GAATTCAAAT GTAAAAAAAA ATATTAGCGC TGTAAATGGA TTGAAGTGGA 2220GTGCGATCGA AAGAATATGT TCACAAGGTA TCCAGCTACT TTTAATGATA GTCTTGGCTA2280GACAATTAGG GCCTGGTGCA TTTGGCCTTA TTGGAATGCT GACAATATTT ATTACAATAG2340GTCAGGTCTT TATTGATAGT GGTTTTAGTG CCGCTCTCAT TCGAAAAAAT GAAAGAACAG2400AATCAGACTA TGCAACTGTT TTTTACTTTA ACATGACAGT TGCCATTCTG TTTTATGCAG2460TGTTATTTTT TTGCGCCCCA TTCATAGCTG AATTTTATAA GCGTAACGAA TTAATTGAAT2520TAACAAGAGT TCTGGGTTTA ACAATAATAA TAAGTGCTTT TATTATTGTT CAACGAATAC2580AATTAAGTGT CATTTTGGAT TTCAAAACTC AAGCTATATC GTCATTATCC AGTGTCATAA2640TCTCAGGAGG GTGTGCACTA TTAATGGCAT ATAATGGTTT TGGTGTATGG TCGTTAGTTA2700TACAGACTAT TACCATGGGG CTTGTTAATT TAGTTATTTT AAATATATAT AATCCATGGT2760TACCGAAGAG GAGTTTTTCA AAAAAATCAT TTCATGGATT TTTTTCTTTT GGCTCCAGAC2820TTCTGATTTC ATCACTGATA GATTCAATAT ACACTAATAT TTATTTGGTA GTTATAGGGA2880AGTCCTTTAG CGCTAGCACA CTGGGCCAAT TTACACAAGC TAATTTATTA TCAAATACGC2940CGGCCATGAC GTTAACGACA GTTGTACAAA GAGTTACCTA TCCATTATTA AGTAATGTGA3000ATAATGCTAA GGGGAATATT GACGAGATAT ATCTTAGGAT ATTAAGGCTT ACTGCCGCAG3060CCGTTTTTCC AGTAATGTTC CTATTGGCAA TAATTGCTAA ACCTTTTGTC GTTCTATTTC3120TTGGCCAACA ATGGGAACCT GTTGCGGAAT TAATGAGCAT ATTATGTATA GGATACTGTT3180TATATCCAGT ACATGCTATT AATCTAAACT TATTACAGGT AAAAGGACGA ACTGATTTAT3240TTTTGAAGTT AGAAATAATA AAAAAAACTC TCATCACGGT TATTCTAATA GTAACAATAC3300CATATGGTGT TAAAATAATA TGTATAGGTA TTTTTGCACA GTATTATATA TCCTTGTTGA3360TAAATACATA CTATACAGGG AAACTCAGCA GCTTAAGTGC AATTGCACAG ATAAAGGCAT3420TATTGCCAAT TTGGTTAATG GCATCTATCA GTTCGGCAAT TAGTTGGTTC TTAATACCAA3480GAGAGATATT TTCGGAATTA TATCAAATAA TAGGAATATT GATAACCAAT ATTTCATTAT3540ATGGAATAGG AATGTATCTT TTCCAAAAAG ATATTTATGA AATGGTAAAG TTTTTATTTA3600orf3的終止 orf4的的起始TAAAAACAAA ATAATTTTAT GAACAAAGAG ATGAAAATGT TAAATGGCAA GATTTTAGTA3660ACGCAACCAT TTTTACCTGA ACTAAGAGAG TTTATTCCCT ATCTGGAAAA AATATGGGAA3720AATAAATGGT TAACAAACAA TGGTCCATTT CATCAGCAAT TAGAAAATGA TTTGTGCCGT3780TATTTAGGCG TGGAGTACGT CTCCTTATTT AATAATGCTA CAATTGCTCT GATTACGGCA3840GTCCAATCAT TAGAATTGAC TGGTGAAGTA ATTACAACCC CGTATTCATT TGTGGCAACA3900ACTCACTCAT TGATGTGGAA TAATCTAAAT CCAGTATTTG TCGATGTCAG TAGAGATACA3960TTTAATATCA ATCCGTCTCA AATTGAAGCG GCGATAACAG AAAAAACAAC AGCCATAATG4020GCAGTCCATT GTTATGGTAA TCCTTGTGAT GTGATTGCAA TAGAAAAAAT AGCCAAAAAG4080TATAAACTTA AAGTGATATA TGATGCTGCT CATGCTTTTG GGGTAAATTT TAAGGGGGAA4140AGTTTATTAA AATACGGAGA TTTATCGGTT GTTAGTTTTC ATGCAACTAA AGTATTTAAT4200ACATTTGAAG GTGGCGTGAT TATTTGCCCA AATGCAGAAA CTAAGCTCAA AATAGATCAG4260CTAAAAAACT TTGGTTTTGA AGATGAGCTA ACAATAAAAT CAATTGGTAT TAATGGAAAA4320ATGAGTGAGG TCAATGCAGC ATTTGGCCTT GTACAGTTGA AACATGTTAA TGAAGCTATA4380AGTAAAAGAA AAGAAATTAA TGATTTATAT GGCAAGTTAT TAGGGAATGT GAAAGGCATA4440TCATTAGCAA AATTTGATAA ACTAGCTACG AAAAATTTTT CATACTACCC GATTCTTATT4500GAAGATGACT ATGGGATGAG TCGAGATGAA TTATGTCATT TACTTCAAAA AAATAATATA4560TTTGCTAGGA AATATTTTTA TCCTTTAATA AGCGATATGG ATTTATATAA AAATATGGAG4620TCAGCGAGAA AAGAAAATCT ACACATTGCT CGAGATATTT CCAACAAAGT ACTTTGCTTA4680CCAATTTATG CAGATCTTGA TTTAGACATT GTGAGATTTA TAGCGAGAGT AATAGGTAAT4740orf的起始 orf4的終止AAAAAATGAA ATTAGCAATA ATGCAACCCT ATCTATTTCC TTATCTAGGT TATTATCAAT 4800TAATGTCATC AGTTGATAAG TTTATTATTT ATGATGATGT TTCATACATC AAAAATGGTT4860GGATAAACAG AAATAGAATT CTTGTTAATG GTAATGCTCA TTATTTTACT GTGCCAGTTA4920TAGGTGGGAG TTGTAATAAT AAAATAAATA CTGTTAAAAT TGACAAGACA AAGAAAAAAG4980CTATCAATAA AATCATTATT ACAATTGAAC AAGCCTATAA AAAATCCGTT TTTTTTGATG5040AGGTCTTTCC AGTCATTTAT GGTGTGTTAT CTAAAGAGTA TGATTTCATA TCCGATCTGG5100CAATAACGTC ATTATTGTCA ATAAAAAACA AACTTGATAT TGGAGCAGAA GTTGTTTTGA5160CTTCGACCAA CTATGGTAAC AATAATTTAA CTTCGCAAGA TCGCGTCATT GATATTAATG5220TAAAAGAGCA TGCGTCCACT TATATTAATT CTGAAGGCGG GAGATTACTT TATGATAAAA5280
AGACATTCAA ACTAAATGGC GTAAATTTGA AATTTATACA TCCAGAAATT TTACCTTACA5340AACAACTTTG TAATGGTGAG TTTGTACCAT CCTTATCAAT TATAGATGTA GTAATGAATA5400orf5的終止 orf6的起始ATGGTTGGGA TACTACAAAG CAGTTAGTAA ATAGCTTTGA ACTGAAGGATTGAACAATGC5460GTGAGCATAA TTATGCGATC GGAGGATATT TTTCACTAGA ATTGCAGGCG CTTAAAAATA5520ACACTGCAAA TGAAAAAGTA TATTTACAAT CAGCGAGGGC ATGTTTTCAA TTACTGCTAG5580AAAGCATTGA AGTTAGTAGA GTATGGTTAC CATATTATAT ATGTGATGTC GTCGTTGATA5640CAATAAATGA AATTGGGATT GAAATCTTGT ATTATAGTAT TTCTAAAGAT TTTATTCCGC5700AGACGTTTCC AGTTTTAGAA GAAAATGATG TTTTTGTCTA TGTTAATTAT TTTGGGGTGT5760GTGATGAGCA AACAAAGTTA ATTTTGCAAA AATATCCTCC AGAGAAAGTT ATCTTAGATA5820ACTCACAAGC TTTTTATAGC GGACACAATA ATAATTTAGG AACAATTTAT TCACCTAGGA5880AATTTTTTGG CGTCCCTGAT GGTGGTATTC TGATAACTAA TCAGACTATA ATATTACCTT5940CTTCACAGGA TAATGATTCA TCACAGTATA TAAATCATCT CATTGGGCGT CTAATATCCC6000ATCCCAGCGA ATACTATACT GATTATATTA AAGCTGAAGA ACGATTAAAA AAAATTAAAA6060AAGCCAAAGT GATGTCTTAT TTAACTCGGA AATTATTAGA CTCCATCAAT TATCATGAGA6120TTAAAAAAAT AAGGGATGAT AATTTTAAAT TCCTTCACCA TGCCCTCGAA AAGATAAATG6180GAATAAAAAT TCCGGAGATA GTCAATGGTC CATTATGCTA TCCATTGCTT TCAAAAAACA6240ACAAACTGAA AGATATTTTA ATCAAGAATG AAATTTATGT GCCTACATAT TGGAAAGATG6300TATTGAATCG AGTAGATATA AACTCGACAG AATTTGAATT TGTCTCAAAC TTAATACCTC6360TGCCATGTGA TCAACGTTAC TCATCTATCC AGATGAAGAA AATAATCAAT ATTGTACTTG6420orf6的終止 orf7的起始AGGAAAACTA ATGAATATCA TAGGAAAAAC AGTTAAGTTG CGTGCTGTGG AAATTGATGA 6480TTTAGAATTG TTAAATAAAT GGGCTAACGA TCCGGAAATT TGGTATATGC TTGGTGGTTG6540GCATTTCCCC TATTCCAAAA ATAATACTGA AAAATGGATA AAAAATATTG ATAATAATGA6600TTCGAAAAAT CAAATATTCG CTATTGAAAC TGAAGAGCAT GGATTGATTG GCACTGCTAA6660CTTAGTAAAT ATTGATTGGA AAAATAAAAA TGCATTTCAT GGGATAATGT TGGGAAATGT6720TGAAACACGA GGTAAAGGGT ACGCGCAAGA CGTTGTAATG AGTCTGATGA GATATGCCTT6780TGATGAATTA GGATTAAATC GACTTGATGG TGATATGATT GAATATAATA AATTATCAAT6840TAATTTTTAC ATCAAAAGAT GTGGTTGGAA AATCGAGGGA ATTAAGAAAG AGTGGTTCTT6900TAGAAAGGGG CAATATTTTG ATAAAGTAGT TGTTGGAATA ACCAAAAAAG AATATTTAGA6960orf8的起始 orf7的終止ACATATTGAG AAAAGCAAGT ATTGGGAGAC AAAATGATGG AACGTTTTAA ATTGGGGGAC 7020ACAGCAACTT ATACTCAAAC TATAACTGAT GCAGATATTA AAAGCTTCGC AGGTATATCT7080GGGGATAATA ATCCAGTACA TATGAGTGAC GAATATGCAG AAGGTTCAAG GTTTAAAAAG7140CGTATAGCTC ATGGTCTGAT ATCTGCTAGT TTTTTTTCAG CTCTATTTGG TACAAAATTA7200CCTGGGCCTG GATGTGTATA TGTAAATCAA AGCTTGAAAT TTCTTAGACC TGTTTATATT7260AATGATACGG TTACAGCGCG TGTAGTCTTA ACAGACATTG ATGTTGTAAA AAGAAGACTC7320TTTTTTGATA CGATTTGTGA AGTTAACCGA AAAAAAGTTA TCACGGGGAA GGCTGAAATT7380orf8的終止TACTTGCCAG AATAAAGCGC TTTAAATTTG ATGTTAACTT GCTACATATT GATGTTTTAT 7440orf9的起始CTCTTTTTAT CTTTGAAGTT TATCAAAAAT GAATGTTTCC ATGTCAGATA TAAAAGTTAG 7500TGTATGTATT ATTTCTTTTA ACCAACAAAA CTATATACGA CAGTGCTTGG ATGGTGTCTT7560TTCTCAGAAA ACAAATTTTG AGTATGAGGT TATTATACGT GATGATTGCA GTACCGATAA7620TACATATTTA ACAATAATGG AATATATTGA CACTTTAGAT GAAGAGAAAA AAAAGAACAT7680AAAAATAACG GTACTTGATG GCACGAAAAA TATTGGAGCA AATAATAATT TTATCGAAAC7740ATTTAAGACT TCAGTAGGTC AATGGCTAGC TATATGTGAG GGAGATGATT ATTGGTGTGA7800TCAGGGGAAA TTACAAAAAC AGTACGACTA CGCTATTTCA CATAGTGATT GCTCATTAGT7860CGTGCATCCC GCTCTGATAA GTGAAAATAA TGTAATACGT AAAACATCTT GGGCGTGTAT7920GAATAAAACA ATAAATCAGC TTAGCGATGT AATACGTGCA AAAGGACAGT TCTCACCAAC7980TGGCTCCTAT TTTTTCAAAC GAGAAATCTT AAATGTTCTA CCATTGTGGT TTTCAACAGC8040TCCTGTTGGT GACTATTACA TGGAAATCTT TGCTACATCG CTTGGATCTT GTCATACAAT8100TCCTGATGCT ATGTCAGTTT ATAGAATCAA TTCAACGGGG TCTTGGTCTG ACCTGTTAAA8160AAAAGATAGA AATGGCCAAC GGATTATTAA TACTTATCTT TCTCAATTGG AGTATTTGGA8220TAAACTTGCC GAAATCTTTC CTTCTTGTGT CGATGATATC ACAATAAAAA GATCGCATGC8280ACAATATGCA GCAGCAATGG GTTATCTTGC AAATGGTGAT TATACTAATT TTCGTATATT8340AATGGATAAG TCAGATACAA ACGGCTGGTA TGATAATATG CATTCTATTT TTTATTATTT8400AAGAAATAGC AGGGCGCTTT CCATGTTAAT GTTCAGATTC AAGCCTGCAA TTAAATCTGC8460orf10的起始 orf9的終止TGTCATGTGG GGGCGTCGTGTATTTAACAA CTAATTATTG CGACTTTTTG TCCCGAACTC8520GAATCGTTAG GCGCATATTT TTGTTAGTTT ATTTGATTTC AAATGTTTAC GCCTATATAG8580TGTTTACTGA AACAGGAGTA TTAATAGGGG ATTATCAAGG AGTACTCATA ATATATAAAG8640ATCAGGTTGT GTATTTATTG ATGTTAACAA TAATGTCATA TTATATTGTT TGTGGTCCTG8700TTTTTAACTG TCTATCAAAA GTAAAAATTA GACTAAGGAC ATTTAAAGGC TTAAACTCTT8760TTGCTTATAT CCTGTTTTTT TTTCAAATCC TATTTGCTGT TTTTAATATT TCAACAGGTT8820CGAATGCCGC GGGCACTGAT TTTCAAACTG GTGGAGTCAT AAGACTATTA TGGCTTTTTT8880TACCAGTTGA CTATCTATTT TATATATATT ATTTCGTAGG CCGAGAGAAA AAAGTAAGTA8940AAATATATCT GGCCAATGTG GTTATTTTTA TTCTATCAAT GTTAAGTAGA GGATGGCTTG9000GGTGGACTTT GGTTTTGCTT TATGCAGAGT TATGTTTCTT TTTTTATTCA CAAAAAAAAA9060TTAAAATAAA ATATCTTATC TTATTGTTTT TCTTGCTTAT TGTTGCACCA TTAGCATTTA9120GTCTAAAAAT TCAATTGCGT GCTGATTTGT ATTCCAGTGG TATTGGTGGG GTTATATCAA9180
CTTTAAGTAA TATTGATTAC ATTCAATCTT ATAATAATTT CATCGCTGGT TTCTTATCCA9240GAATACAACA GTTATCAAAT ATTGTTTTCT TTTATGACCA TCAACAAGAA TTATATAAAT9300TTGTTTCTTC AGATATTGTA TCAAACTATG CTTGGGAAGG ATTACCTCAA CAAACTGTAG9360CTAAACTTCT AGGATTAGAT CCTGGTGTTG ATATGCATAT TTTTCTTTAT AGTCATTATA9420TTTCTTCAAC TTCAGAGGCT GTAACTACAT TGCAAGTTGG ATTCATTTCT TGGCTCTTTT9480TAGGCACCCT GTCATCCGTA TTTTATCCAC TGTTTGTCTT TGCTATTATA TGCATATCCT9540TATTTTTATC TAAAAAACTT GGAGGGGAAA AACTATGTGC ACTTACGTGG ATTATGATTT9600TTCTTTCTAT TATGTGCGGG TGGTATAATG CTTATTTGGT ATATATGCAG GCATTAATTA9660CATTTTATTT TATCATGGGT TTTTTGAATT TAATTACTCT AGAAAAAACA AAAATTAATC9720orf11的起始orf10的終止ATACATGATG GATGACGAGA AATATATGAG TAATTTAGTA ATAGTTAACG CAACAGCTTT 9780AGCGTCTAGC GGCGCTTTGA CGATTTTGAA CCAGTTTTTA GAACACGCAC TAAATGATTC9840TAAGCATAAG TATCTTTGTT TTATACATGA GAGTGTTAAA AAAAAGAGTG TTAATAATGT9900CACCGTTATT ACTATAAAAA AACAAAGTTT TATTCAACGA GTATGGTGGG ATCTATATGG9960ATTGAATAAA TATATAAAGA AAAATAATTT GAAACCTAAA AAAATAGTTT CCTTGCAGAA 10020TACATCTGTA AATAGTAATT TCGAGCAGAT AATATATCTA CACCAGTCGA TTCCCTTTAG 10080CAATTTTAGA ATAAAAATTA AATTTCAATA TGCTATATTT TTCATGTATA AATACGTGTA 10140TCCTTTTTTT ATATTCTTTA GAACTAAAAA CACCACTTTC GTTGTTCAGA CCGATTGGAT 10200GAAAGATGCT ATCGTAGCAA AGAAAAAAAT TGCCAAAGAA CGAGTTCATG TAATTAAACC 10260TGATATAATA TTACCGGTTA ATAATCTTGC TTACCCTGAT GAACATGACA AAGATAATTC 10320ATCTGAAGTG TTTTTTTTAT ATCCGGCCAC GCCACTTTTC TATAAAAACC ATTTGATTAT 10380CTTAGATGCA ATGAGGATTC TAAAAACAGA AGGAATACTT GCTAATACAA AATTCCAAGT 10440GACTTTTAAA CAAGATGATA ATGATGAGTT AGCAATTAAA ATAGCCAAAT ATGATTTAGT 10500TGATAATATA AGCTTCTTGG GAGTATTATC CTATGAAGAA TTGTTTCATA AATACTTAAA 10560AGCAGATGCT ATACTTTTTC CTAGCTACTT GGAAAGCTTT GGTTTACCGT TAGCAGAGGG 10620CGCAATGCTT GGGAAATATA TAATTTGTAG CGATTTGCCA TATGCAAGAG ATGTGCTTAA 10680CAATTATTCA AATGTAGAAT ATATAAATCA TGATGATGCC AGTAAATGGG CATTAGCTAT 10740GAAGGAAATA ATATTAAAGA ATAGAAATAA TACTTTATCT GAAAGTGAAA ATAGCTATAT 10800orf11的終止 orf12的起始GTATTGTCCG AAAACAAGCT GGGCAGATTT CTTCGAGTTA ATCTAATTGA GGTATACGAT10860GTTTAAAAAT AAGGTACTTC TCATTACTGG TGGCACAGGT TCCTTTGGGA ATGCCGTTTT 10920ACAACGCTTT TTAGATTCAG ATATTGGCGA AATTCGAATC TTTAGTCGTG ATGAGAAAAA10980ACAAGATGAT ATGCGTAAAA AATACGCAAG TGATAAGTTA AAATTTTATA TAGGGGATGT11040GAGGGACTAT AGCAGTGTTT TAACAGCGAC TCGTGGGGTT GATTTTATTT ATCATGCAGC11100AGCATTAAAG CAAGTACCTT CATGTGAGTT TTATCCAATG GAAGCTGTCA AGACTAACGT11160TATTGGAACT GATAACGTAC TTGAAGCTGC AATTGCAAAC AAAGTTTCAC GTATTGTTTG11220TTTGAGTACC GATAAAGCTG TTTATCCAAT TAATGCTATG GGTACATCTA AGGCTATGAT11280GGAAAAAGTT ATCGTAGCTA AGTCAAGAAA CTTACCTAAA GATATTACTA TTTGTGCGAC11340GCGATATGGA AATGTAATGG CTTCCCGTGG TTCGGTCATC CCTCTGTTTA TTAATCAAAT11400ACTTGAAGGA CGCCCAATCA CTATCACCGA TCCGTGTATG ACTCGATTCA TGATGACTTT11460GGATGATGCT GTAGATCTTG TATTACATGC TTTTGAACAT GGTACTAATG GTGATATTTT11520TGTTCAAAAG GCACCAGCTG CAACAATAGA TACACTTACC AAGTCATTAC TTAAGTTAAC11580TAAACAACAT TCTCACCCAA TTAATATCAT TGGCACTCGC CATGGTGAAA AACTATTTGA11640GGTACTCTGC AGTCGGGAAG AAATGTTGGT TGCAGAAGAT CAAGGTAATT ACTATCGTAT11700ACCTAGTGAT AAACGTGATC TAAATTATGA AAAATTCTTC GACAAAGGGA CTAAAGAAAT11760TCAGTTTGTT GAAGACTATA ATTCTCATAA TACCCGTCGT TTAGATGTTG ATGAAATGGT11820TGCTCTTCTT AGAAAATTAG ATTACATCAA TAAAATTGAG GCTGGTGAAA AGGCAGATCC11880orf13的起始 orf12的終止CGATGCGTAAAAAAATTCTA ATTGTTGGCG CAAATGGCAT GTTAGGTAGT AGTTTACTAC11940GCTACTTTTC ATCAATTGGA GATTATGAAG TTCTTGGTAC GACAAGAAGT ATGGTCGTTG12000CAAAACAACT TGAGCAAAAG CACAATGTGA AAATTATTGA CAACGTTGAT GTTATTGATT12060TTAAACGATT AGAGACTGTA GTAGTAGAGC ATAAGCCAAA TATTGTTTTC AACTGCGTTG12120GGATAATTAA ACAACTTGAT GCAGCAAAAA ACAATATATT ATCTATTGAA ATTAACTCAT12180TACTTCCACA TAAATTAGCT CAATTATGTT CAGCTCATAG TGCTAAACTC ATACATTTTT12240CAACAGATTG CATTTTTAAA GGTACCAAAG GTAATTATGT TGAGGATGAT GAGTCTGATG12300CAATTGATTT ATATGGTAAA TCTAAGTTCT TGGGTGAAGT TGAATATAAT GGGCATTTAA12360CTTTGCGGAC TTCTATTATT GGCCATGAGT TGGGATCAAA TCATAGTCTT GTTGACTGGT12420TTTTATCACA GAAAAAATCG GTGAAAGGAT TTACTAATGC GATATTCTCA GGCCTCCCAA12480CTTGTTATAT GGCAGAGGTT ATCCATAAAT ATGTTCTTCC CAACAATCTT GCTGGTTTAT12540TTCATTTAAG TGTAGAGCCA ATTAGTAAAT ATGATTTGTT AAATATTATT AAAATAGTAT12600ATGGAGTAAG TACTGATATA GAGCCAACCA ACGAATTTAA AATAGACCGC AGCTTGAATT12660CTACGCTATT TCGTAATAAG ACAAATTTTG TCCCAGAATC TTGGGATAAA TTAATTGAAA12720orf14的起始orf13的終止AGATGAAAGA TGAATACAAT AAATATTTCT AATTCAAAAA TACGGGTTGT TACTGTAGTT12780GGCACTAGGC CTGAAATCAT TCGTTTATCG AGGGTAATTG CTGTTCTCGA TGAGTACACT12840GAACATTTTC TTGTTCATAC CGGACAAAAC TATGATTACG AGCTTAATGA GGTATTCTTT12900AATGAGCTTG AAATCAGAAA ACCTGATTTT TTCATGAATG CCGCGGGCCA GAATGCTGCT12960GAGACCATCG GAAATGTAAT TATTGAAGCT GATAAGATAT TTGATAAATT GCAACCTGAA13020GCTTTACTTA TTCTTGGTGA TACAAATAGT GCTCTAGTTT CCATTGCAGC TAAAAGACGA13080AAAATTCCTA TCTTTCATAT GGAAGCGGGC AACCGATGCT TTGATTACAG AGTTCCGGAG13140GAAATAAATA GGAAGATTGT TGATCATATT TCAGATATTA ATTTAACATA TAGTGAGATA13200
GCTAGGGATT ATCTTTTGAG GGAAGGGCTT CCTGCTGATC AAATAATCAA AACCGGTAGC13260CCTATGCGAG AGGTTCTAAA TTTTTATAAG GATAAAATTT CATCTTCTTC TATTCTTGAA13320AAACTTAACC TTCAAGCATC TAGTTATTTC CTTGTTAGTA GTCATCGAGA AGAGAATGTT13380GATTCGCCTG AGAAGTTGCG CTCTCTTATT GAGACGTTAA ATATAGTATC TGAGAAATAT13440AAACTGCCAG TAATAGTATC AACGCATCCT CGTACTCGTA ATAGAATTGA TGCTTTAGGT13500ATCACGGTAA GTAATAATAT CATTTTTTCT AAGCCATTCG GATTTTTAGA TTATATAAAA13560CTGCAGCAAA ATGCTCGTGT CGTGCTCTCT GATAGTGGAA CTATAACTGA AGAATCATCA13620GTTTTGAATT TTCCAGCCTT AAACCTGCGA GAAGTACATG AGAGACCAGA AGGATTTGAA13680GAAGCTGTTG TTATGTTTGT CGGGCTAGAT AGAAACAGAA TTATTCAGGG AATCGATATT13740TTGCAGGGTC AAAAACGTGG TGATAATGAT CGTGACCTTC ATATGGTTAC AGATTATCAG13800GCAGACAATG TTTCAATTAA AATTCTTAGA ATTATTATGA GCTATACAAA CTTTATTAAT13860orf14的終止 orf15的起始CAAAAGGTTT GGAAAAAATT CTAATGCGTA TTGCGTTAAT ATGTGATGAC TATTTGCCTG 13920ATAGTACTCG TGTTAGTGCT AAGATGATGC ATGAATTGGC TTGTGAACTT TTAGAAAAAG13980GACATGAGCC AATCGTTATT TCTCCTTGCA ATAAAATACA GACGCTCGAA ATTTTGAATT14040TGGATGGTGT CGTCGTTTAT AAGTTCCCTA ATGGTGCTAT AAAGAATGTA TCTAAAATAT14100CAAGAGCAAT AAACGAATCC ATGCTATCAT TCAACGCATG GCGATTTATT GGAAAATATA14160TTCGAGAAAC TAAAATTGAT GGTGTTGTGT ACTACTCACC ATCTATTTTT TTTGGAAAAT14220TAGCAAATAA AATCAAAGAA AATTGGCATT GTAAATCATA TTTAATCTTA AGGGATTCTT14280TTCCTCAGTG GCTGGTAGAT CAGGGGATAA TTAAGGAGGG AGGGCTTGCG GAACGATATT14340TTAGGTACTT CGAGCAGATC AATTATGATG CTGCAGATTA TATTGGTTTA ATGTCGGATA14400GAAACAAAGA TATTTTCATT AATAAATATC AGAATAAATA CAAGGTGCAA ACTTTATTCA14460ATTGGGCTGA CTTTAAAGGT ATAGATAATA TTCCCAGTGC GACTCTACGA TCAAAATTAG14520CACTTCAAAA CAAAGTAATT TTTTTTTATG GAGGCAATAT TGGTCATGCT CAGGATATGA14580TGAATTTAAT GAGGTTGGTT AGATCAGCAT CTTATCGTGA TGATGTGCAT TTTTTATTGA14640TTGGACAAGG TGATGAAGTT TCCCTTGTAA AGCAGTTTAT TATAGATAAT TCTTTAAAAA14700ACTGTACGTA TTTACCATCC ATAACACAAT CAGAGTTTAA GTCTGTATTA AAGATTGTTG14760ATGTTGGTTT GTTTAGCCTT GCTAAAAATC ATACTGTTCA TAACTTCCCT GGTAAATTGT14820TAGGGTATAT GGCAAATAAA CTCCCTATAT TAGGTAGTGT TAATGCAAGC AATGATGTTA14880TGGAGATTAT CAATGGGGCA AAGGCCGGGT TTGTTTTTGT TAACGGAAAT GACGAGGCTT14940TACTTAATGC TGCAATAAAT CTTGCGGATG ATACTCAGCT AAGAAAAAAC CTGGGATGTA15000ATGCTTACTC TTTATTACAA GAAAAATTCT CTGTGGAAAT GGCTGCTGAA AAGATATTAA15060orf15的終止 orf16的起始GCAGCTTATT TTCCTAACAG TAATATGGTG GTTTTATGAA AGTGTCTTTT GTAAGTCAGG15120ATGATTTCGA GAATTTAATT CAGGAAGCAT TTGCATCCGT TCGCTTGAGA TCTCACTTAC15180TCCTCCATGA AAGCCCTAAT GATGCTGTCC AGAGAATAAT GATAGGACTT GTCAAAGGAA15240CGTATATCCC GCCTCATTTT CATGAATTTC AGCATCAATG GGAACATTTC CATGTGTTTC15300AAGGTGAGGT TGAATTAATG CTATTTGATA GTAACGGCTG TTTAAATAAA AAGGTTATTC15360TTGGTGGGCA GAGTAAGAAT ATTATTGCAC AAATTTCACC ACTCACCCCA CATACACTAG15420TTTGTAGATC TCCTACAGCA GTTATCATGG AGATTAAAGA AGGTCCTTTT GATGAAAAAT15480GCGCTAAAGT CATCCCCTCA TGGTCATATA GTGAAGATTA TTCCATTTTA TCCAGAGATA15540orf16的終止GGATCATCGC AATGATGGGC CAATTATCAA TTGGAGATAG ATTTAGTCTCTAAACTTCAC 15600AGCAATTAGC GAAGTAATCT TCTTTTTCAT ACCTTCTATA TTATATTTAT CCACTACTAT15660TATAGCTTTG AATACTGAGT TAACATCTAC ACTACATTCA AGCCGTGCAT ACGTCGCGGT15720GACCACCCCT GACAGGAGTA AATAATGTCA AAGCAACAGA TTGGCGTAGT CGGTATGGCA15780GTGATGGGGC GCAACCTTGC GCTCAACATC GAAAGCCGTG GTTATACCGT CTCTATTTTC15840AACCGTTCCC GTGAAAAGAC GGAAGAAGTG ATTGCCGAAA ATCCGGGCAA GAAACTGGTT15900CCTTACTATA CGGTGAAAGA GTTTGTTGAA TCTCTGGAAA CGCCTCGTCG CATCCTGTTA15960ATGGTGAAAG CAGGTGCAGG CACGGATGCT GCTATTGATT CCCTCAAACC ATATCTCGAT16020AAAGGCGACA TCATCATCGA TGGTGGTAAC ACCTTCTTCC AGGACACCAT TCGTCGTAAC16080CGTGAGCTTT CCGCAGAAGG CTTTAACTTC ATCGGTACCG GTGTTTCCGG TGGTGAGGAG16140GGCGCACTAA AAGGTCCTTC CATTATGCCT GGTGGGCAGA AAGAAGCCTA TGAACTTGTT16200GCGCCGATCC TGACCAAAAT CGCCGCAGTG GCTGAAGACG GTGAGCCATG CGTTACCTAT16260ATTGGTGCCG ATGGCGCAGG TCACTATGTG AAGATGGTTC ACAACGGTAT TGAATACGGC16320GATATGCAGC TGATTGCTGA AGCCTATTCT CTGCTTAAAG GTGGTCTGAA CCTCACCAAC16380GAAGAACTGG CGCAGACCTT TACCGAGTGG AATAACGGTG AACTGAGCAG CTACCTGATC16440GACATCACCA AAGATATCTT CACCAAAAAA GATGAAGACG GTAACTATCT GGTTGATGTG16500ATCCTGGATG AAGCAGCAAA CAAAGGTACG GGCAAATGGA CCAGCCAGAG TGCGCTGGAT16560CTTGGCGAAC CGCTGTCGCT GATTACCGAA TCTGTGTTTG CACGTTATAT CTCTTCTCTG16620AAAGATCAGC GTGTTGCCGC GTCTAAAGTT CTCTCTGGTC CGCAAGCGCA GCCAGCAGGC16680GACAAAGCTG AGTTCATCGA AAAAGTTCGT CGTGCTCTGT ATCTGGGCAA AATCGTTTCT16740TACGCTCAGG GCTTCTCTCA GCTGCGAGCG GCGTCTGAAG AGTACAACTG GGATCTGAAC16800TACGGCGAAA TCGCGAAAAT TTTCCGTGCT GGCTGCATCA TCCGTGCGCA GTTCCTGCAG16860AAAATCACCG ATGCTTATGC CGAAAATCCG CAGATCGCTA ACCTGCTGCT GGCTCCGTAC16920TTCAAGCAAA TTGCCGATGA CTACCAGCAG GCGCTGCGTG ATGTCGTTGC TTATGCAGTA16980CAGAACGGTA TCCCGGTTCC GACCTTCGCG GCTGCGGTTG CCTATTATGA CAGCTACCGC17040GCCGCAGTTC TGCCTGCGAA CCTAATCCAG GCACAGCGCG ACTA 1708權利要求
1.一種對大腸桿菌O123型的O-抗原特異的核苷酸,其特征在于其是如SEQ ID NO1所示的分離的核苷酸,全長17084個堿基;或者所述具有一個或多個插入、缺失或取代的堿基,同時保持所述分離的核苷酸功能的SEQ IDNO1的核苷酸。
2.按照權利要求1所述的對大腸桿菌O123型的O-抗原特異的核苷酸,其特征在于其包括命名為rmlB,rmlA,wzx,vioA,orf5,orf6,orf7,orf8,orf9,wzy,orf11,fnlA,qnlA,qnlB,orf15,orf16的16個基因組成,都位于JUMPStart序列和gnd基因之間。
3.按照權利要求2所述的對大腸桿菌O123型的O-抗原特異的核苷酸,其特征在于,所述基因中具有高度特異性的基因是轉運酶基因,其包括wzx基因;聚合酶基因,其包括wzy基因;糖基轉移酶基因,其包括orf9,orf11,orf15基因;其中所述的基因wzx是SEQ ID NO1中的2169至3614堿基的核苷酸;wzy是SEQ ID NO1中的8478至9728堿基的核苷酸;orf9是SEQ ID NO1中的7469至8494堿基的核苷酸;orf11是SEQ ID NO1中的9725至10846堿基的核苷酸;orf15是SEQ ID NO1中13884至15077堿基的核苷酸。
4.按照權利要求1或2所述的對大腸桿菌O123型的O-抗原特異的核苷酸,其特征在于其還包括源于所述的wzx基因、wzy基因以及它們的混合或它們的重組。
5.按照權利要求4所述的對大腸桿菌O123型的O-抗原特異的核苷酸,其特征在于,其中源于wzx基因的寡核苷酸對是SEQ ID NO1中的2627至2646堿基的核苷酸和3275至3294堿基的核苷酸;SEQ ID NO1中的2806至2825堿基的核苷酸和3376至3395堿基的核苷酸;源于wzy基因的寡核苷酸對是SEQ ID NO1中的8986至9005堿基的核苷酸和9484至9503堿基的核苷酸;SEQ ID NO1中的8603至8622堿基的核苷酸和9392至9409堿基的核苷酸。
6.權利要求1所述的對大腸桿菌O123型的O-抗原特異的核苷酸在檢測表達O-抗原的細菌、鑒定細菌的O-抗原和細菌的其它多糖抗原中的應用。
7.權利要求1所述的對大腸桿菌O123型的O-抗原特異的核苷酸的重組分子,在通過插入表達而提供表達大腸桿菌O123型的O-抗原,以及制備細菌疫苗中的應用。
8.按照權利要求1所述的對大腸桿菌O123型的O-抗原特異的核苷酸的應用,其特征在于,它作為引物用于PCR、作為探針用于雜交反應與熒光檢測、或者用于制造基因芯片或微陣列,供檢測細菌。
9.權利要求1所述的對大腸桿菌O123型的O-抗原特異的核苷酸的分離方法,其特征在于,其包括下述步驟(1)基因組的提取在培養基中培養大腸桿菌O123型,離心收集細胞;得到的基因組DNA通過瓊脂糖凝膠電泳檢測;(2)通過PCR擴增大腸桿菌O123型中的O-抗原基因簇以大腸桿菌O123型的基因組為模板通過Long PCR擴增其O-抗原基因簇,將得到的PCR產物,用瓊脂糖凝膠電泳檢測PCR產物的大小及其特異性,合并該long PCR產物,并用DNA純化試劑盒純化PCR產物;(3)構建O-抗原基因簇文庫將Long PCR純化產物應用鳥槍法構建O-抗原基因簇文庫;(4)對文庫中的克隆測序從文庫中挑選插入片段在1kb以上的克隆用實驗室常用的DNA自動測序儀對克隆中的插入片段進行測序,序列達到100%的覆蓋率,從而獲得O-抗原基因簇的所有序列;(5)核苷酸序列的拼接及分析應用生物信息學軟件拼接和編輯所有的序列,從而得到大腸桿菌O123型的O-抗原基因簇的核苷酸全長序列;(6)特異基因的篩選針對大腸桿菌O123型的O-抗原基因簇中的wzx、wzy基因設計引物;在每個基因內各設計了兩對引物,每對引物分布在相應基因內的不同地方,以確保其特異性;用這些引物以166株大腸桿菌和43株志賀氏菌的基因組為模板進行PCR,確定wzx、wzy基因對大腸桿菌O123型的O-抗原的高度特異性;(7)引物靈敏度的檢測培養大腸桿菌O123,細菌計數后分別將5×103,5×102,5×101,5個和0個活菌加入到一定量的某種待檢測物中,混入細菌的待檢測物作為檢測用樣品,將樣品加入LB培養基,取一些與樣品混合過的LB培養基過濾,將過濾液進行培養,從培養好的菌液中取數毫升處理后作為PCR模板用寡核苷酸進行PCR反應,檢測其對大腸桿菌O123的靈敏度。
10.根據權利要求9所述的對大腸桿菌O123型的O-抗原特異的核苷酸的分離方法,其特征在于,其包括下述步驟(1)基因組的提取在5mL的LB培養基中37℃過夜培養大腸桿菌O123型,離心收集細胞;用pH值為8.0的500μl 50mM Tris-HCl和10μl 0.4M EDTA重懸細胞,37℃溫育20分鐘,然后加入10μl 10mg/mL的溶菌酶繼續保溫20分鐘;之后加入3μl 20mg/mL的蛋白酶K、15μl 10%SDS,50℃溫育2小時,再加入3μl 10mg/mL的RNase,65℃溫育30分鐘,加等體積酚抽提混合物,取上清再用等體積的酚∶氯仿∶異戊醇混合溶液抽提兩次,取上清再用等體積的乙醚抽提以除去殘余的酚,酚∶氯仿∶異戊醇的混合體積比例為25∶24∶1;上清用2倍體積乙醇沉淀DNA,用玻璃絲卷出DNA并用70%乙醇洗DNA,將DNA重懸于30μl TE中;基因組DNA通過0.4%的瓊脂糖凝膠電泳檢測;(2)通過PCR擴增大腸桿菌O123型中的O-抗原基因簇以大腸桿菌O123型的基因組為模板通過Long PCR擴增其O-抗原基因簇,首先根據經常發現于O-抗原基因簇啟動子區的JUMPStart序列設計上游引物為#wl-1098-ATTGGT AGC TGT AAG CCA AGG GCG GTA GCG T,再根據O-抗原基因簇下游的gnd基因設計下游引物為#1524-TAG TCG CGT GNG CCT GGA TTA AGTTCG C;用Boehringer Mannheim公司的Expand Long Template PCR方法擴增O-抗原基因簇,PCR反應程序如下在94℃預變性2分鐘;然后94℃變性10秒,55 退火15秒,68℃延伸15分鐘,這樣進行30個循環,最后,在68℃繼續延伸7分鐘,得到PCR產物,用0.8%的瓊脂糖凝膠電泳檢測PCR產物的大小及其特異性,合并5管long PCR產物,并用Promega公司的Wizard PCRPreps純化試劑盒純化PCR產物;(3)構建O-抗原基因簇文庫用被修改的Novagen DNaseI shot gun法構建O-抗原基因簇文庫,反應體系是300ng PCR純化產物,0.9μl 0.1M MnCl2,1μl 1∶2000稀釋的1mg/mL的DNaseI,反應在室溫中進行,酶切10分鐘使DNA片段大小集中在1.5kb-3kb之間,而后加入2μl 0.1M EDTA終止反應;合并4管同樣的反應體系,用等體積的酚抽提一次,用等體積的酚∶氯仿∶異戊醇的混合溶液抽提一次,酚∶氯仿∶異戊醇的混合體積比例為25∶24∶1再用等體積的乙醚抽提一次后,用2.5倍體積的無水乙醇沉淀DNA,并用70%乙醇洗沉淀,最后重懸于18μl水中,隨后在此混合物中加入2.5μldNTP(1mMdCTP,1mMdGTP,1mMdTTP,10mMdATP),1.25μl 100mMDTT和5單位的T4DNA聚合酶,11℃30分鐘,將酶切產物補成平端,75℃終止反應后,加入5單位的Tth DNA聚合酶及其相應的緩沖液并將體系擴大為80μl,70℃反應20分鐘,使DNA的3′端加dA尾;此混合物經等體積氯仿∶異戊醇的混合溶液抽提和等體積乙醚抽提后與Promega公司的3×10-3的pGEM-T-Easy載體于16℃連接10小時,總體積為90μl,氯仿∶異戊醇的混合體積比例為24∶1;其中有9μl的10×buffer和25單位的T4DNA連接酶,最后用1/10體積的pH值為5.2的3M NaAc和2倍體積的無水乙醇沉淀連接混合物,再用70%乙醇洗沉淀,干燥后溶于30μl水中得到連接產物;用Bio-Rad公司的電轉化感受態細胞的制備方法制備感受態大腸桿菌DH5α細胞,取2-3μl連接產物與50μl感受態大腸桿菌DH5α混合后,轉到Bio-Rad公司的0.2cm的電擊杯中電擊,電壓為2.5千伏,時間為5.0毫秒至6.0毫秒,電擊后立即在杯中加入1mL的SOC培養基使菌復蘇,然后將菌涂在含有氨芐青霉素、X-Gal和IPTG的LB固體培養基上,在37℃過夜培養,次日得到藍白菌落,將得到的白色菌落即白色克隆轉到含有氨芐青霉素的LB固體培養基上培養,同時從每個克隆中提取質粒,并用EcoRI酶切鑒定其中的插入片段的大小,得到的白色克隆群構成了大腸桿菌O123型的O-抗原基因簇文庫;(4)對文庫中的克隆測序從文庫中挑選插入片段在1kb以上的96個克隆用本實驗室ABI3730型DNA自動測序儀對克隆中的插入片段進行測序,序列達到100%的覆蓋率,從而獲得O-抗原基因簇的所有序列;(5)核苷酸序列的拼接及分析用英國劍橋MRC分子生物學實驗室出版的Staden package軟件包的Pregap4和Gap4軟件拼接和編輯所有的序列,從而得到大腸桿菌O123型的O-抗原基因簇的核苷酸全長序列;序列的質量主要由兩個方面來保證1)對大腸桿菌O123型的基因組作5個Long PCR反應,然后混合這些產物以產生文庫,2)對每個堿基,保證3個以上高質量的覆蓋率,在得到大腸桿菌O123型O-抗原基因簇的核苷酸序列后,用美國國家生物技術信息學中心的Orffinder發現基因,找到16個開放的閱讀框,用Blast系列軟件與GenBank中的基因比較以發現這些開放的閱讀框的功能并確定它們是什么基因,再用英國Sanger中心的Artemis軟件完成基因注釋,用Clustral W軟件做DNA和蛋白質序列間的精確比對,最后得到大腸桿菌O123型的O-抗原基因簇的結構;(6)特異基因篩選針對大腸桿菌O123型的O-抗原基因簇中的wzx、wzy基因設計引物;在每個基因內各設計了兩對引物,每對引物分布在相應基因內的不同地方,以確保其特異性;用這些引物以166株大腸桿菌和43株志賀氏菌的基因組為模板進行PCR,除在含大腸桿菌O123組中得到了預期大小的一條帶外,在其他組中都沒有擴增到預期片段大小的正確產物,所以wzx、wzy基因對大腸桿菌O123型的O-抗原都是高度特異的;(7)引物靈敏度的檢測購買市場上的生豬肉餡,攪拌均勻,分成20g一份,存在-40℃冰箱中備用;將10μl大腸桿菌O123的凍存菌液接種到有20mL LB培養基的三角瓶中,于37℃,200轉/分,培養12小時至飽和,取少量培養好的菌液作106和107倍的稀釋,其余的菌液放于4℃的冰箱中備用,取50μl稀釋菌液涂布LB瓊脂平板,37度,培養12h,對所涂平板計數,計算原液中活菌濃度。在5份生豬肉餡中分別摻入5×103,5×102,5×101,5個和0個活菌,攪拌均勻,加入200mL LB培養基,經6層紗布過濾,過濾液于37℃,200轉/分,培養12h。從培養好的菌液中取3mL菌液于6,000g離心5分鐘,去上清,加100μl MQ超純水吹開沉淀并混勻,放入100度沸水中煮15分鐘,裂解液于12,000g離心8分鐘,取1μl上清做為PCR模板;用寡核苷酸對進行PCR反應,PCR反應體系如下MQ15.7μl,Mg2+2.5μl,Buffer2.5μl,dNTP1μl,Taq酶0.3μl,P11μl,P21μl,模板DNA1μl。PCR反應條件為95℃5′,95℃30″,56℃45″,72℃1′,72℃5′,共30個循環;反應結束后,取10μl反應產物電泳,若有與預期大小相符的擴增帶,則結果為陽性,若沒有,則結果為陰性;參入了5×103,5×102,5×101,和5個活菌的每份豬肉餡均在4對引物的PCR反應中得到陽性結果;參入0個活菌的豬肉餡在引物的PCR反應中得到陰性結果;說明使用上述方法時,引物對豬肉餡中的大腸桿菌O123的檢測靈敏度均為0.25個菌/g。
全文摘要
本發明提供一種對大腸桿菌O123型(Escherichiacoli O123)的O-抗原特異的核苷酸,它是大腸桿菌型中控制O-抗原合成的基因簇的核苷酸全序列,如SEQ ID NO1所示的分離的核苷酸,全長17084個堿基;或者具有一個或多個插入、缺失或取代的堿基,同時保持所述分離的核苷酸功能的SEQ ID NO1的核苷酸;還包括源于大腸桿菌O123型的O-抗原基因簇中的糖基轉移酶基因和寡糖單位處理基因的寡核苷酸;本發明通過PCR證實寡核苷酸對大腸桿菌O123型的O-抗原都有高度的特異性;本發明還公開了用本發明的寡核苷酸檢測和鑒定大腸桿菌O123型的方法。
文檔編號C12Q1/68GK1569874SQ20041001918
公開日2005年1月26日 申請日期2004年5月9日 優先權日2004年5月9日
發明者王磊, 馮露 申請人:天津生物芯片技術有限責任公司
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
韩国伦理电影