專利名稱:對大腸桿菌o58和痢疾志賀氏菌5型的o-抗原特異的核苷酸的制作方法
技術領域:
本發明涉及大腸桿菌O58(Escherichia coli O58)和痢疾志賀氏菌5型(Shigella bodyii 5)中控制O-抗原合成的基因簇的核苷酸全序列,特別是涉及大腸桿菌O58和痢疾志賀氏菌5型中控制O-抗原合成的基因簇中的寡核苷酸,可利用這些對O-抗原特異的寡核苷酸快速、準確地檢測人體及環境中的大腸桿菌O58和痢疾志賀氏菌5型并鑒定這些致病菌中的O-抗原。
背景技術:
志賀氏菌是隨著人類進化而發展起來的致病菌,能侵襲結腸膜上皮細胞,導致自限性化膿性感染病灶,引起人類的細菌性痢疾。人類對志賀氏菌有較高的敏感性,只需要少于十個菌就可以引起人的感染,兒童和成人易感染,特別是兒童,易引起急性中毒性痢疾,而志賀氏菌的O-抗原是志賀氏菌引起疾病的主要原因之一。
大腸桿菌O58也是致病菌,它屬于STEC(Shiga toxin-producingEscherichia coli),即產Shiga毒素的大腸桿菌,它是引起牲畜疾病的重要的病原菌[Steven P et al(2001)“Virulence Properties and Serotypesof Shiga Toxin-Producing Escherichia coli from Healthy AustralianSlaughter-Age Sheep”.Journal of Clinical Microbiology,Vol.39,No.5,2017-2021];此外在中東和北非也發現大腸桿菌O58能導致三歲以下兒童的腹瀉[Leonard F.Perusk I et al(1999)“Phenotypic Diversity ofEnterotoxigenic Escherichia coli Strains from a Community-Based Studyof Pediatric Diarrhea in Periurban Egypt”JOURNAL OF CLINICALMICROBIOLOGY.2974 2978 Vol.37,No.9]。因此對大腸桿菌O58和痢疾志賀氏菌5型的檢測是重要的,需要一個可以快速、準確地檢測大腸桿菌O58和痢疾志賀氏菌5型的方法。
位于大腸桿菌表面的脂多糖是大腸桿菌致病的誘因,而O-抗原是脂多糖最外層結構,是免疫系統識別的目標和噬菌體吸附的位點。O-抗原的缺失會造成許多病原體的血清敏感,或者嚴重削弱病原體的毒力[Frank etal(1987)“The function of antibody and complement in the lysis ofbacteria”.Rev Infect Dis 1771750-1753.Pluschke G et al“Role ofthe capsule and the O-antigen in resistance of O18K1Escherichia colito complement-mediated king”.J Bacteriol 42907-913]。大腸桿菌是一個種,種內的菌株一般通過O-抗原和H-抗原(有時通過K-抗原)來鑒定。其中O-抗原具有高度多樣性,大腸桿菌有166種不同的O-抗原,O-抗原的變化可能是大腸桿菌的起源和維持其多樣性的主要原因[Reeves,P.R(1992)“Variation in antigens,niche specific selection and bacterialpopulations”.FEMS Microbiol.Lett,100509-516]。
O-抗原是革蘭氏陰性細菌脂多糖中的O特異性多糖成分,它由許多重復的寡糖單位組成。O-抗原的合成過程研究得較清楚先由糖基轉移酶將核苷二磷酸單糖轉移到一個固定在細胞內膜的脂分子上,然后在內膜的內側合成寡糖單位,O-抗原的寡糖單位再通過o-抗原轉運酶被轉移到內膜外側,而后通過聚合酶聚合成多糖,再被連接到一個糖脂分子上形成脂多糖分子[Whitfield,C.(1995)“Biosynthesis of lipopolysaccharide Oantigens”.Trends in Microbiology.3178-185;Schnaitman,C.A.andJ.D.Klena.(1993)“Genetics of lipopolysaccharide biosynthesis inentericbacteria”.Microbiological Reviews,57(3)655-682]。編碼負責O-抗原合成的所有酶分子的基因一般在染色體上相鄰排列,形成一個基因簇[Reeves,P.R.,et al.(1996)“Bacterial polysaccharide synthesis and genenomenclature”Trends in Microbiology,4495-503]。在大腸桿菌、志賀氏菌和沙門氏菌中,O-抗原基因簇位于galF和gnd基因之間[Lei Wang.et al(2001)“Sequence analysis of four Shigella boydii O-antigen lociimplicationfor Escherichia coli and Shigella relationships”.Infection andImmunity,116923-6930;Lei Wang and Peter Reeves(2000)“The Escherichiacoli O111 and Salmonella enterica O35 gene clustersgene clusters encodingthe same colitose-containing O antigen are highly conserved”.Journal ofBacteriology.1825256-5261]。O-抗原基因簇含有三類基因糖合成路徑基因,糖基轉移酶基因,寡糖單位處理基因,其中糖合成路徑基因編碼的酶合成O-抗原所需的核苷二磷酸單糖;糖基轉移酶基因編碼的酶將核苷二磷酸單糖及其它分子轉到單糖上從而使單糖聚合成寡糖單位;寡糖單位處理基因包括o-抗原轉運酶基因和聚合酶基因,它們將寡糖單位轉移到細菌內膜外側,再聚合成多糖。糖基轉移酶基因和寡糖單位處理基因只存在于攜帶這些基因的基因簇里。O-抗原中單糖的不同,單糖間聯結鍵的不同和寡糖單位之間聯結鍵的不同構成了O-抗原的多樣性,而單糖的組成、單糖間的聯結鍵及寡糖單位之間的聯結鍵是由O-抗原基因簇中的基因控制著,所以O-抗原基因簇決定了O-抗原的合成,也決定了O-抗原的多樣性。
因為O-抗原是極強的抗原,是大腸桿菌重要的致病因素之一,同時它又具有極強的多樣性,這啟示我們能研究一種快速、準確地檢測大腸桿菌及其O-抗原的特異性好、靈敏度高的方法。以表面多糖為目標的血清學免疫反應自上世紀30年代以來一直被用于對細菌的分型和鑒定,是鑒定致病菌的唯一的手段。這種診斷方法需要大量的抗血清,而抗血清一般種類不全,數量不足,大量的抗血清在制備和儲存中也存在一些困難。另一方面此法耗時長、靈敏度低、漏檢率高、準確性差,所以,現在普遍認為這種傳統的血清學檢測方法將為現代分子生物學方法取代。1993年,Luk,J.M.C et.al用沙門氏菌(S.enterica)O-抗原基因簇的特異核苷酸序列通過PCR方法鑒定了沙門氏菌的O-抗原[Luk,J.M.C.et.al.(1993)“Selective amplification ofabequose and paratose synthase genes(rfb)by polymerase chain reactionfor identification of S.enterica major serogroups(A,B,C2,andD)”,J.Clin.Microbiol.312118-2123]。Luk,et.al的方法是將相應于沙門氏菌血清型E1,D1,A,B和C2的O-抗原內的CDP-阿比可糖和CDP-泰威糖的合成基因的核苷酸序列排列后得到對不同血清型的沙門氏菌特異的寡核苷酸。1996年,Paton,A.W et.al用對E.coli O111的O-抗原特異的源于wbdI基因的寡核苷酸鑒定了一株產毒素的E.coli O111的血清型[“Molecularmicrobiological investigation of an outbreak of Hemolytic-UremicSyndrome caused by dry fermented sausage contaminated with Shiga-liketoxin producing Escherichia coli”.J.Clin.Microbiol.341622-1627],但是后來的研究表明Paton,A.W et.al的用源于wbdI基因的寡核苷酸鑒定E.coli O111的血清型的方法有假陽性結果出現。Bastin D.A.and Reeves,P.R.認為,這是由于wbdI基因是一個推測的糖合成路徑基因[Bastin D.A.andReeves,P.R.(1995)“Sequence and analysis of the O antigen gene(rfb)cluster of Escherichia coli O111”.Gene 16417-23],而在其它細菌的O-抗原的結構中也可能有這個糖,所以糖合成路徑基因對于O-抗原并不是高度特異的。
大腸桿菌O58和痢疾志賀氏菌5型的O-抗原的結構已知。它們的結構是完全一樣的,它是由4個糖組成的重復單位[B.A.Dmitriev.V.L et al(1977)“Somatic antigens of Shigella.The strucuture of the specificpolysaccharide chain of Shigella dysenteriae type 5lipopolysaccharide”.European Journal of Biochemistry,Vol 78,381-387].[B.A.Dmitriev.V.L et al(1977),European Journal ofBiochemistry,Vol 79,111-115].
發明內容
本發明的目的是提供了一種對大腸桿菌O58和痢疾志賀氏菌5型的O-抗原特異的核苷酸。它是大腸桿菌O58和痢疾志賀氏菌5型的O-抗原基因簇中的核苷酸,是源于o-抗原轉運酶基因、聚合酶基因及糖基轉移酶基因的特異的核苷酸。
本發明的一個目的是提供了大腸桿菌O58和痢疾志賀氏菌5型的O-抗原基因簇的全長核苷酸序列。
本發明的次一目的是提供了構成大腸桿菌O58和痢疾志賀氏菌5型的O-抗原基因簇的基因轉運酶基因即wzx基因或與wzx有相似功能的基因;聚合酶基因即wzy基因或與wzy有相似功能的基因;糖基轉移酶基因,包括orf6、orf9、orf11、orf12基因;糖合成路徑基因,包括rmlB、rmlD、rmlA、rmlC、manB、manC、orf7、orf8基因。它們在O-抗原基因簇中的起始位置和終止位置及核苷酸序列都列在表4中。
本發明的又一目的是提供了寡核苷酸,它們分別源于大腸桿菌O58和痢疾志賀氏菌5型的O-抗原基因簇中編碼轉運酶的基因,包括wzx基因或與wzx有相似功能的基因;源于編碼聚合酶的基因,包括wzy基因或與wzy有相似功能的基因;源于編碼糖基轉移酶的基因,包括orf6、orf9、orf11、orf12基因。它們是上述基因內的寡核苷酸,長度在10-20nt;它們對大腸桿菌O58和痢疾志賀氏菌5型的O-抗原是特異的;尤其是表1中列出的源于編碼轉運酶的基因和聚合酶的基因的寡核苷酸,它們對大腸桿菌O58和痢疾志賀氏菌5型的O-抗原是高度特異的,而且這些寡核苷酸還可重新組合,組合后的寡核苷酸對大腸桿菌O58和痢疾志賀氏菌5型的O-抗原也是高度特異的。
本發明的另一目的是提供的上述寡核苷酸可作為引物用于核酸擴增反應,或者作為探針用于雜交反應,或者用于制造基因芯片或微陣列,從而通過這些方法來檢測和鑒定大腸桿菌O58和痢疾志賀氏菌5型的O-抗原及檢測和鑒定大腸桿菌O58和痢疾志賀氏菌5型。
本發明的再一目的是提供了分離大腸桿菌O58和痢疾志賀氏菌5型的O-抗原基因簇的全序列的方法。按照本方法操作可以獲得其他細菌的O-抗原基因簇的全序列,也可以獲得編碼其他多糖抗原的細菌的基因簇的全序列。
本發明的目的是由以下技術方案實現的。
本發明對大腸桿菌O58和痢疾志賀氏菌5型的O-抗原特異的核苷酸,其特征在于,其是如SEQ ID NO1所示的分離的大腸桿菌O58和痢疾志賀氏菌5型的核苷酸,全長17769個堿基;或者具有一個或多個插入、缺失或取代的堿基,同時保持所述分離的核苷酸功能的SEQ ID NO1的大腸桿菌O58和痢疾志賀氏菌5型的核苷酸。
前述的對大腸桿菌O58和痢疾志賀氏菌5型的O-抗原特異的核苷酸,其特征在于,其中包括命名為rmlB,rmlD,rmlA,rmlC,wzx,orf6,orf7,orf8,orf9,wzy,orf11,orf12,manC,manB的14個基因組成,都位于galF基因和gnd基因之間。
前述的對大腸桿菌O58和痢疾志賀氏菌5型的O-抗原特異的核苷酸,其特征在于,所述的基因包括轉運酶基因,包括wzx基因或與wzx有相似功能的基因;聚合酶基因,包括wzy基因或與wzy有相似功能的基因;糖基轉移酶基因,包括orf6、orf9、orf11、orf12基因。其中所述的轉運酶基因是SEQ ID NO1中的4728至5915堿基的核苷酸;所述的聚合酶基因是SEQ IDNO1中的9803至11134堿基的核苷酸;所述的orf6基因是SEQ ID NO1中的5905至6513堿基的核苷酸;orf9基因是SEQ ID NO1中的8977至9798堿基的核苷酸;orf11基因是SEQ ID NO1中的11127至12251堿基的核苷酸;orf12基因是SEQ ID NO1中的12333至13442堿基的核苷酸。
前述的對大腸桿菌O58和痢疾志賀氏菌5型的O-抗原特異的核苷酸,其特征在于,其源于所述的wzx基因或wzy基因或糖基轉移酶基因的寡核苷酸;以及它們的混合或它們的重組。
前述的對大腸桿菌O58和痢疾志賀氏菌5型的O-抗原高度特異的核苷酸,其特征在于,所述的源于wzx基因的寡核苷酸對是SEQ ID NO1中的4967至4984堿基的核苷酸和5336至5353堿基的核苷酸,SEQ ID NO1中的5341至5358堿基的核苷酸和5839至5856堿基的核苷酸;所述的源于wzy基因的寡核苷酸對是SEQ ID NO1中的10475至10492堿基的核苷酸和11855至10872堿基的核苷酸,SEQ ID NO1中的10110至10127堿基的核苷酸和10932至10949堿基的核苷酸。
前述的對大腸桿菌O58和痢疾志賀氏菌5型的O-抗原特異的核苷酸在檢測表達O-抗原的細菌、鑒定細菌的O-抗原和細菌的其它多糖抗原的應用。
前述的對大腸桿菌O58和痢疾志賀氏菌5型的O-抗原特異的核苷酸的重組分子,在通過插入表達而提供表達大腸桿菌O58和痢疾志賀氏菌5型的O-抗原,以及制備細菌疫苗中的應用。
前述的對大腸桿菌O58和痢疾志賀氏菌5型的O-抗原特異的核苷酸的應用,其特征在于,它作為引物用于PCR、作為探針用于雜交反應與熒光檢測、或者用于制造基因芯片或微陣列,供檢測細菌。
前述的對大腸桿菌O58和痢疾志賀氏菌5的O-抗原特異的核苷酸的分離方法,其特征在于,包括下述步驟(1)基因組的提取在培養基中培養大腸桿菌O58和痢疾志賀氏菌5型,離心收集細胞;得到的基因組DNA通過瓊脂糖凝膠電泳檢測;(2)通過PCR擴增大腸桿菌O58和痢疾志賀氏菌5型中的O-抗原基因簇以大腸桿菌O58和痢疾志賀氏菌5型的基因組為模板通過Long PCR擴增其O-抗原基因簇,將得到的PCR產物,用瓊脂糖凝膠電泳檢測PCR產物的大小及其特異性,合并該long PCR產物,并用DNA純化試劑盒純化PCR產物;(3)構建O-抗原基因簇文庫將Long PCR純化產物應用鳥槍法構建O-抗原基因簇文庫;(4)對文庫中的克隆測序從文庫中挑選插入片段在1kb以上的克隆用實驗室常用的DNA自動測序儀對克隆中的插入片段進行測序,序列達到100%的覆蓋率,從而獲得O-抗原基因簇的所有序列;(5)核苷酸序列的拼接及分析應用生物信息學軟件拼接和編輯所有的序列,從而得到大腸桿菌O58和痢疾志賀氏菌5型的O-抗原基因簇的核苷酸全長序列;(6)特異基因的篩選針對大腸桿菌O58和痢疾志賀氏菌5型的O-抗原基因簇中的wzx、wzy基因設計引物;在每個基因內各設計了兩對引物,每對引物分布在相應基因內的不同地方,以確保其特異性;用這些引物以166株大腸桿菌和43株志賀氏菌的基因組為模板進行PCR,確定wzx、wzy基因對大腸桿菌O58和痢疾志賀氏菌5型的O-抗原的高度特異性;(7)引物靈敏度的檢測培養大腸桿菌O58和痢疾志賀氏菌5,細菌計數后分別將5×103,5×102,5×101,5個和0個活菌加入到一定量的某種待檢測物中,混入細菌的待檢測物作為檢測用樣品,將樣品加入LB培養基,取一些與樣品混合過的LB培養基過濾,將過濾液進行培養,從培養好的菌液中取數毫升處理后作為PCR模板用寡核苷酸進行PCR反應,檢測其對大腸桿菌O58和痢疾志賀氏菌5的靈敏度。
前述的對大腸桿菌O58和痢疾志賀氏菌5型的O-抗原特異的核苷酸的分離方法,其特征在于,包括下述步驟(1)基因組的提取在5mL的LB培養基中37℃過夜培養大腸桿菌O58和痢疾志賀氏菌5型,離心收集細胞。用500ul 50mM Tris-HCl(pH8.0)和10ul0.4M EDTA重懸細胞,37℃溫育20分鐘,然后加入10ul 10mg/ml的溶菌酶繼續保溫20分鐘。之后加入3ul 20mg/ml的蛋白酶K、15ul 10%SDS,50℃溫育2小時,再加入3ul 10mg/ml的RNase,65℃溫育30分鐘。加等體積酚抽提混合物,取上清液再用等體積的酚∶氯仿∶異戊醇(25∶24∶1)混合溶液抽提兩次,取上清液,再用等體積的乙醚抽提以除去殘余的酚,上清液用2倍體積乙醇沉淀DNA,用玻璃絲卷出DNA并用70%乙醇洗DNA,最后將DNA重懸于30ul TE中,基因組DNA通過0.4%的瓊脂糖凝膠電泳檢測;(2)通過PCR擴增大腸桿菌O58和痢疾志賀氏菌5型中的O-抗原基因簇以大腸桿菌O58和痢疾志賀氏菌5型的基因組為模板通過Long PCR擴增其O-抗原基因簇;首先根據經常發現于O-抗原基因簇上游的galF基因設計上游引物(5’ATT GTG GCT GCA GGG ATC AAA GAA ATC-3’),再根據O-抗原基因簇下游的gnd基因設計下游引物(5’-TAG TCG CGC TGN GCC TGG ATT AAGTTC GC-3’)。用Boehringer Mannheim公司的Expand Long Template PCR方法擴增O-抗原基因簇,PCR反應程序如下在94℃預變性2分鐘,然后94℃變性10秒,60℃退火30秒,68℃延伸15分鐘,這樣進行30個循環;最后,在68℃繼續延伸7分鐘,得到PCR產物,用0.8%的瓊脂糖凝膠電泳檢測PCR產物的大小及其特異性;合并6管long PCR產物,并用Promega公司的Wizard PCR Preps純化試劑盒純化PCR產物;(3)構建O-抗原基因簇文庫用被修改的Novagen DNaseI shot gun法構建O-抗原基因簇文庫。反應體系是300ng PCR純化產物,0.9ul 0.1M MnCl2,1ul 1∶2000稀釋的1mg/ml的DNaseI,反應在室溫中進行;酶切10分鐘使DNA片段大小集中在1kb-3kb之間,而后加入2ul 0.1M EDTA終止反應;合并4管同樣的反應體系,用等體積的酚抽提一次,用等體積的酚∶氯仿∶異戊醇(25∶24∶1)混合溶液抽提一次,再用等體積的乙醚抽提一次后,用2.5倍體積的無水乙醇沉淀DNA,并用70%乙醇洗沉淀,最后重懸于18ul水中;隨后在此混合物中加入2.5ul dNTP(1mMdCTP,1mMdGTP,1mMdTTP,10mMdATP),1.25ul 100mM DTT和5單位的T4DNA聚合酶,11℃反應30分鐘,將酶切產物補成平端,75℃終止反應后,加入5單位的Tth DNA聚合酶及其相應的緩沖液并將體系擴大為80ul,70℃反應20分鐘,使DNA的3′端加dA尾,此混合物經等體積氯仿∶異戊醇(24∶1)混合溶液抽提和等體積乙醚抽提后與Promega公司的3×103的pGEM-T-Easy載體于16℃連接24小時,總體積為90ul,其中有9ul的10×buffer和25單位的T4DNA連接酶;最后用1/10體積的3M NaAc(pH5.2)和2倍體積的無水乙醇沉淀連接混合物,再用70%乙醇洗沉淀,干燥后溶于30ul水中得到連接產物。用Bio-Rad公司的電轉化感受態細胞的制備方法制備感受態大腸桿菌DH5α細胞,取2-3ul連接產物與50ul感受態大腸桿菌DH5α混合后,轉到Bio-Rad公司的0.2cm的電擊杯中電擊,電壓為2.5千伏,時間為5.0毫秒-6.0毫秒,電擊后立即在杯中加入1ml的SOC培養基使菌復蘇,然后將菌涂在含有氨芐青霉素、X-Gal和IPTG的LB固體培養基上37℃過夜培養,次日得到藍白菌落,將得到的白色菌落即白色克隆轉到含有氨芐青霉素的LB固體培養基上培養,同時從每個克隆中提取質粒并用EcoRI酶切鑒定其中的插入片段的大小,得到的白色克隆群構成了大腸桿菌O58和痢疾志賀氏菌5型的O-抗原基因簇文庫;(4)對文庫中的克隆測序從文庫中挑選插入片段在1000bp以上的100個克隆由上海生物工程有限公司用ABI377型DNA自動測序儀對克隆中的插入片段單向進行測序,使序列達到80%的覆蓋率,再通過將相聯系的序列進行反向測序及測通得到剩余20%的序列,從而獲得O-抗原基因簇的所有序列;(5)核苷酸序列的拼接及分析用英國劍橋MRC(Medical ResearchCouncil)分子生物學實驗室出版的Staden package軟件包的Pregap4和Gap4軟件拼接和編輯所有的序列,從而得到大腸桿菌O58和痢疾志賀氏菌5型的O-抗原基因簇的核苷酸全長序列,序列的質量主要由兩個方面來保證1)對大腸桿菌O58和痢疾志賀氏菌5型的基因組作6個Long PCR反應,然后混合這些產物以產生文庫。2)對每個堿基,保證3個以上高質量的覆蓋率;在得到大腸桿菌O58和痢疾志賀氏菌5型的O-抗原基因簇的核苷酸序列后,用美國國家生物技術信息學中心(The National Center for BiotechnologyInformation,NCBI)的orffinder發現基因,找到14個開放的閱讀框,用blast系列軟件與GenBank中的基因比較以發現這些開放的閱讀框的功能并確定它們是什么基因,再用英國sanger中心的Artemis軟件完成基因注釋,用Clustral W軟件做DNA和蛋白質序列間的精確比對,最后得到大腸桿菌O58和痢疾志賀氏菌5型的O-抗原基因簇的結構;(6)特異基因的篩選針對大腸桿菌O58和痢疾志賀氏菌5型的O-抗原基因簇中的wzx、wzy基因設計引物;在每個基因內各設計了兩對引物,每對引物分布在相應基因內的不同地方以確保其特異性;用這些引物以166種血清型的大腸桿菌和43株志賀氏菌的基因組為模板進行PCR,所有引物都在大腸桿菌O58和痢疾志賀氏菌5型中得到陽性結果,在其他組中都沒有擴增到任何大小正確的帶,也就是說,在大多數組中沒有得到任何PCR產物帶,雖然在少數組中得到PCR產物帶,但其大小不符合預期大小,所以wzx、wzy基因對大腸桿菌O58和痢疾志賀氏菌5型及其O-抗原都是高度特異的。
(7)引物靈敏度的檢測購買市場上的生豬肉餡,攪拌均勻,分成20g一份,存在-40℃冰箱中備用。將10μl大腸桿菌O58和痢疾志賀氏菌5型的凍存菌液接種到有20ml LB培養基的三角瓶中,于37℃,200轉/分,培養12小時至飽和,取少量培養好的菌液作106和107倍的稀釋,其余的菌液放于4℃的冰箱中備用,取50μl稀釋菌液涂布LB瓊脂平板,37度,培養1 2h,對所涂平板計數,計算原液中活菌濃度。在5份生豬肉餡中分別摻入5×103,5×102,5×101,5個和0個活菌,攪拌均勻,加入200ml LB培養基,經6層紗布過濾,過濾液于37℃,200轉/分,培養12h。從培養好的菌液中取3ml菌液于6,000g離心5分鐘,去上清,加100μl MQ超純水吹開沉淀并混勻,放入100度沸水中煮15分鐘,裂解液于12,000g離心8分鐘,取1μ上清做為PCR模板。用4對寡核苷酸對,SEQ ID NO1中的4967至4984堿基的核苷酸和5336至5353堿基的核苷酸,SEQ ID NO1中的5341至5358堿基的核苷酸和5839至5856堿基的核苷酸,SEQ ID NO1中的10475至10492堿基的核苷酸和11855至10872堿基的核苷酸,SEQ ID NO1中的10110至10127堿基的核苷酸和10932至10949堿基的核苷酸,進行PCR反應,PCR反應體系如下MQ15.7μl,Mg2+2.5μl,Buffer2.5μl,dNTP1μl,Taq酶0.3μl,P11μl,P21μl,模板DNA1μl。PCR反應條件為95℃5′,95℃30″,56℃45″,72℃1′,72℃5′,共30個循環。反應結束后,取10μl反應產物電泳,若有與預期大小相符的擴增帶,則結果為陽性,若沒有,則結果為陰性。參入了5×103,5×102,5×101,和5個活菌的每份豬肉餡均在4對引物的PCR反應中得到陽性結果。參入0個活菌的豬肉餡在4對引物的PCR反應中得到陰性結果。說明使用上述方法時,這4對引物對豬肉餡中的大腸桿菌O58和痢疾志賀氏菌5型的檢測靈敏度均為0.25個菌/g。
也就是,本發明的第一個方面,提供了大腸桿菌O58和痢疾志賀氏菌5型的O-抗原基因簇的全長核苷酸序列,它的全序列如SEQ ID NO1所示,全長17769個堿基;或者具有一個或多個插入、缺失或取代的堿基,同時保持所述分離的核苷酸功能的SEQ ID NO1的核苷酸。通過本發明的方法得到了大腸桿菌O58和痢疾志賀氏菌5型的O-抗原基因簇的結構,如表3所述,它包括命名為rmlB,rmlD,rmlA,rmlC,wzx,orf6,orf7,orf8,orf9,wzy,orf11,orf12,manC,manB的14個基因組成,都位于galF基因和gnd基因之間。
本發明的第二個方面,提供了大腸桿菌O58和痢疾志賀氏菌5型的O-抗原基因簇中的基因,即轉運酶基因(wzx基因或與wzx有相似功能的基因);聚合酶基因(wzy基因或與wzy有相似功能的基因);糖基轉移酶基因,包括orf6、orf9、orf11、orf12基因;細菌多糖抗原中特殊的糖合成路徑基因,包括rmlB、rmlD、rmlA、rmlC、manB、manC、orf7、orf8基因。它們在O-抗原基因簇中的起始位置和終止位置及核苷酸序列都列在表4中。本發明尤其涉及到o-抗原轉運酶基因和聚合酶基因,因為糖合成路徑基因即合成核苷二磷酸單糖的基因現在被預示對較多胞外多糖是常見的、共同的,對細菌的O-抗原并不是特異的,而本發明涉及到的o-抗原轉運酶基因、聚合酶基因和糖基轉移酶基因對大腸桿菌O58和痢疾志賀氏菌5型的O-抗原是特異的。
本發明的第三個方面,提供了源于大腸桿菌O58和痢疾志賀氏菌5型的O-抗原基因簇中的wzy基因或與wzy有相似功能的基因和wzx基因或與wzx有相似功能的基因的寡核苷酸和糖基轉移酶基因包括orf6、orf9、orf11、orf12基因的寡核苷酸,它們是這些基因中的任何一段寡核苷酸。但是,優先被用的是列于表1中源于大腸桿菌O58和痢疾志賀氏菌5型的O-抗原基因簇中的wzy基因或與wzy有相似功能的基因、wzx基因或與wzx有相似功能的基因的寡核苷酸對。在表1中也列出了這些寡核苷酸對在O-抗原基因簇中的位置及以這些寡核苷酸對為引物所做的PCR反應的產物的大小,這些PCR反應可用表中的退火溫度進行。這些引物只在以大腸桿菌O58和痢疾志賀氏菌5型為模板進行的PCR擴增中得到預期大小的產物,而在以表2所列的其它菌為模板進行的PCR擴增中都未得到預期大小的產物。更詳細地說,以這些寡核苷酸對為引物所做的PCR反應在大多數細菌中均未得到任何產物,所以,可以確定這些引物即表1所列的寡核苷酸對大腸桿菌O58和痢疾志賀氏菌5型及它們的O-抗原是高度特異的。
所述的對大腸桿菌O58和痢疾志賀氏菌5型的O-抗原特異的核苷酸的分離和鑒定方法包括下述步驟1)基因組的提取;2)PCR擴增大腸桿菌O58和痢疾志賀氏菌5型中的O-抗原基因簇;3)O-抗原基因簇文庫的構建;4)對文庫中的克隆測序;5)核苷酸序列的拼接及分析,最終獲得O-抗原基因簇的結構;6)特異基因的篩選;7)引物靈敏度的檢測。
本發明的其他方面由于本文的技術的公開,對本領域的技術人員而言是顯而易見的。
如本發明所述,“寡核苷酸”主要是指來源于O-抗原基因簇中的編碼轉運酶的基因、編碼聚合酶的基因和編碼糖基轉移酶基因內的一段核苷酸分子,它們在長度上可改變,一般在10到20個核苷酸范圍內改變。尤其是源于wzx基因(核苷酸位置是從SEQ ID NO1中的4728至5915堿基的核苷酸)和wzy基因(核苷酸位置是從SEQ ID NO1的9803至11134堿基)內的寡核苷酸對大腸桿菌O58和痢疾志賀氏菌5型都是高度特異的。
此外,有時兩個遺傳相似的編碼不同O-抗原的基因簇通過基因重組或突變產生新的O-抗原,從而產生新的細菌類型,新的突變株。在這種環境中,需要篩選出多對寡核苷酸同重組基因雜交以提高檢測的特異性。因此,本發明提供了一整套多對寡核苷酸的混合物,它們源于轉運酶基因,包括wzx基因或與wzx有相似功能的基因;源于聚合酶基因,包括wzy基因或與wzy有相似功能的基因;源于糖基轉移酶基因,包括orf6、orf9、orf11、orf12基因。這些基因的混合物對一個特殊的細菌多糖抗原來說是特異的,從而使這套寡核苷酸對這個細菌的多糖抗原是特異的。更具體地說,這些寡核苷酸的混合物是源于轉運酶基因、源于聚合酶基因和源于糖基轉移酶基因中的寡核苷酸的組合。
在另一方面,本發明涉及寡核苷酸的鑒定,它們可以用于檢測表達O-抗原的細菌和在診斷中鑒定細菌的O-抗原。
本發明涉及到一種檢測食品中的一個或多個細菌多糖抗原的方法,這些抗原可以使樣品能與以下至少一個基因的寡核苷酸特異性雜交,這些基因是(i)編碼轉運酶基因,包括wzx基因或與wzx有相似功能的基因(ii)編碼聚合酶的基因,包括wzy基因或與wzy有相似功能的基因。(iii)編碼糖基轉移酶基因,包括orf6、orf9、orf11、orf12基因。在條件許可的情況下至少一個寡核苷酸能與至少一個表達特殊的O-抗原的細菌的一個以上的那樣的基因特異性雜交,這些細菌是大腸桿菌O58和痢疾志賀氏菌5型。可用PCR方法檢測,更可以將本發明方法中的核苷酸標記后作為探針通過雜交反應如southern-blot或熒光檢測,或者通過基因芯片或微陣列檢測樣品中的抗原及細菌。
本發明者考慮到以下情況當單個的特異的寡核苷酸檢測無效時,寡核苷酸的混合物能與靶區域特異性雜交以檢測樣品。因此本發明提供了一套寡核苷酸用于本發明所述的檢測方法。這里所說的寡核苷酸是指源于編碼轉運酶基因包括wzx基因或與wzx有相似功能的基因、編碼聚合酶的基因包括wzy基因或與wzy有相似功能的基因的寡核苷酸和編碼糖基轉移酶基因包括orf6、orf9、orf11、orf12基因的寡核苷酸。這套寡核苷酸對一個特殊的細菌的O-抗原來說是特異的,這一特殊的細菌O-抗原是由大腸桿菌O58和痢疾志賀氏菌5型表達的。
另一方面,本發明涉及到一種檢測排泄物中的一個或多個細菌多糖抗原的方法,這些抗原可以使樣品能與以下至少一個基因的寡核苷酸特異性雜交,這些基因是(i)編碼轉運酶的基因,包括wzx基因或與wzx有相似功能的基因(ii)編碼聚合酶的基因,包括wzy基因或與wzy有相似功能的基因(iii)編碼糖基轉移酶基因,包括orf6、orf9、orf11、orf12基因。在條件許可的情況下至少一個寡核苷酸能與至少一個表達特殊的O-抗原的細菌的一個以上的那樣的基因特異性雜交。這些細菌是大腸桿菌O58和痢疾志賀氏菌5型。可用本發明中的寡核苷酸作引物通過PCR的方法檢測樣品,也可將本發明中的寡核苷酸分子標記后作為探針通過雜交反應如southern-blot或熒光檢測,或者通過基因芯片或微陣列檢測樣品中的抗原及細菌。
一般一對寡核苷酸可能與同樣的基因雜交也可與不同的基因雜交,但它們中必須有一個寡核苷酸能特異性雜交到特殊抗原型的特異序列上,另一個寡核苷酸可雜交于非特異性區域。因此,當特殊的多糖抗原基因簇中的寡核苷酸被重新組合時,至少能選出一對寡核苷酸與多糖抗原基因簇中特異基因混合物雜交,或者選出多對寡核苷酸與特異基因的混合物雜交。甚至即使當一個特殊的基因簇中所有基因都獨一無二時,此方法也能應用于識別此基因簇內的基因混合物的核苷酸分子。因此本發明提供了一整套用于檢測本發明方法的多對寡核苷酸,在這里多對寡核苷酸是源于編碼轉運酶的基因包括wzx基因或與wzx有相似功能的基因;源于編碼聚合酶的基因包括wzy基因或與wzy有相似功能的基因;源于編碼糖基轉移酶的基因包括orf6、orf9、orf11、orf12基因。這套寡核苷酸對一個特殊的細菌多糖來說是特異的,這套寡核苷酸可能是糖合成中必須基因的核苷酸。
另一方面,本發明也涉及到一種檢測源于病人的樣品中的一個或多個細菌多糖抗原的方法。樣品中的一個或多個細菌多糖抗原可以使樣品能與以下至少一個基因中的一對寡核苷酸中的一個特異性雜交,這些基因是(i)編碼轉運酶的基因,包括wzx基因或與wzx有相似功能的基因(ii)編碼聚合酶的基因,包括wzy基因或與wzy有相似功能的基因(iii)編碼糖基轉移酶基因,包括orf6、orf9、orf11、orf12基因。在條件許可的情況下至少一個寡核苷酸能與樣品中的至少一個表達特殊的O-抗原的細菌的一個以上的那樣的基因特異性雜交,這些細菌是大腸桿菌O58和痢疾志賀氏菌5型。可用本發明中的寡核苷酸作引物通過PCR的方法檢測樣品,也可將本發明中的寡核苷酸標記后作為探針通過雜交反應,或者通過基因芯片或微陣列檢測樣品中的抗原及細菌。
更詳細地說,以上描述的方法可以理解為當寡核苷酸對被使用時,其中的一個寡核苷酸分子能雜交到一個并不是來源于wzx基因或與wzx有相似功能的基因及wzy基因或與wzy有相似功能的基因和糖基轉移酶基因包括orf6、orf9、orf11、orf12基因的序列上。此外,當兩個寡核苷酸都能雜交上時,它們可能雜交于同一基因也可能雜交到不同基因上。也即,當交叉反應出現問題時,可選擇寡核苷酸的混合物來檢測混合的基因以提供檢測的特異性。
本發明者相信本發明不必限于以上所提的核苷酸序列編碼的特定的O-抗原,而且廣泛應用于檢測所有表達O-抗原和鑒定O-抗原的細菌。由于O-抗原合成和其他多糖抗原(如細菌胞外抗原)合成之間的相似性,本發明的方法和分子也應用于這些其他的多糖抗原。
本發明首次公開了大腸桿菌O58和痢疾志賀氏菌5型的O-抗原基因簇的全長序列,而且可從這個未被克隆的全長基因簇的序列中產生重組分子,通過插入表達可產生表達大腸桿菌O58和痢疾志賀氏菌5型的O-抗原,并成為有用的疫苗。
具體實施例方式下面結合具體實施例,進一步闡述本發明。應理解這些實施例僅用于說明本發明而不用于限制本發明的范圍。下列實施例中未注明具體條件的實驗方法,通常按照常規條件如Sambrook等人,分子克隆實驗室手冊(NewYorkCold Spring Harbor Laboratory Press,1989)中所述的條件。
實施例1基因組的提取。
在5mL的LB培養基中37℃過夜培養大腸桿菌O58和痢疾志賀氏菌5型,離心收集細胞。用500ul 50mM Tris-HCl(pH8.0)和10ul 0.4M EDTA重懸細胞,37℃溫育20分鐘,然后加入10ul 10mg/ml的溶菌酶繼續保溫20分鐘。之后加入3ul 20mg/ml的蛋白酶K、15ul 10%SDS,50℃溫育2小時,再加入3ul 10mg/ml的RNase,65℃溫育30分鐘。加等體積酚抽提混合物,取上清液,再用等體積的酚∶氯仿∶異戊醇(2 5∶24∶1)溶液抽提兩次,取上清液,再用等體積的乙醚抽提以除去殘余的酚。上清液用2倍體積乙醇沉淀DNA,用玻璃絲卷出DNA并用70%乙醇洗DNA,最后將DNA重懸于30ul TE中。基因組DNA通過0.4%的瓊脂糖凝膠電泳檢測。
實施例2通過PCR擴增大腸桿菌O58和痢疾志賀氏菌5型中O-抗原基因簇。
以大腸桿菌O58和痢疾志賀氏菌5型的基因組為模板通過Long PCR擴增其O-抗原基因簇。首先根據經常發現于O-抗原基因簇上游的galF基因設計上游引物(5’ATT GTG GCT GCA GGG ATC AAA GAA ATC-3’),再根據O-抗原基因簇下游的gnd基因設計下游引物(5’-TAG TCG CGC TGN GCC TGG ATTAAG TTC GC-3’)。用Boehringer Mannheim公司的Expand Long Template PCR方法擴增O-抗原基因簇,PCR反應程序如下在94℃預變性2分鐘;然后94℃變性10秒,61℃退火30秒,68℃延伸15分鐘,這樣進行30個循環;最后,在68℃繼續延伸7分鐘,得到PCR產物,用0.8%的瓊脂糖凝膠電泳檢測PCR產物的大小及其特異性。合并6管long PCR產物,并用Promega公司的Wizard PCR Preps純化試劑盒純化PCR產物。
實施例3構建O-抗原基因簇文庫。
首先是連接產物的獲得用被修改的Novagen DNaseI shot gun法構建O-抗原基因簇文庫。反應體系是300ng PCR純化產物,0.9ul 0.1M MnCl2,1ul 1∶2000稀釋的1mg/ml的DNaseI,反應在室溫中進行。酶切10分鐘使DNA片段大小集中在1kb-3kb之間,而后加入2ul 0.1M EDTA終止反應。合并4管同樣的反應體系,用等體積的酚抽提一次,用等體積的酚∶氯仿∶異戊醇(25∶24∶1)混合溶液抽提一次,再用等體積的乙醚抽提一次后,用2.5倍體積的無水乙醇沉淀DNA,并用70%乙醇洗沉淀,最后重懸于18ul水中。隨后在此混合物中加入2.5ul dNTP(1mMdCTP,1mMdGTP,1mMdTTP,10mMdATP),1.25ul 100mM DTT和5單位的T4DNA聚合酶,11℃反應30分鐘,將酶切產物補成平端,75℃終止反應后,加入5單位的Tth DNA聚合酶及其相應的緩沖液并將體系擴大為80ul,70℃反應20分鐘,使DNA的3′端加dA尾。此混合物經等體積氯仿∶異戊醇(24∶1)混合溶液抽提和等體積乙醚抽提后與Promega公司的3×103的pGEM-T-Easy載體于16℃連接24小時,總體積為90ul。其中有9ul的10×buffer和25單位的T4DNA連接酶。最后用1/10體積的3M NaAc(pH5.2)和2倍體積的無水乙醇沉淀連接混合物,再用70%乙醇洗沉淀,干燥后溶于30ul水中得到連接產物。
其次是感受態細胞的制備參照Bio-Rad公司提供的方法制備感受態細胞大腸桿菌DH5α。取一環大腸桿菌DH5α單菌落于5ml的LB培養基中,180rpm培養10小時后,取2ml培養物轉接到200ml的LB培養基中,37℃ 250rpm劇烈振蕩培養到OD600 0.5左右,然后冰浴冷卻20分鐘,于4℃ 4000rpm離心15分鐘。傾盡上清液,用冷的冰預冷的去離子滅菌水200ml吹散菌體,于4℃ 4000rpm離心15分鐘。再用冷的冰預冷的去離子滅菌水100ml吹散菌體,于4℃ 4000rpm離心15分鐘。用冷的冰預冷的10%的甘油懸浮細胞,4℃ 6000rpm離心10分鐘,棄上清液,最后沉淀用1ml冰預冷的10%的甘油懸浮細胞,即為感受態細胞。將制得的感受態細胞分裝為50ul一管,-70℃保存。
最后是電轉化感受態細胞取2-3ul連接產物與50ul感受態大腸桿菌DH5α混合后,轉到Bio-Rad公司的0.2cm的電擊杯中電擊,電壓為2.5千伏,時間為5.0毫秒-6.0毫秒。電擊后立即在杯中加入1ml的SOC培養基使菌復蘇。然后立即將菌涂在含有氨芐青霉素、X-Gal和IPTG的LB固體培養基上37℃倒置過夜培養,次日得到藍白菌落。將得到的白色菌落即白色克隆轉到含有氨芐青霉素的LB固體培養基上培養,同時從每個克隆中提取質粒并用EcoRI酶切鑒定其中的插入片段的大小,得到白色克隆群構成了大腸桿菌O58和痢疾志賀氏菌5型的O-抗原基因簇文庫。
實施例4對文庫中的克隆測序。
從文庫中挑選插入片段在1000bp以上的100個克隆由上海生物工程有限公司用ABI377型DNA自動測序儀對克隆中的插入片段單向進行測序,使序列達到80%的覆蓋率。剩余20%的序列再通過反向測序及將有些序列測通得到,最后獲得O-抗原基因簇的所有序列。
實施例5核苷酸序列的拼接及分析。
用英國劍橋MRC(Medical Research Council)分子生物學實驗室出版的Staden package軟件包的Pregap4和Gap4軟件拼接和編輯所有的序列,從而得到大腸桿菌O58和痢疾志賀氏菌5型的O-抗原基因簇的核苷酸全長序列(見序列列表)。序列的質量主要由兩個方面來保證1)對大腸桿菌O58和痢疾志賀氏菌5型的基因組作6個Long PCR反應,然后混合這些產物以產生文庫。2)對每個堿基,保證3個以上高質量的覆蓋率。在得到大腸桿菌O58和痢疾志賀氏菌5型的O-抗原基因簇的核苷酸序列后,用美國國家生物技術信息學中心(The National Center for Biotechnology Information,NCBI)的orffinder發現基因,找到14個開放的閱讀框,用blast系列軟件與GenBank中的基因比較以發現這些開放的閱讀框的功能并確定它們是什么基因,再用英國sanger中心的Artemis軟件完成基因注釋,用Clustral W軟件做DNA和蛋白質序列間的精確比對,最后得到大腸桿菌O58和痢疾志賀氏菌5型的O-抗原基因簇的結構,如表3所示。
通過檢索和比較,發現orf1編碼的蛋白與Shigella boydii的dTDP-D-葡萄糖-4,6-脫氫酶在361個氨基酸中有98%的相同性,98%的相似性。dTDP-D-葡萄糖-4,6-脫氫酶由rmlB基因編碼,高度的相同性表明orf1也是rmlB基因,命名為rmlB。Orf2編碼的蛋白與Escherichiacoli的dTDP-D-葡萄糖-4-鼠李糖還原酶在299個氨基酸中有98%的相同性,99%的相似性。dTDP-D-葡萄糖-4-鼠李糖還原酶由rmlD基因編碼,高度的相同性表明orf1也是fmlD基因,命名為rmlD。Orf3編碼的蛋白與Shigella boydii的葡萄糖-1-磷酸胸苷轉移酶在291個氨基酸中有97%的相同性,98%的相似性。葡萄糖-1-磷酸胸苷轉移酶由rmlA基因編碼,高度的相同性表明orf3也是rmlA基因,命名為rmlA。Orf4編碼的蛋白與Escherichia coli的dTDP-6-脫氧-D-葡萄糖3,5-變位酶在173個氨基酸中有88%的相同性,89%的相似性。dTDP-D-葡萄糖4,6-脫氫酶由rmlC基因編碼,較高的相同性表明orf4也是rmlC基因,命名為rmlC。這四個基因共同合成鼠李糖。blast比較表明orf5編碼的蛋白與Plesiomonas shigelloides的O-抗原轉運酶Wzx在393個氨基酸的序列中有23%的相同性,44%的相似性。并且通過Eisenberg等人的算法[Eisenberg,D,Schwarz,E.etal(1984).Analysis of membrane andsurface protein sequences with the hydrophobic momentplot.J.Mol.Biol.179125-142]發現orf5有10個潛在的穿膜區,這是Wzx蛋白的典型特征,Wzx蛋白的氨基端有一個大約40個氨基酸的保守基序,所以可以確定orf5是wzx基因,命名為wzx。Orf6編碼的蛋白與Chromobacterium violaceum的胞外多糖的乙酰基轉移酶在152個氨基酸中有44%的相同性,57%的相似性,因此推測orf6也是一個乙酰基轉移酶基因,將orf6暫命名為orf6。Orf7編碼的蛋白與Bacillusanthracis的pyruvyl-transferase在77個氨基酸中有24%的相同性,49%的相似性,推測orf7也是一個產生pyruvyl-transferase的基因,暫命名為orf7。Orf8編碼的蛋白與Methanothermobacterthermautotrophicus的輔酶F420-還原脫氫酶在399個氨基酸中有29%的相同性,48%的相似性。通過對Pfam蛋白基序數據庫的搜索,發現orf8編碼的蛋白與保守的基序PF00535的E value為3.4×e-35,因此推測orf8也是一個編碼還原脫氫酶的基因,將orf8暫命名為orf8。Orf9編碼的蛋白與Ureaplasma urealyticum的糖基轉移酶在100個氨基酸中有28%的相同性,31%的相似性,推測orf9也編碼一個糖基轉移酶,將orf9暫命名為orf9。Orf10編碼的蛋白與Vibrio cholerae的O-抗原聚合酶在198個氨基酸的序列中有30%的相同性,43%的相似性。并且通過Eisenberg等人的算法[Eisenberg,D,Schwarz,E.etal(1984).Analysis of membrane andsurface protein sequences with the hydrophobic momentplot.J.Mol.Biol.179125-142]發現orf10編碼的蛋白有11個潛在的穿膜區,它與許多Wzy蛋白有相似的二級結構,并且有一個大的胞質內親水環(loop),具有典型的O-抗原聚合酶的特征,所以確定orf10是wzy基因,命名為wzy。 Orf11編碼的蛋白與Escherichia coli的糖基轉移酶在335個氨基酸中有27%的相同性,48%的相似性,推測Orf11也編碼一個糖基轉移酶,將orf11暫命名為Orf11。Orf12編碼的蛋白與Bacteroides thetaiotaomicron的糖基轉移酶在369個氨基酸中有46%的相同性,65%的相似性,通過對Pfam蛋白基序數據庫的搜索,發現orf12編碼的蛋白與糖基轉移酶家族保守基序PF00535的E value為1.5×e-35,因此推測orf12也是一個糖基轉移酶基因,暫命名為orf12。rf13編碼的蛋白與Escherichia coli O157H7的manC基因編碼的mannose-1-phosphate guanyltransferase在472個氨基酸中有70%的相同性,86%的相似性,高度的相同性表明orf13也是一個manC基因,因此將orf13命名為manC。Orf14編碼的蛋白與Escherichia coli的manB基因編碼的phosphomannomutase在456個氨基酸中有99%的相同性,99%的相似性,高度的相同性表明orf14也是一個manB基因,因此將orf14命名為manB。
實施例6特異基因的篩選針對大腸桿菌O58和痢疾志賀氏菌5型的O-抗原基因簇中的wzx、wzy基因設計引物,這些基因在核苷酸序列中的位置見表1。
在表1中列出了大腸桿菌O58和痢疾志賀氏菌5型的O抗原基因簇的轉運酶基因、聚合酶基因及它們的相應的功能和大小。在每個基因內,我們各設計了兩對引物,每對引物分布在相應基因內的不同地方以確保其特異性。在表中還列出了每個引物在SEQ ID NO1中的位置和大小。以每對引物用表中所列的相應的退火溫度以表2中的所有菌的基因組為模板進行PCR,得到了相應的PCR產物,其大小也列于表中。
mdh(malate dehydrogenase)基因是存在于所有的大腸桿菌的基因組中且高度保守的一個基因,所以我們根據mdh基因設計了引物(5′-TTC ATC CTA AACTCC TTA TT-3′)和(5′-TAA TCG CAG GGG AAA GCA GG-3′),然后從166種血清型的大腸桿菌中提取基因組,方法如前所述。用這對引物從166種血清型的大腸桿菌的基因組中PCR以鑒定大腸桿菌并檢測其基因組的質量。
表2是用于篩選特異基因的166種血清型的大腸桿菌和43株志賀氏菌及它們的來源,為了檢測的方便,我們將它們每12-19個菌分為一組。它們的來源都列于表中。
在第3組中含有大腸桿菌O58,在第9組中含有痢疾志賀氏菌5型的基因組DNA作為陽性對照。第13組中是不含有大腸桿菌O58的基因組DNA,第14組中是不含有痢疾志賀氏菌5型的基因組DNA,作為陰性對照。以每組菌做模板,用表1中的每對引物按如下條件做PCR在95℃預變性2分鐘后,95℃變性15秒,退火溫度因引物的不同而不同(參照表1),退火時間是50秒,72℃延伸2分鐘,這樣進行30個循環。最后在72℃繼續延伸10分鐘,反應體系是25ul。反應完畢后,取10ulPCR產物通過0.8%瓊脂糖凝膠電泳檢測擴增出的片段。
對于wzx、wzy基因,每個基因都有兩對引物被檢測,每對引物除了在第3組中做PCR后得到了預期大小的正確的一條帶外,在其他組中都沒有擴增到任何大小正確的帶。所以wzx、wzy基因對大腸桿菌O58和痢疾志賀氏菌5型及其O-抗原都是高度特異的。
最后,通過PCR從大腸桿菌O58和痢疾志賀氏菌5型中篩選到對大腸桿菌O58和痢疾志賀氏菌5型的O-抗原高度特異的基因wzx、wzy基因。而這些基因內的任何一段10-20nt的寡核苷酸對大腸桿菌O58和痢疾志賀氏菌5型的O-抗原是特異的,尤其是上述每個基因中的引物即寡核苷酸對經PCR檢測后證實對大腸桿菌O58和痢疾志賀氏菌5型是高度特異的。所有的這些寡核苷酸都可用于快速準確地檢測人體和環境中的大腸桿菌O58和痢疾志賀氏菌5型,并能鑒定它們的O-抗原。
實施例7引物靈敏度的檢測。
購買市場上的生豬肉餡,攪拌均勻,分成20g一份,存在-40℃冰箱中備用。將10μl大腸桿菌O58和痢疾志賀氏菌5型的凍存菌液接種到有20ml LB培養基的三角瓶中,于37℃,200轉/分,培養12小時至飽和,取少量培養好的菌液作106和107倍的稀釋,其余的菌液放于4℃的冰箱中備用,取50μl稀釋菌液涂布LB瓊脂平板,37度,培養12h,對所涂平板計數,計算原液中活菌濃度。在5份生豬肉餡中分別摻入5×103,5×102,5×101,5個和0個活菌,攪拌均勻,加入200ml LB培養基,經6層紗布過濾,過濾液于37℃,200轉/分,培養12h。從培養好的菌液中取3ml菌液于6,000g離心5分鐘,去上清,加100μl MQ超純水吹開沉淀并混勻,放入100度沸水中煮15分鐘,裂解液于12,000g離心8分鐘,取1μ上清做為PCR模板。用4對寡核苷酸對,SEQ ID NO1中的4967至4984堿基的核苷酸和5336至5353堿基的核苷酸,SEQ ID NO1中的5341至5358堿基的核苷酸和5839至5856堿基的核苷酸,SEQ ID NO1中的10475至10492堿基的核苷酸和11855至10872堿基的核苷酸,SEQ ID NO1中的10110至10127堿基的核苷酸和10932至10949堿基的核苷酸,進行PCR反應,PCR反應體系如下MQ15.7μl,Mg2+2.5μl,Buffer2.5μl,dNTP1μl,Taq酶0.3μl,P11μl,P21μl,模板DNA1μl。PCR反應條件為95℃5′,95℃30″,56℃45″,72℃1′,72℃5′,共30個循環。反應結束后,取10μl反應產物電泳,若有與預期大小相符的擴增帶,則結果為陽性,若沒有,則結果為陰性。參入了5×103,5×102,5×101,和5個活菌的每份豬肉餡均在4對引物的PCR反應中得到陽性結果。參入0個活菌的豬肉餡在4對引物的PCR反應中得到陰性結果。說明使用上述方法時,這4對引物對豬肉餡中的大腸桿菌O58和痢疾志賀氏菌5型的檢測靈敏度均為0.25個菌/g。
通過對O抗原基因簇的克隆和在減毒的疫苗菌株中的表達,可以組建重組疫苗。O抗原為最主要的革蘭氏陰性菌的表面抗原,可以引起強烈的免疫反應,是制造重組疫苗的最好的靶分子之一。在1993年Viret實驗室成功的將志賀氏菌Sonnei的O抗原基因簇在一株沙門氏菌Tyziai疫苗菌中表達,動物實驗證明可以引起兔子的免疫反應(Molecular Microbiology1993,7239-252)。中國軍事醫學科學院的小組也在從事與Viret實驗室類似的工作。王磊實驗室在1999年成功的將大腸桿菌O111的O抗原基因簇在沙門氏菌疫苗STM-1中表達,并證明組建成的菌株可以引起小鼠的血液和體液反應(Microbial Pathogenesis 1999,2755-59)。所以本發明大腸桿菌O58和痢疾志賀氏菌5型的O抗原特異基因序列可以應用于組建重組疫苗。
根據本發明的對大腸桿菌O58和痢疾志賀氏菌5型的O-抗原特異的核苷酸序列(SEQ ID NO1所示),構造特異核酸探針,將其固定到芯片的載體上制成生物芯片,將要檢測的樣品適當處理后,與生物芯片進行雜交反應,然后利用生物芯片信號分析設備就可以得到樣品中相應的細菌情況。這種大腸桿菌O抗原鑒定的DNA芯片將可以直接用于臨床和其它檢驗場所(如食品加工和生產行業,畜牧獸醫行業海關檢疫等的微生物檢驗)。這種芯片只需要擴大產量,在完全相同的條件下就可以產業化。
表3是大腸桿菌O58和痢疾志賀氏菌5型的O-抗原基因簇的結構表。在表中列出了大腸桿菌O58和痢疾志賀氏菌5型的O-抗原基因簇的結構,它們的結構是完全一樣的,共由14個基因組成,每個基因用方框表示,并在方框內寫入基因的名稱。在O-抗原基因簇的兩端是galF基因和gnd基因,它們不屬于O-抗原基因簇,我們只是用它們的一段序列設計引物來擴增O-抗原基因簇的全長序列。
表4是大腸桿菌O58和痢疾志賀氏菌5型的O-抗原基因簇中的基因的位置表,在表中列出了大腸桿菌O58和痢疾志賀氏菌5型的O-抗原基因簇中的所有開放閱讀框在全序列中的準確位置,在每個開放閱讀框的起始密碼子和終止密碼子的下面劃線。在細菌中開放閱讀框的起始密碼子有兩個ATG和GTG。
序列列表SEQUENCE LISTING<110> 天津生物芯片技術有限責任公司<120> 對大腸桿菌O58和痢疾志賀氏菌5型的O-抗原特異的核苷酸<160> 1
<170> PatentIn version 3.1<210> 1<211> 17769<212> DNA<213> Escherichia coli and shigella<400> 1attgtggctg cagggatcaa agaaatcctc ctggtaactc acgcgtccaa gaacgcggtc 60gaaaaccact tcgacacctc ttatgaatta gaatctctcc ttgagcagcg cgtgaagcgt120caactgcttg cggaagtgca gtccatctgt ccaccgggcg tgaccattat gaacgtgcgt180cagggcgaac ctttaggttt gggccgctcc attttatgtg cacgacctgc cattggtgac240aacccatttg tcgtggtgct gccagacgtt gtgatcgatg acgccagcgc cgacccgctg300cgctacaacc ttgctgccat gattgcgcgc ttcaacgaaa cgggccgcag ccaggtgctg360gcaaaacgta tgccgggtga cctctctgaa tactctgtca tccagaccaa agagccgctg420gatcgtgagg gtaaagtcag ccgcattgtt gaatttattg aaaaaccaga tcagccgcag480acgctggact cagacatcat ggccgttggt cgctatgtgc tttctgcaga tatttggccg540gaacttgaac gcactcagcc tggtgcatgg gggcgtattc agctgactga tgctattgcc600gaactggcta aaaaacagtc tgttgatgca atgctgatga caggcgacag ctacgactgc660ggtaaaaaaa tgggctatat acaggcgttt gtgaagtatg gactgcgtaa cctaaaagaa720ggggcgaagt tccggaaagg gattgagaag ctgttaagcg aataatgaaa atctgaccgg780atgtaacggt tgataagaaa attataacgg cagtgaagat tcgtggcgaa agtaatttgt840tgcgaatctt cctgccgttg ttttatataa acaatcagaa taacaatgag ttagcaatag900gattttagtc aaagttttcc aggattttcc ttgtttccag agtggattgg taagacaatt960agcgtttgaa tttttcgggt ttagcgcgag taggtaatgc tcgtcacatc gtcggcatgc 1020a tcaaactgag agccgcttat ttcacagcat gctctgaagt aatatggaat aataaagtga 1140a g a g t a c g t
t tc a c a agaaaaatag cttccgtttt catcatattt ctactgacga agtctatggt gatttgcctc1560a c ttc aa t c actttccgga aaaattgatt ccactagtaa ttcttaatgc tctggaaggt aaggcattac1800ctatttatgg caaaggggat caaattcgtg actggctgta tgttgaagat catgcgcgtg1860cgttatatac cgtcgtaacc gaaggtaaag cgggtgaaac ttataacatt ggtggacaca1920acgaaaagaa aaacatcgat gtagtgctca ctatttgtga tttgttggat gagattgtac1980cgaaagagaa atcttaccgc gagcaaatta cttatgttgc cgatcgcccg ggacacgatc2040gccgttatgc gattgatgca gagaagatta gccgcgaatt gggctggaaa ccgcaggaaa2100cgtttgagag cgggattcgt aaaacggtgg aatggtacct gtccaataca aaatgggttg2160ataatgtgaa aagtggtgac tatcaatcgt ggattgaaca gaactatgag ggccgccagt2220aatgaatatc ctcctttttg gcaaaacagg gcaggtaggt tgggaactac agcgtgctct2280ggcacctctg ggtaatttga ttgctcttga tgttcactcc actgattact gtggtgattt2340tagtaatcct gaaggtgtag ctgaaaccgt aagaagcatt cggcctgata ttattgtcaa2400cgcagccgct cacaccgcag tagacaaagc agaatcagaa ccggagtttg cacaattact2460taacgcaaca agtgtcgaag cgattgcgaa agcagcaaat gaagttggag cttgggttat2520ccattactcg actgattacg tcttccctgg aaatggcgac atgccatggc tggagacgga2580g agagcattgt gcgaagcacc taattttccg tacaagctgg gtctatgcag gtaaaggaaa2700taacttcgcc aaaacgatgt tgcgtctggc aaaagagcgt gaagaattag ccgttattaa2760tgatcagttt ggtgcgccaa caggtgctga actgctggct gattgtacgg cacatgcaat2820tcgtgtggca ctgaataaac cagaagtcgc aggcttgtat catctggtag ccagtggtac2880
cacaacctgg cacgattatg ctgcgctggt ttttgaagag gcgcgcaaag caggcattcc2940ccttgcactc aacaagctca atgcagtacc aacaacagcc tatcctacac cagcccgtcg3000cccccataac tctcgcctta atacagaaaa atttcagcag aactttgcgc ttgtcttgcc3060tgactggcag gttggtgtga aacgaatgct caacgaatta tttacgacta cagcaattta3120c gaaaacgcgt aaaggtacta ttttagcggg tggttctggt actcgtcttt atcctgtgac3240tatggctgtc agtaaacagc tattacctat ttatgataag ccgatgatct attacccgct3300ttctacactg atgttagcgg gtattcgcga tattctgatt atcagtacgc cgcaggatac3360tcctcgtttt caacaactgc tgggtgacgg gagccagtgg gggctaaatc ttcagtataa3420agtgcaaccg agtccagatg gtcttgcgca ggcatttatc atcggtgaag agtttatcgg3480tggtgatgat cgtgctttgg ttcttggtga taatatcttc tacggtcatg atctgccgaa3540gttaatggat gtcgctgtta acaaagaaag tggtgcaacg gtatttgcct atcacgttaa3600tgatcctgaa cgctacggtg tcgttgagtt tgataaaaat ggtacggcga tcagcctgga3660agaaaaaccg ctacaaccaa aaagtaatta tgcggtaacc gggctttatt tctatgataa3720t cgatattaac cgtatttata tggaacaggg gcgtttatct gttgccatga tgggccgtgg3840ttatgcatgg ctggacacgg ggacacatca aagcctgatt gaggcaagca acttcattgc3900aacaattgaa gaacgtcagg ggctgaaagt ttcctgcccg gaagaaattg cttaccgtaa3960agggtttatt gatgctgaga aggtgaaagt attagctgaa ccgctgaaaa aaaatgctta4020tggtcagtat ctgctgaaaa tgattaaagg ttagtaataa aatgaacgtt attaaaacag4080aaattccaga cgtattaatt ttcgaaccga aaatttttgg tgacgagcgc ggtttctttt4140tcgagagctt taaccagaag gtttttgagg aagctgtagg ccgcaaagtt gaatttgttc4200aggataatca ttcgaagtct tgcaaaggtg ttttacgcgg actgcattat cagttagaac4260cttatgctca aggaaaactg gtacgctgtg ttgttggtga agtttttgat gttgcggttg4320atattcgtaa atcgtcacct acctttggca aatgggtagg ggtgaattta tctgctgaga4380ataagcgcca gttatggatc ccggaggggt ttgcgcatgg gttcataacg ttgtcaaata4440
tagccgaatt tctttataaa acaacagatt tttattctcc aaaacatgag gtttgcattc4500ggtatgatga tgagagcatt ggtatacaat ggcctaaagc aactgacaag atgttgatat4560cttcaaaaga taaaaaaggt ttggatttta cttctttaat gtgagttatt atatgctaat4620tttatatcta ttaatttctt cgcatgcatc tgaaaattta ttatagctgg ctcaatggac4680attacattga tttctattaa tggatggttt tactcaaagt aaatataatg aaaataaatg4740a tcttatcgca ttcaataaat aatgctgaat atagcattat tgtaacatcg attttttttg4860cccagttact ctccgttttt gttgatggtg ggatcaataa tgaagttctc tcactaacta4920ataagtcatt agataacgat attgatggat atcagaaact atcaatgaat ggagcagtta4980ggctagttgt tcatttgttt ttttcttttg tgttatcaac ttattttatg tttgctgatg5040t tagaaacata ctctataaaa ttaaaaacag aatataaata tattgaggat tttattttaa5160atattttttg cagtctgttt gttattttat catctttttt tatttacata tttcctcaat5220gtcttatgtt atatcttgtt ttttttagat taatcccttt ggctatatat agaaaaccat5280tgcaagtatt taaaatgata agagaaatag attataaatt aataagggat aattatatcg5340c tttttctatt gttattattc ggtagagata tgtatgcata ttatcaacca ttgaatcggt5460tatataattc atgtataggg ttgtcggcag cagttgtatc atttgctatt ccatatgcac5520atttactgac aagtagaata aagaagatat actttttagt tttcttgttt tcatcatcag5580caattataat ttcattatca tattattttt tttctagaga tgtcgtgatg gtattctttg5640gtgaaaaatt ttctatggaa agacaatata tatttctatt tagtttattg atttttatgc5700c cactcataaa tcttactatt actattttat gcattccatt tatattaatt tctgaaacgt5820g taatgatcaa aagaggagtt ggtcatgata aataaaaccc atatcatttt tctgaagttt5940
atatgtcgtg ttctcattaa aaaaaatcaa tttgaaagtt gtatattgag acgattatat6000ataaaactat atgatattga tattggtatg tatagctatg gttgttttga ccctaaaaga6060gtgccaccta aaacaaaaat aggaagatat tgttcgtttg caccaacagc atatatattt6120ggacgaaatc atggggttga atttgtctcg ttgcatccat atttatataa ttcagagttg6180ggtttagtaa aacaagacac catagcaata acttcacgag tgatagaaga cgacgtttgg6240t gctactggag cagttgtcac tagcgacgtt cctagatatg cgattgttgc aggagttccg6360gcaaagatca tcaaatatag atttgaaccg agagtgataa atattattga aaagagtaaa6420tggtggttaa gaacgaaatc tgaattacaa aaaatgatta aattagatag tgggtttata6480tttacaccgg ggtattttga tgaaaccaat taaaatttgc ttagcatggc acaatattaa6540ttcgactaac tatggcgtta gtgctcttgc agttgcacaa gttgctcttt tagttgagtc6600tgcgagtcgt tcaaaagttg ctattgaatt ggagactttt ggtacaccgt ttgttaatga6660gttatcaatt agaaaggaag tagagcaaag atttgcagtt aaattaacac atagagattt6720ctcattaaaa aagtttattg ttgattttgc aaaacttgat ttttctggac ttagattatt6780tgacaaatac gatattgtaa tggacattgg tgagggtgac agttttacgg atatatatgg6840aattaagaga tttattacat tctcaattac aaagtattta gcgttaagag ttaaaaagaa6900actcattctt tcacctcaaa caatcggacc ttttaatagc agaatatcat atataatagc6960gcgttatttg atttcgaaat gtgattcagt tttttctcgt gactataaat ctacgaaatt7020catacatgac atgggattga attgtgaaga agtatcagat gtagcattta ctctaccata7080tgatactttg cccaagatag ataacagtat tggtatcaac atttcaggtt tgttatggaa7140tggtggttac acaggcgata atcagtttgg attgacagtt gattataagt tattcgtcaa7200agagattatt gaattattta gagttagagg gaaggaagtt catttgattg gacatgtcat7260tgcagaccat ctacctgtgg aagatgacta tcgtgtttgc aatcaaatta aagaaatgtt7320ttcattagat aatggagtaa tagtagcacc taaatttaca tcacctatcc aagctaaaac7380ttatatgagt cagttaacat tttttactgg atcacgtatg catgcaacca ttggggcact7440atctgcagga gttgtaacag tacctatagc gtatagtcga aaattctctg gagtatttgg7500
tagtttggat tatcgtttta ctttggatgc ttatacatta gataccaaaa gtttagtgac7560aaaattattt gagtattatg ataataattt tgaagaaatg caatctgcaa tgattaatgc7620aagaattaaa gcaaatcaaa gaaacgaaaa atatgttggt tatcttcagg aattattaag7680caatgaaaaa aatagcacaa gtcattgaat ctggaatgtg tgtgggttgt ggattttgca7740ctgaaaaccc caatggtatg gatattaata aagaaggata ttatagacct atttctttca7800ttgatgattc attatcacag ctagtatgcc ctggtaaatc tatttcccat aataacagta7860tggctcctta taacctttta tgggggccgg tagtgagttg tgagagtgga aatgcagttg7920acccagatat acgtcataag gggtcttctg gtggggtttt aaccgccatt gcagtttatc7980ttgttgattc tggattggtt gatgcaataa tacaggttgg tgtttcagtt gataatccaa8040tacgcaatgt aacatatata atgaagagtc aggaagatat attaaaatgt gctggctctc8100gctattcacc ttcatcacca cttagtgtca ttcgttcatt attaggtaat ggtacacggt8160acgctgttat tggtaaaccc tgtgatattg cggctatgcg cacattggtt aatagtcggc8220aagaatttca agagcagttt ccatacctac tttcatttat gtgtgctgga gtgccaagtg8280aagaaggtac aagaaatatt cttgagcgat ggcacataaa acatgaacat ttaatctcgt8340ttcgttatcg aggagacgga tggccaggat tgacaaaagc tattactgat gatggtgaag8400agtttactat gacttataat gaatcatggg gcggtgtact taatcgctac ttacagcctc8460gttgcaaact atgtgctgac ggtattggtg aagctgctga tattgtatgt gcagacgctt8520ggtattctac tactaacggc tatcctagtt ttatagagaa ggagggacgt agtttaacaa8580ttgctcgtac acttaaaggc cgtcaattgt tggatcttgc tttaaataaa aatgtaatat8640cacttacacc ttttaatatt tctgatcttg agaaaattca accataccaa gctaatcgta8700aacagacggc aaatgttcgt cgctgggctg ttatgcttct ggggggaagt gtgccgaatt8760ttaaaggtta tagtcttaat aaattaatgt ttagagcccc aataaaaatt actttaaagg8820cattttttgg tacattgata agaaaaatga agggacgtat ttgaaaacta attatatatt8880a ttattaaacg tgttgaataa caatatggta ttttaaatga ttaaagtaaa tgttattgtt9000
gcactttatt atccaaatta ctatcagagg gttagggaag agattatttc ttttctgcag 9060ggatttgatt attttatagt gtttgtggac aataatagaa cggtcaaacc aaatatagag 9120aataataaaa atgtaacgtg gataataggg agtaatattg gtggtgaatt ttctgcttgg 9180gatgaaggtt atgacctcct ggttaatatg aaaaatccgt cagatgatga aattatagtt 9240tttattaatg atacattttg tcatcaccat ttttttacat gtttcgatag gtatttatat 9300aggaaagcaa tatctacatg tgaagataat aacatttatg gtgatgttaa cagtataggc 9360gaatttttta gtgtttatga tcggcatttt tcatcttggg tatcttctta tttttttcta 9420ggtagaaaaa aaaacattga taaactttta cctcttaata aacaaagtgg tatggacgca 9480gaatatatga gatatcttag taatgcattg gtatctaagc gcgttgatgt tcctatcttt 9540tcggataaat tgaatcagca tctcacgaat tggttatttc cagttaatag caagggatgg 9600tatggcgcaa gaaacgtatc acagcaactt attctgttta aactgaatgc aataattaat 9660gaaaaattgc tcacttataa tataattgaa catgatcttt tattaacaaa tatttatcat 9720ggaaaaataa gaacgcttta caattctatg cgtaacaagc tatatttttt ttgcaaaaat 9780aataagttga tagggtgata taatgtatgc aaataaagca atgcccaaaa gacatacgag 9840agaaagagtg tttttaccac tattactttc gatgattttc atttgcatga taataaatga 9900tttgccacta caacaatatc ttggaacttt aggtgcaagt cctatgtggg ggggggcatt 9960atttattttt atgttgattg ttattcgtag ccgctttgtt ttaaatcttg attctaccag10020taaatatttt ctctattttt acctattaac atttactata tcgcttttac aatgtttcta10080ttatgccatc tctagaggtt ctgtagaaaa cgagtatggt ggattgattt ttggtaagct10140tgtatttgct tcgacgtatt atatcgttta tttttttact atatacactg ccattttttt10200ggctagaaga ataacatcct ctgctcttaa attttgtatc ataaatgctt ctgttttgtt10260gcttcttctt cttattttgg agtttttttc gccaaactca ttgagtttat ttcataaaag10320tatggatggc tatggctttg gatttagaca aaggttattg tcccctgaac catcaatggc10380tgcgtttact ttaaatattt tcttgttgat aagcatagta ctggttaact caaagatcgc10440taaactattt atgggaggtg cgcttgtagt aggcaaccta tttattggct ctaaagcttc10500gctcatatta attttgatga gtggtgttat tgtgttttat cttaatatga acttaaccca10560
aaaaataaaa tcgttactta tattaattcc tgtatcaatt gcagtttttt atgtgttttt10620aaatacgatt cttccagcac tgattgtaga tgtagataaa ttcacaagtg ttagcactcg10680tttaataaca gcccttgcgg ctctgctgag tttaatatac tatccattgg gtgagggcta10740tggtacctat agttcttatc ttttgggacc tcttgattta gctgttcaat tagcagaaga10800actattgcct tttacattaa atgtaagcga ggtcaataaa atgctaatga ctggtgagtc10860gttagcagca aagtcaggta ttcttttttc tgttatccag agtggagtcg tttccctcat10920atttttttac gtgatttatc gaaatgcgtt tagaaaactc tgtgctgcca ggctatctaa10980ttataacaag ataatgatgc ggttggttct atggtattca ttgttatcaa tcatgtttgc11040tgttaatatt gaagttgtct atgctttttt attgccgttt attataattg atcattatgc11100tataaattat atgcgatctt atgattatga ataaaatttt atatatctcg ctctctcttg11160atgagaaaaa ctatggtggc agcatcgtgt ctagaaataa tttaaaagca ttgagggcac11220ttgaagatag tgaggtgaag gaagttgcaa tagttaagaa attaaaaggg atatatgaat11280atgaactaca aactaatgtg tcaaaagtaa aaatagccat agataacctg aagggatatg11340ctggacggtt aaatcgcgat tgtttattga aaattaaaaa tattataaaa gtctttgagc11400c tatctacaga cataaaagtt attacatttt ttcataatgt cgagattgat tttgaattag11520aaagattgaa gtcaggggga atattgtact tgccttctct tttgccatct tatttagcgg11580aaaaaaaagc tataaaatat agtgatataa taatttcact tcataaaaat gatagtgcta11640ggcttaagtg catatatgga cgttcgtctg atttttgtgt cccagtttgt atagaagatg11700acttgagtaa cgaggtaata ttacataaaa ataatagtac agatagtata tttagagttg11760gttttattgg aactgcattt ttcgcgaata ttaaagctgc agagttcatt tcgaaaaaat11820tatcacctag gtttttgaat aataaacaaa tagaatttat tattgcgggt aatggtttcg11880g ttgaagactt ttataatgaa gttgatgtta taatatctcc cgtcctgacg ggagcaggca12000tgaaagtgaa aatagcggaa gcgattaaat ataataagaa ggtaattgcc tcgtcatttt12060
cattaattgg atatgagact atgttaaata gtcaaaatat tttttcttgc attactctag12120atgattatgc gatagcaatt aaaaagttga gcacacatcc tatgactcac tctgatactc12180gtgaatatta tttgaaattt ttctcaagtc aagcatgtat taactatttt aaatatattt12240tgaactccta atagttaaaa tgctacttct atgtgtgttt attgtgttga gttttttgtt12300ttactgcttt tatgtagtag aggatgatgc tgatgaaggt attgcaagtt agtaagtttt12360acccacctgt acatggagga attgagcaag tcgcgtttga tatcagtgaa ggcatgtttg12420aagaacatat acaggctgtt gatattttat gtgtagatcc attgggacct cgtattgatg12480ataggaatta taaatatcga gtttttcgac aaaagacttt tattgttcta ttttccactc12540cgatttcaat atcatttata aataaatggc gaaaaataaa agataattat gatattatcc12600acgtacattt acctaaccct ttagctgttc tcgctatata tctttttcct ccaaaaggta12660aaattgtatt acattggcat agtgatattg ttaagcaaaa aaaattattc agattatttt12720tacctttaca aagatggatt ttggataggt gcacttatat aattgtgact agtccagtgt12780atggtcaatc atctccatcg ctgcaacaat atcaaaataa attaatttgt attcctatag12840gtgtagatac cagtgttatg cctgttgacc tacaagaaga aaaattaatt aaaagtaagt12900ataaagataa aaaaataata ttttcattag ggcgattggt ttattataaa ggtatggata12960ttttaattga ttcagcgaaa tatttacctg atgattacat catattaatt gggggggggg13020gcgcattatt aaaaaaatta aggaggcaga tttatgataa taacttatca cacaaggttg13080ttgttttggg aagtatagat tataaatgct tagcttcata ttataaatgc tgtgatgtat13140tttgtctccc atctatacat gagtctgaag cgtttggtgt ggtacaatta gaagcaatga13200gtttttcaaa gccattagtt tctacgaata tcccccgaag tggtgttcca tgggttaacg13260aaaatggaac atcaggaatt gttgttgagc caaggagtgc tatagctctt gctgaaggga13320ttgttaaaac tattgctaat agtgaaaaat tcagtaaagg agcaaaagat agatttgata13380tgctctttac taagagatta atggttaata atgtatacaa attatattta agtataaagt13440gagtcaaaat atgtctttac ttcctgttat cattgctggt ggtaccggta gtcgtttgtg13500gcctttatca cgagttaagc atccaaagca atttctccat ttaggggatg atggaacaat13560gttacagacg acattaaatc gtcttcaagg gttaaagtgt gataacccaa ttgtaatttg13620
caatgagcag catagattta tagttgctga gcaacttcga caattaaata aactcactca13680gaatattatt cttgagcccg tcggccggaa tactgcacca gctgtaactc tcgctgcact13740gaatgcaata cgtaataagt caaaacaatc aaaattaatt ttggttcttg cagctgatca13800tattataaaa gacgaagatg cattttgtag aagtgtgctg agtgctattc catatgcaaa13860caaaggaaaa ttaatcacat ttggtatagt gcctaatagt cccgaaacag gctatggata13920tataaaaaga ggtcatttat gtagtggcaa taatgctaat ttagcttttg aagtggctga13980gttcgttgaa aaacctaaca tagatacagc tcaagagttt ctttcatctg gtaactatta14040ttggaatagt ggtatgtttt tatttcgagc tgataggtat ttagatgaat taaaaaaata14100tagaccagac atacttgagg cctgtaaaaa atcaatgatt gaacttaatg gagatcttga14160ttttattcgt atcaataaag atgctttttg cgcttgccca gatgagtcaa ttgattatgc14220cgttatggag aaaacgaatg atgcggttgt tatcccaatg gatgctggct ggagtgatgt14280ggggtcatgg tcatctttat gggaaatgag taataaaacc attgaagaaa atgtaatagt14340gg tgctacagtt ggggtaaaag atcttgttgt tgttcaaaca aaagatgctg tgttagtagc14460taataggaat tcagttcaga atgtaaaaaa aattgtcgaa aggcttaaat cagaaaatcg14520tagtgaagtt tttacgcatc ttgaagttta tcgtccttgg ggtaaatatg agtctatcga14580taatggtgaa cgctatgaag ttaaacgaat ttccgtaaaa cctggagagg ggatttcatt14640gcaaatgcat caccatcgtt ctgaacattg gataatagtt tcgggtactg caaaagtaac14700aatttgtgat gaaacaagaa ttctcagtga aaatgaatct atttatatac ctgtcggggc14760gaaacattgt ttagagaatc cgggaaaaat tatgttggag cttatagaag ttcgctccgg14820ctcctatcta ggagaagatg atgtcatccg ttttgccgac agatatggaa gaacataaat14880gcacaataag atcatcctag ataaattaac ttgctttaaa gcctacgata ttcgcggaaa14940c tctcaaaccg aaaaccattg tgttaggcgg cgatgtccgc ctcaccagcg aaaccttaaa15060actggcgctg gcgaaaggtt tacaggatgc gggcgtcgat gtgctggata tcggcatgtc15120
cggcaccgaa gagatttatt tcgccacgtt ccatctcggc gtggatggcg gcattgaagt15180taccgccagc cataatccga tggattataa cggcatgaag ctggtgcgcg aaggggctcg15240cccgatcagc ggcgataccg gactgcgcga cgtccagcgt ctggcagaag ccaacgactt15300tcctcccgtc gatgaaacca aacgcggtcg ctatcagcaa atcaatctgc gtgacgctta15360cgttgatcac ctgttcggtt atatcaacgt caaaaacctc acgccgctca agctggtgat15420taactccggg aacggcgcgg cgggtccggt ggtggacgcc attgaagccc gctttaaagc15480cctcggcgca cctgtggaat taatcaaagt acacaacacg ccggacggca atttccccaa15540cggtattcct aacccgctgc tgccggaatg ccgcgacgac acccgcaatg cagtcatcaa15600acacggcgcg gatatgggca ttgcctttga tggcgatttt gaccgctgtt tcctgtttga15660tgaaaaaggg cagtttatcg agggctacta cattgtcggt cttctggcag aagcgttcct15720cgaaaaaaat cccggcgcga agatcatcca cgatccacgt ctctcctgga acaccgttga15780tgtggtgacc gccgcgggcg gcactccggt gatgtcgaaa accggacacg cctttattaa15840agaacgtatg cgcaaggaag acgccatcta cggtggcgaa atgagcgccc accactattt15900ccgtgatttc gcttactgcg acagcggcat gatcccgtgg ctgctggtcg ccgaactggt15960gtgtctgaaa ggaaaaacgc tgggcgaact ggtgcgcgac cggatggcgg cgtttccggc16020aagcggtgag atcaacagca aactggcgca ccccgttgag gcgattaatc gcgtcgaaca16080gcattttagc cgtgaggcgc tggcggtgga tcgcaccgat ggcatcagca tgacctttgc16140cgactggcgc tttaacctgc gctcctccaa caccgaaccg gtggtgcggt tgaatgtgga16200atcgcgcggt gatgtaccgc tgatggaaga aaagacaaaa cttatccttg agttactgaa16260caagtaattc agtaatttca tataaatggg ttttaaaaaa cggaaaagat gagatatccg16320gtgtggtata gccaaggtaa tgctattcag tatctctatg agtgagttaa catctatacc16380acatttaagc cgcacacttg gcggtaacca cccctgacag gagtaaacaa tgtcaaagca16440acagatcggc gtcgtcggta tggcagtgat gggacgcaac ctcgcgctca acatcgaaag16500ccgtggttat accgtctcta ttttcaaccg ttcccgtgat aagacggaag aaattattgc16560cgaaaatcca ggcaagaaac tggttcctta ctatacggtg aaagaattcg ttgaatctct16620tgaaacgcct cgtcgcatcc tgttaatggt gaaagcaggt gcaggcacgg atgctgctat16680
tgattccctt aagccatacc tcgataaagg tgacatcatc attgatggtg gtaatacctt 16740cttccaggac accattcgtc gtaaccgtga gctttctgcc gaaggtttta acttcatcgg 16800taccggtgtt tccggcggtg aagagggggc gctgaaaggg ccttccatca tgcctggtgg 16860ccagaaagaa gcctatgaac tggttgcgcc gatcctgacc aaaatcgccg ccgttgctga 16920agatggcgaa ccgtgcgtta cctatatcgg tgccgatggc gcgggtcact atgtgaagat 16980ggttcacaac ggtattgaat acggtgatat gcaactgatt gctgaagcct attctctcct 17040gaaaggcggc ctgaatctct ctaacgaaga actggcacag acctttaccg agtggaataa 17100cggtgaactg agcagctacc tgatcgacat caccaaagat atcttcacca aaaaagatga 17160agacggtaac tatctggttg atgtgatcct ggatgaagcg gctaacaaag gtaccggtaa 17220atggaccagc cagagcgcgc tggatctcgg cgaaccgctg tcgttgatta ctgagtcagt 17280gtttgcacgt tatatctcgt ctctgaaaga tcagcgcgtg gccgcgtcta aagttctctc 17340tggtccgcaa gcacagccag ctggcgataa agctgagttc atcgagaaag ttcgtcgtgc 17400c tgaagagtac aactgggatc tgaactacgg cgaaatcgcg aagattttcc gtgctggctg 17520t t cgctaacctg ctgctggctc cgtacttcaa gcaaattgcc gatgactacc agcaggcgct 17640gcgtgatgtc gttgcttatg cagtacagaa cggtatcccg gttccgacct tcgctgctgc 17700ggttgcctat tatgacagct accgtgccgc tgttctgcct gcgaacctga ttcaggccca 17760gcgtgacta 17769序列列表中是大腸桿菌O58的O抗原基因簇的核苷酸序列,痢疾志賀氏菌5型的O抗原基因簇的核苷酸序列與大腸桿菌O58的O抗原基因簇的核苷酸序列有99.76%是一樣的,不一樣的堿基用方框表示,在這個堿基的上方是痢疾志賀氏菌5型的核苷酸。
表1大腸桿菌O58和痢疾志賀氏菌5型的O抗原基因簇中wzx基因、wzy基因及其中的引物及PCR數據產生正 PCR的基 基因的 正向引物位置 反向引物位置 PCR產物 確大小 退火溫功能因 堿基位置 長度 電泳帶 度的組數 (℃)wzx O-抗原 4728-5915 4967-4984 5336-5353 387bp 1* 58轉運酶5341-5358 5839-5856 516bp 1* 58wzy O-抗原 9803-11134 10475-1049211855-10872398bp 1** 58聚合酶10110-1012710932-10949840bp 1* 581*除了在第3組中產生正確大小的電泳帶外,在第9組中也產生正確大小的電泳帶。這兩組都是陽性對照組1**除了在第3組中產生正確大小的電泳帶外,在第9組中也產生正確大小的電泳帶。在第6組中有一條大小不正確的電泳帶表2 166種血清型的大腸桿菌和43株志賀氏菌及它們的來源組號 該組中含有的菌株 來源1、野生型大腸桿菌 O1,O2,O5,O7,O8,O9,O12,O13,O14,O15,O16,O17,O18, IMVSaO19ab,O20,O21,O22,O23,O242、野生型大腸桿菌 O4,O10,O25,O26,O27,O28,O29,O30,O32,O33,O34,O35, IMVSaO36,O37,O38,O40,O41,O42,O433、野生型大腸桿菌 O6,O44,O45,O46,O48,O49,O50,O51,O52,O54,O55,O56, IMVSaO57,O58,O60,O61,O62,O534、野生型大腸桿菌 O63,O65,O66,O69,O70,O71,O74,O75,O76,O77,O78, IMVSaO79,O80,O81,O82,O83,O685、野生型大腸桿菌 O84,O85,O86,O87,O88,O89,O90,O91,O92,O98,O99, IMVSaO101,O102,O103,O104,O105,O106,O97,6、野生型大腸桿菌 O107,O108,O109,O110,O111,O112ab,O112ac,O113, IMVSaO115,O116,O118,O120,O123,O125,O126,O128,O1177、野生型大腸桿菌 O129,O130,O131,O132,O133,O134,O135,O58,O137,IMVSaO138,O139,O141,O142,O143,O144,O145,O1408、野生型大腸桿菌 O146,O147,O148,O150,O152,O154,O156,O157,O158, IMVSaO159,O160,O161,O163,O164,O165,O166,O153 b9、野生型大腸桿菌 O168,O169,O170,O171,O172,O173, c痢疾志賀氏菌 D1,D2,D3,D4,D5,D6,D7,D8,D9,D10,D11,D12,D13 d10、鮑氏志賀氏菌 B1,B2,B3,B4,B6,B7,B8,B9,B10,B11,B12,B13,B14,B15, dB16,B17,B1811、福氏志賀氏菌 F1a,F1b,F2a,F2b,F3,F4a,F4b,F5(v4),F5(v7),F6, dDS,DR12、野生型大腸桿菌 O3,O11,O39,O59,O64,O73,O96,O95,O100,O114,O151,O155, IMVSaO124,O167,O162,O121,O127,O149,O11913、野生型大腸桿菌 去除大腸桿菌O58的第3組菌14、野生型大腸桿菌 去除痢疾志賀氏菌5型的第9組菌為了檢測的方便,每12-19個菌分為一組,總共12組,第13組和第14組作為陰性對照a.Institude of Medical and Veterinary Science,Anelaide,Australiab.Statens Serum Institut,Copenhagen,Denmarkc.O172和O173來自于Statens Serum Institut,Copenhagen,Denmark,其余來自于IMVSd.中國預防醫學科學院流行病學研究所表3是大腸桿菌O58和痢疾志賀氏菌5型的O-抗原基因簇的結構表 galF rmlB rmlDrmlArmlC wzxorf7 orf8 orf9 orf10 wzy orf12 orf13 manC manB gnd1kb表4是大腸桿菌O58和痢疾志賀氏菌5型的O-抗原基因簇中的基因的位置表ATTGTGGCTG CAGGGATCAA AGAAATCCTC CTGGTAACTC ACGCGTCCAA GAACGCGGTC 60GAAAACCACT TCGACACCTC TTATGAATTA GAATCTCTCC TTGAGCAGCG CGTGAAGCGT120CAACTGCTTG CGGAAGTGCA GTCCATCTGT CCACCGGGCG TGACCATTAT GAACGTGCGT180CAGGGCGAAC CTTTAGGTTT GGGCCGCTCC ATTTTATGTG CACGACCTGC CATTGGTGAC240AACCCATTTG TCGTGGTGCT GCCAGACGTT GTGATCGATG ACGCCAGCGC CGACCCGCTG300CGCTACAACC TTGCTGCCAT GATTGCGCGC TTCAACGAAA CGGGCCGCAG CCAGGTGCTG360GCAAAACGTA TGCCGGGTGA CCTCTCTGAA TACTCTGTCA TCCAGACCAA AGAGCCGCTG420GATCGTGAGG GTAAAGTCAG CCGCATTGTT GAATTTATTG AAAAACCAGA TCAGCCGCAG480ACGCTGGACT CAGACATCAT GGCCGTTGGT CGCTATGTGC TTTCTGCAGA TATTTGGCCG540GAACTTGAAC GCACTCAGCC TGGTGCATGG GGGCGTATTC AGCTGACTGA TGCTATTGCC600GAACTGGCTA AAAAACAGTC TGTTGATGCA ATGCTGATGA CAGGCGACAG CTACGACTGC660GGTAAAAAAA TGGGCTATAT ACAGGCGTTT GTGAAGTATG GACTGCGTAA CCTAAAAGAA720GGGGCGAAGT TCCGGAAAGG GATTGAGAAG CTGTTAAGCG AATAATGAAA ATCTGACCGG780ATGTAACGGT TGATAAGAAA ATTATAACGG CAGTGAAGAT TCGTGGCGAA AGTAATTTGT840TGCGAATCTT CCTGCCGTTG TTTTATATAA ACAATCAGAA TAACAATGAG TTAGCAATAG900GATTTTAGTC AAAGTTTTCC AGGATTTTCC TTGTTTCCAG AGTGGATTGG TAAGACAATT960AGCGTTTGAA TTTTTCGGGT TTAGCGCGAG TAGGTAATGC TCGTCACATC GTCGGCATGC 1020A Orf1的起始TCAAACTGAG AGCCGCTTAT TTCACAGCAT GCTCTGAAGT AATATGGAAT AATAAAGTGA 1140A G AG T A CG T T TC A C C AGAAAAATAG CTTCCGTTTT CATCATATTT CTACTGACGA AGTCTATGGT GATTTGCCTC 1560A
CT T CA A T C ACTTTCCGGA AAAATTGATT CCACTAGTAA TTCTTAATGC TCTGGAAGGT AAGGCATTAC1800CTATTTATGG CAAAGGGGAT CAAATTCGTG ACTGGCTGTA TGTTGAAGAT CATGCGCGTG1860CGTTATATAC CGTCGTAACC GAAGGTAAAG CGGGTGAAAC TTATAACATT GGTGGACACA1920ACGAAAAGAA AAACATCGAT GTAGTGCTCA CTATTTGTGA TTTGTTGGAT GAGATTGTAC1980CGAAAGAGAA ATCTTACCGC GAGCAAATTA CTTATGTTGC CGATCGCCCG GGACACGATC2040GCCGTTATGC GATTGATGCA GAGAAGATTA GCCGCGAATT GGGCTGGAAA CCGCAGGAAA2100CGTTTGAGAG CGGGATTCGT AAAACGGTGG AATGGTACCT GTCCAATACA AAATGGGTTG2160ATAATGTGAA AAGTGGTGAC TATCAATCGT GGATTGAACA GAACTATGAG GGCCGCCAGT2220Orf2的起始Orf1的終止AATGAATATC CTCCTTTTTG GCAAAACAGG GCAGGTAGGT TGGGAACTAC AGCGTGCTCT2280GGCACCTCTG GGTAATTTGA TTGCTCTTGA TGTTCACTCC ACTGATTACT GTGGTGATTT2340TAGTAATCCT GAAGGTGTAG CTGAAACCGT AAGAAGCATT CGGCCTGATA TTATTGTCAA2400CGCAGCCGCT CACACCGCAG TAGACAAAGC AGAATCAGAA CCGGAGTTTG CACAATTACT2460TAACGCAACA AGTGTCGAAG CGATTGCGAA AGCAGCAAAT GAAGTTGGAG CTTGGGTTAT2520CCATTACTCG ACTGATTACG TCTTCCCTGG AAATGGCGAC ATGCCATGGC TGGAGACGGA2580G AGAGCATTGT GCGAAGCACC TAATTTTCCG TACAAGCTGG GTCTATGCAG GTAAAGGAAA2700TAACTTCGCC AAAACGATGT TGCGTCTGGC AAAAGAGCGT GAAGAATTAG CCGTTATTAA2760TGATCAGTTT GGTGCGCCAA CAGGTGCTGA ACTGCTGGCT GATTGTACGG CACATGCAAT2820TCGTGTGGCA CTGAATAAAC CAGAAGTCGC AGGCTTGTAT CATCTGGTAG CCAGTGGTAC2880CACAACCTGG CACGATTATG CTGCGCTGGT TTTTGAAGAG GCGCGCAAAG CAGGCATTCC2940CCTTGCACTC AACAAGCTCA ATGCAGTACC AACAACAGCC TATCCTACAC CAGCCCGTCG3000CCCCCATAAC TCTCGCCTTA ATACAGAAAA ATTTCAGCAG AACTTTGCGC TTGTCTTGCC3060Orf2的終止TGACTGGCAG GTTGGTGTGA AACGAATGCT CAACGAATTA TTTACGACTA CAGCAATTTA3120Orf3的起始 G GAAAACGCGT AAAGGTACTA TTTTAGCGGG TGGTTCTGGT ACTCGTCTTT ATCCTGTGAC3240TATGGCTGTC AGTAAACAGC TATTACCTAT TTATGATAAG CCGATGATCT ATTACCCGCT3300TTCTACACTG ATGTTAGCGG GTATTCGCGA TATTCTGATT ATCAGTACGC CGCAGGATAC3360TCCTCGTTTT CAACAACTGC TGGGTGACGG GAGCCAGTGG GGGCTAAATC TTCAGTATAA3420AGTGCAACCG AGTCCAGATG GTCTTGCGCA GGCATTTATC ATCGGTGAAG AGTTTATCGG3480TGGTGATGAT CGTGCTTTGG TTCTTGGTGA TAATATCTTC TACGGTCATG ATCTGCCGAA3540GTTAATGGAT GTCGCTGTTA ACAAAGAAAG TGGTGCAACG GTATTTGCCT ATCACGTTAA3600TGATCCTGAA CGCTACGGTG TCGTTGAGTT TGATAAAAAT GGTACGGCGA TCAGCCTGGA3660AGAAAAACCG CTACAACCAA AAAGTAATTA TGCGGTAACC GGGCTTTATT TCTATGATAA3720T CGATATTAAC CGTATTTATA TGGAACAGGG GCGTTTATCT GTTGCCATGA TGGGCCGTGG3840TTATGCATGG CTGGACACGG GGACACATCA AAGCCTGATT GAGGCAAGCA ACTTCATTGC3900
AACAATTGAA GAACGTCAGG GGCTGAAAGT TTCCTGCCCG GAAGAAATTG CTTACCGTAA3960AGGGTTTATT GATGCTGAGA AGGTGAAAGT ATTAGCTGAA CCGCTGAAAA AAAATGCTTA4020Orf3的終止Orf4的起始TGGTCAGTAT CTGCTGAAAA TGATTAAAGG TTAGTAATAA AATGAACGTT ATTAAAACAG4080AAATTCCAGA CGTATTAATT TTCGAACCGA AAATTTTTGG TGACGAGCGC GGTTTCTTTT4140TCGAGAGCTT TAACCAGAAG GTTTTTGAGG AAGCTGTAGG CCGCAAAGTT GAATTTGTTC4200AGGATAATCA TTCGAAGTCT TGCAAAGGTG TTTTACGCGG ACTGCATTAT CAGTTAGAAC4260CTTATGCTCA AGGAAAACTG GTACGCTGTG TTGTTGGTGA AGTTTTTGAT GTTGCGGTTG4320ATATTCGTAA ATCGTCACCT ACCTTTGGCA AATGGGTAGG GGTGAATTTA TCTGCTGAGA4380ATAAGCGCCA GTTATGGATC CCGGAGGGGT TTGCGCATGG GTTCATAACG TTGTCAAATA4440TAGCCGAATT TCTTTATAAA ACAACAGATT TTTATTCTCC AAAACATGAG GTTTGCATTC4500GGTATGATGA TGAGAGCATT GGTATACAAT GGCCTAAAGC AACTGACAAG ATGTTGATAT4560Orf4的終止CTTCAAAAGA TAAAAAAGGT TTGGATTTTA CTTCTTTAAT GTGAGTTATT ATATGCTAAT4620TTTATATCTA TTAATTTCTT CGCATGCATC TGAAAATTTA TTATAGCTGG CTCAATGGAC4680Orf5的起始ATTACATTGA TTTCTATTAA TGGATGGTTT TACTCAAAGT AAATATAATG AAAATAAATG4740A TCTTATCGCA TTCAATAAAT AATGCTGAAT ATAGCATTAT TGTAACATCG ATTTTTTTTG4860CCCAGTTACT CTCCGTTTTT GTTGATGGTG GGATCAATAA TGAAGTTCTC TCACTAACTA4920ATAAGTCATT AGATAACGAT ATTGATGGAT ATCAGAAACT ATCAATGAAT GGAGCAGTTA4980GGCTAGTTGT TCATTTGTTT TTTTCTTTTG TGTTATCAAC TTATTTTATG TTTGCTGATG5040T TAGAAACATA CTCTATAAAA TTAAAAACAG AATATAAATA TATTGAGGAT TTTATTTTAA5160ATATTTTTTG CAGTCTGTTT GTTATTTTAT CATCTTTTTT TATTTACATA TTTCCTCAAT5220GTCTTATGTT ATATCTTGTT TTTTTTAGAT TAATCCCTTT GGCTATATAT AGAAAACCAT5280TGCAAGTATT TAAAATGATA AGAGAAATAG ATTATAAATT AATAAGGGAT AATTATATCG5340C TTTTTCTATT GTTATTATTC GGTAGAGATA TGTATGCATA TTATCAACCA TTGAATCGGT5460TATATAATTC ATGTATAGGG TTGTCGGCAG CAGTTGTATC ATTTGCTATT CCATATGCAC5520ATTTACTGAC AAGTAGAATA AAGAAGATAT ACTTTTTAGT TTTCTTGTTT TCATCATCAG5580CAATTATAAT TTCATTATCA TATTATTTTT TTTCTAGAGA TGTCGTGATG GTATTCTTTG5640GTGAAAAATT TTCTATGGAA AGACAATATA TATTTCTATT TAGTTTATTG ATTTTTATGC5700C CACTCATAAA TCTTACTATT ACTATTTTAT GCATTCCATT TATATTAATT TCTGAAACGT5820G Orf6的起始 Orf5的終止TAATGATCAA AAGAGGAGTT GGTCATGATA AATAAAACCC ATATCATTTT TCTGAAGTTT5940ATATGTCGTG TTCTCATTAA AAAAAATCAA TTTGAAAGTT GTATATTGAG ACGATTATAT6000ATAAAACTAT ATGATATTGA TATTGGTATG TATAGCTATG GTTGTTTTGA CCCTAAAAGA6060GTGCCACCTA AAACAAAAAT AGGAAGATAT TGTTCGTTTG CACCAACAGC ATATATATTT6120
GGACGAAATC ATGGGGTTGA ATTTGTCTCG TTGCATCCAT ATTTATATAA TTCAGAGTTG6180GGTTTAGTAA AACAAGACAC CATAGCAATA ACTTCACGAG TGATAGAAGA CGACGTTTGG6240T GCTACTGGAG CAGTTGTCAC TAGCGACGTT CCTAGATATG CGATTGTTGC AGGAGTTCCG6360GCAAAGATCA TCAAATATAG ATTTGAACCG AGAGTGATAA ATATTATTGA AAAGAGTAAA6420TGGTGGTTAA GAACGAAATC TGAATTACAA AAAATGATTA AATTAGATAG TGGGTTTATA6480Orf7的起始 Orf6的終止TTTACACCGG GGTATTTTGA TGAAACCAAT TAAAATTTGC TTAGCATGGC ACAATATTAA6540TTCGACTAAC TATGGCGTTA GTGCTCTTGC AGTTGCACAA GTTGCTCTTT TAGTTGAGTC6600TGCGAGTCGT TCAAAAGTTG CTATTGAATT GGAGACTTTT GGTACACCGT TTGTTAATGA6660GTTATCAATT AGAAAGGAAG TAGAGCAAAG ATTTGCAGTT AAATTAACAC ATAGAGATTT6720CTCATTAAAA AAGTTTATTG TTGATTTTGC AAAACTTGAT TTTTCTGGAC TTAGATTATT6780TGACAAATAC GATATTGTAA TGGACATTGG TGAGGGTGAC AGTTTTACGG ATATATATGG6840AATTAAGAGA TTTATTACAT TCTCAATTAC AAAGTATTTA GCGTTAAGAG TTAAAAAGAA6900ACTCATTCTT TCACCTCAAA CAATCGGACC TTTTAATAGC AGAATATCAT ATATAATAGC6960GCGTTATTTG ATTTCGAAAT GTGATTCAGT TTTTTCTCGT GACTATAAAT CTACGAAATT7020CATACATGAC ATGGGATTGA ATTGTGAAGA AGTATCAGAT GTAGCATTTA CTCTACCATA7080TGATACTTTG CCCAAGATAG ATAACAGTAT TGGTATCAAC ATTTCAGGTT TGTTATGGAA7140TGGTGGTTAC ACAGGCGATA ATCAGTTTGG ATTGACAGTT GATTATAAGT TATTCGTCAA7200AGAGATTATT GAATTATTTA GAGTTAGAGG GAAGGAAGTT CATTTGATTG GACATGTCAT7260TGCAGACCAT CTACCTGTGG AAGATGACTA TCGTGTTTGC AATCAAATTA AAGAAATGTT7320TTCATTAGAT AATGGAGTAA TAGTAGCACC TAAATTTACA TCACCTATCC AAGCTAAAAC7380TTATATGAGT CAGTTAACAT TTTTTACTGG ATCACGTATG CATGCAACCA TTGGGGCACT7440ATCTGCAGGA GTTGTAACAG TACCTATAGC GTATAGTCGA AAATTCTCTG GAGTATTTGG7500TAGTTTGGAT TATCGTTTTA CTTTGGATGC TTATACATTA GATACCAAAA GTTTAGTGAC7560AAAATTATTT GAGTATTATG ATAATAATTT TGAAGAAATG CAATCTGCAA TGATTAATGC7620AAGAATTAAA GCAAATCAAA GAAACGAAAA ATATGTTGGT TATCTTCAGG AATTATTAAG7680Orf8的起始 Orf7的終止CAATGAAAAA AATAGCACAA GTCATTGAAT CTGGAATGTG TGTGGGTTGT GGATTTTGCA7740CTGAAAACCC CAATGGTATG GATATTAATA AAGAAGGATA TTATAGACCT ATTTCTTTCA7800TTGATGATTC ATTATCACAG CTAGTATGCC CTGGTAAATC TATTTCCCAT AATAACAGTA7860TGGCTCCTTA TAACCTTTTA TGGGGGCCGG TAGTGAGTTG TGAGAGTGGA AATGCAGTTG7920ACCCAGATAT ACGTCATAAG GGGTCTTCTG GTGGGGTTTT AACCGCCATT GCAGTTTATC7980TTGTTGATTC TGGATTGGTT GATGCAATAA TACAGGTTGG TGTTTCAGTT GATAATCCAA8040TACGCAATGT AACATATATA ATGAAGAGTC AGGAAGATAT ATTAAAATGT GCTGGCTCTC8100GCTATTCACC TTCATCACCA CTTAGTGTCA TTCGTTCATT ATTAGGTAAT GGTACACGGT8160ACGCTGTTAT TGGTAAACCC TGTGATATTG CGGCTATGCG CACATTGGTT AATAGTCGGC8220AAGAATTTCA AGAGCAGTTT CCATACCTAC TTTCATTTAT GTGTGCTGGA GTGCCAAGTG8280AAGAAGGTAC AAGAAATATT CTTGAGCGAT GGCACATAAA ACATGAACAT TTAATCTCGT8340TTCGTTATCG AGGAGACGGA TGGCCAGGAT TGACAAAAGC TATTACTGAT GATGGTGAAG8400AGTTTACTAT GACTTATAAT GAATCATGGG GCGGTGTACT TAATCGCTAC TTACAGCCTC8460GTTGCAAACT ATGTGCTGAC GGTATTGGTG AAGCTGCTGA TATTGTATGT GCAGACGCTT8520GGTATTCTAC TACTAACGGC TATCCTAGTT TTATAGAGAA GGAGGGACGT AGTTTAACAA8580TTGCTCGTAC ACTTAAAGGC CGTCAATTGT TGGATCTTGC TTTAAATAAA AATGTAATAT8640CACTTACACC TTTTAATATT TCTGATCTTG AGAAAATTCA ACCATACCAA GCTAATCGTA8700
AACAGACGGC AAATGTTCGT CGCTGGGCTG TTATGCTTCT GGGGGGAAGT GTGCCGAATT8760TTAAAGGTTA TAGTCTTAAT AAATTAATGT TTAGAGCCCC AATAAAAATT ACTTTAAAGG8820Orf8的終止CATTTTTTGG TACATTGATA AGAAAAATGA AGGGACGTAT TTGAAAACTA ATTATATATT8880A Orf9的起始TTATTAAACG TGTTGAATAA CAATATGGTA TTTTAAATGA TTAAAGTAAA TGTTATTGTT9000GCACTTTATT ATCCAAATTA CTATCAGAGG GTTAGGGAAG AGATTATTTC TTTTCTGCAG9060GGATTTGATT ATTTTATAGT GTTTGTGGAC AATAATAGAA CGGTCAAACC AAATATAGAG9120AATAATAAAA ATGTAACGTG GATAATAGGG AGTAATATTG GTGGTGAATT TTCTGCTTGG9180GATGAAGGTT ATGACCTCCT GGTTAATATG AAAAATCCGT CAGATGATGA AATTATAGTT9240TTTATTAATG ATACATTTTG TCATCACCAT TTTTTTACAT GTTTCGATAG GTATTTATAT9300AGGAAAGCAA TATCTACATG TGAAGATAAT AACATTTATG GTGATGTTAA CAGTATAGGC9360GAATTTTTTA GTGTTTATGA TCGGCATTTT TCATCTTGGG TATCTTCTTA TTTTTTTCTA9420GGTAGAAAAA AAAACATTGA TAAACTTTTA CCTCTTAATA AACAAAGTGG TATGGACGCA9480GAATATATGA GATATCTTAG TAATGCATTG GTATCTAAGC GCGTTGATGT TCCTATCTTT9540TCGGATAAAT TGAATCAGCA TCTCACGAAT TGGTTATTTC CAGTTAATAG CAAGGGATGG9600TATGGCGCAA GAAACGTATC ACAGCAACTT ATTCTGTTTA AACTGAATGC AATAATTAAT9660GAAAAATTGC TCACTTATAA TATAATTGAA CATGATCTTT TATTAACAAA TATTTATCAT9720GGAAAAATAA GAACGCTTTA CAATTCTATG CGTAACAAGC TATATTTTTT TTGCAAAAAT9780Orf9的終止Orf10的起始AATAAGTTGA TAGGGTGATA TAATGTATGC AAATAAAGCA ATGCCCAAAA GACATACGAG9840AGAAAGAGTG TTTTTACCAC TATTACTTTC GATGATTTTC ATTTGCATGA TAATAAATGA9900TTTGCCACTA CAACAATATC TTGGAACTTT AGGTGCAAGT CCTATGTGGG GGGGGGCATT9960ATTTATTTTT ATGTTGATTG TTATTCGTAG CCGCTTTGTT TTAAATCTTG ATTCTACCAG 10020TAAATATTTT CTCTATTTTT ACCTATTAAC ATTTACTATA TCGCTTTTAC AATGTTTCTA 10080TTATGCCATC TCTAGAGGTT CTGTAGAAAA CGAGTATGGT GGATTGATTT TTGGTAAGCT 10140TGTATTTGCT TCGACGTATT ATATCGTTTA TTTTTTTACT ATATACACTG CCATTTTTTT 10200GGCTAGAAGA ATAACATCCT CTGCTCTTAA ATTTTGTATC ATAAATGCTT CTGTTTTGTT 10260GCTTCTTCTT CTTATTTTGG AGTTTTTTTC GCCAAACTCA TTGAGTTTAT TTCATAAAAG 10320TATGGATGGC TATGGCTTTG GATTTAGACA AAGGTTATTG TCCCCTGAAC CATCAATGGC 10380TGCGTTTACT TTAAATATTT TCTTGTTGAT AAGCATAGTA CTGGTTAACT CAAAGATCGC 10440TAAACTATTT ATGGGAGGTG CGCTTGTAGT AGGCAACCTA TTTATTGGCT CTAAAGCTTC 10500GCTCATATTA ATTTTGATGA GTGGTGTTAT TGTGTTTTAT CTTAATATGA ACTTAACCCA 10560AAAAATAAAA TCGTTACTTA TATTAATTCC TGTATCAATT GCAGTTTTTT ATGTGTTTTT 10620AAATACGATT CTTCCAGCAC TGATTGTAGA TGTAGATAAA TTCACAAGTG TTAGCACTCG 10680TTTAATAACA GCCCTTGCGG CTCTGCTGAG TTTAATATAC TATCCATTGG GTGAGGGCTA 10740TGGTACCTAT AGTTCTTATC TTTTGGGACC TCTTGATTTA GCTGTTCAAT TAGCAGAAGA 10800ACTATTGCCT TTTACATTAA ATGTAAGCGA GGTCAATAAA ATGCTAATGA CTGGTGAGTC 10860GTTAGCAGCA AAGTCAGGTA TTCTTTTTTC TGTTATCCAG AGTGGAGTCG TTTCCCTCAT 10920ATTTTTTTAC GTGATTTATC GAAATGCGTT TAGAAAACTC TGTGCTGCCA GGCTATCTAA 10980TTATAACAAG ATAATGATGC GGTTGGTTCT ATGGTATTCA TTGTTATCAA TCATGTTTGC 11040TGTTAATATT GAAGTTGTCT ATGCTTTTTT ATTGCCGTTT ATTATAATTG ATCATTATGC 11100Orf11的起始Orf10的終止TATAAATTAT ATGCGATCTT ATGATTATGA ATAAAATTTT ATATATCTCG CTCTCTCTTG 11160
ATGAGAAAAA CTATGGTGGC AGCATCGTGT CTAGAAATAA TTTAAAAGCA TTGAGGGCAC11220TTGAAGATAG TGAGGTGAAG GAAGTTGCAA TAGTTAAGAA ATTAAAAGGG ATATATGAAT11280ATGAACTACA AACTAATGTG TCAAAAGTAA AAATAGCCAT AGATAACCTG AAGGGATATG11340CTGGACGGTT AAATCGCGAT TGTTTATTGA AAATTAAAAA TATTATAAAA GTCTTTGAGC11400C TATCTACAGA CATAAAAGTT ATTACATTTT TTCATAATGT CGAGATTGAT TTTGAATTAG11520AAAGATTGAA GTCAGGGGGA ATATTGTACT TGCCTTCTCT TTTGCCATCT TATTTAGCGG11580AAAAAAAAGC TATAAAATAT AGTGATATAA TAATTTCACT TCATAAAAAT GATAGTGCTA11640GGCTTAAGTG CATATATGGA CGTTCGTCTG ATTTTTGTGT CCCAGTTTGT ATAGAAGATG11700ACTTGAGTAA CGAGGTAATA TTACATAAAA ATAATAGTAC AGATAGTATA TTTAGAGTTG11760GTTTTATTGG AACTGCATTT TTCGCGAATA TTAAAGCTGC AGAGTTCATT TCGAAAAAAT11820TATCACCTAG GTTTTTGAAT AATAAACAAA TAGAATTTAT TATTGCGGGT AATGGTTTCG11880G TTGAAGACTT TTATAATGAA GTTGATGTTA TAATATCTCC CGTCCTGACG GGAGCAGGCA12000TGAAAGTGAA AATAGCGGAA GCGATTAAAT ATAATAAGAA GGTAATTGCC TCGTCATTTT12060CATTAATTGG ATATGAGACT ATGTTAAATA GTCAAAATAT TTTTTCTTGC ATTACTCTAG12120ATGATTATGC GATAGCAATT AAAAAGTTGA GCACACATCC TATGACTCAC TCTGATACTC12180GTGAATATTA TTTGAAATTT TTCTCAAGTC AAGCATGTAT TAACTATTTT AAATATATTT12240Orf11的終止TGAACTCCTA ATAGTTAAAA TGCTACTTCT ATGTGTGTTT ATTGTGTTGA GTTTTTTGTT12300Orf12的起始TTACTGCTTT TATGTAGTAG AGGATGATGC TGATGAAGGT ATTGCAAGTT AGTAAGTTTT12360ACCCACCTGT ACATGGAGGA ATTGAGCAAG TCGCGTTTGA TATCAGTGAA GGCATGTTTG12420AAGAACATAT ACAGGCTGTT GATATTTTAT GTGTAGATCC ATTGGGACCT CGTATTGATG12480ATAGGAATTA TAAATATCGA GTTTTTCGAC AAAAGACTTT TATTGTTCTA TTTTCCACTC12540CGATTTCAAT ATCATTTATA AATAAATGGC GAAAAATAAA AGATAATTAT GATATTATCC12600ACGTACATTT ACCTAACCCT TTAGCTGTTC TCGCTATATA TCTTTTTCCT CCAAAAGGTA12660AAATTGTATT ACATTGGCAT AGTGATATTG TTAAGCAAAA AAAATTATTC AGATTATTTT12720TACCTTTACA AAGATGGATT TTGGATAGGT GCACTTATAT AATTGTGACT AGTCCAGTGT12780ATGGTCAATC ATCTCCATCG CTGCAACAAT ATCAAAATAA ATTAATTTGT ATTCCTATAG12840GTGTAGATAC CAGTGTTATG CCTGTTGACC TACAAGAAGA AAAATTAATT AAAAGTAAGT12900ATAAAGATAA AAAAATAATA TTTTCATTAG GGCGATTGGT TTATTATAAA GGTATGGATA12960TTTTAATTGA TTCAGCGAAA TATTTACCTG ATGATTACAT CATATTAATT GGGGGGGGGG13020GCGCATTATT AAAAAAATTA AGGAGGCAGA TTTATGATAA TAACTTATCA CACAAGGTTG13080TTGTTTTGGG AAGTATAGAT TATAAATGCT TAGCTTCATA TTATAAATGC TGTGATGTAT13140TTTGTCTCCC ATCTATACAT GAGTCTGAAG CGTTTGGTGT GGTACAATTA GAAGCAATGA13200GTTTTTCAAA GCCATTAGTT TCTACGAATA TCCCCCGAAG TGGTGTTCCA TGGGTTAACG13260AAAATGGAAC ATCAGGAATT GTTGTTGAGC CAAGGAGTGC TATAGCTCTT GCTGAAGGGA13320TTGTTAAAAC TATTGCTAAT AGTGAAAAAT TCAGTAAAGG AGCAAAAGAT AGATTTGATA13380TGCTCTTTAC TAAGAGATTA ATGGTTAATA ATGTATACAA ATTATATTTA AGTATAAAGT13440Orf12的終止Orf13的起始GAGTCAAAAT ATGTCTTTAC TTCCTGTTAT CATTGCTGGT GGTACCGGTA GTCGTTTGTG13500GCCTTTATCA CGAGTTAAGC ATCCAAAGCA ATTTCTCCAT TTAGGGGATG ATGGAACAAT13560GTTACAGACG ACATTAAATC GTCTTCAAGG GTTAAAGTGT GATAACCCAA TTGTAATTTG13620
CAATGAGCAG CATAGATTTA TAGTTGCTGA GCAACTTCGA CAATTAAATA AACTCACTCA13680GAATATTATT CTTGAGCCCG TCGGCCGGAA TACTGCACCA GCTGTAACTC TCGCTGCACT13740GAATGCAATA CGTAATAAGT CAAAACAATC AAAATTAATT TTGGTTCTTG CAGCTGATCA13800TATTATAAAA GACGAAGATG CATTTTGTAG AAGTGTGCTG AGTGCTATTC CATATGCAAA13860CAAAGGAAAA TTAATCACAT TTGGTATAGT GCCTAATAGT CCCGAAACAG GCTATGGATA13920TATAAAAAGA GGTCATTTAT GTAGTGGCAA TAATGCTAAT TTAGCTTTTG AAGTGGCTGA13980GTTCGTTGAA AAACCTAACA TAGATACAGC TCAAGAGTTT CTTTCATCTG GTAACTATTA14040TTGGAATAGT GGTATGTTTT TATTTCGAGC TGATAGGTAT TTAGATGAAT TAAAAAAATA14100TAGACCAGAC ATACTTGAGG CCTGTAAAAA ATCAATGATT GAACTTAATG GAGATCTTGA14160TTTTATTCGT ATCAATAAAG ATGCTTTTTG CGCTTGCCCA GATGAGTCAA TTGATTATGC14220CGTTATGGAG AAAACGAATG ATGCGGTTGT TATCCCAATG GATGCTGGCT GGAGTGATGT14280GGGGTCATGG TCATCTTTAT GGGAAATGAG TAATAAAACC ATTGAAGAAA ATGTAATAGT14340G G TGCTACAGTT GGGGTAAAAG ATCTTGTTGT TGTTCAAACA AAAGATGCTG TGTTAGTAGC14460TAATAGGAAT TCAGTTCAGA ATGTAAAAAA AATTGTCGAA AGGCTTAAAT CAGAAAATCG14520TAGTGAAGTT TTTACGCATC TTGAAGTTTA TCGTCCTTGG GGTAAATATG AGTCTATCGA14580TAATGGTGAA CGCTATGAAG TTAAACGAAT TTCCGTAAAA CCTGGAGAGG GGATTTCATT14640GCAAATGCAT CACCATCGTT CTGAACATTG GATAATAGTT TCGGGTACTG CAAAAGTAAC14700AATTTGTGAT GAAACAAGAA TTCTCAGTGA AAATGAATCT ATTTATATAC CTGTCGGGGC14760GAAACATTGT TTAGAGAATC CGGGAAAAAT TATGTTGGAG CTTATAGAAG TTCGCTCCGG14820Orf13的終止Orf14的起始CTCCTATCTA GGAGAAGATG ATGTCATCCG TTTTGCCGAC AGATATGGAA GAACATAAAT14880GCACAATAAG ATCATCCTAG ATAAATTAAC TTGCTTTAAA GCCTACGATA TTCGCGGAAA14940C TCTCAAACCG AAAACCATTG TGTTAGGCGG CGATGTCCGC CTCACCAGCG AAACCTTAAA15060ACTGGCGCTG GCGAAAGGTT TACAGGATGC GGGCGTCGAT GTGCTGGATA TCGGCATGTC15120CGGCACCGAA GAGATTTATT TCGCCACGTT CCATCTCGGC GTGGATGGCG GCATTGAAGT15180TACCGCCAGC CATAATCCGA TGGATTATAA CGGCATGAAG CTGGTGCGCG AAGGGGCTCG15240CCCGATCAGC GGCGATACCG GACTGCGCGA CGTCCAGCGT CTGGCAGAAG CCAACGACTT15300TCCTCCCGTC GATGAAACCA AACGCGGTCG CTATCAGCAA ATCAATCTGC GTGACGCTTA15360CGTTGATCAC CTGTTCGGTT ATATCAACGT CAAAAACCTC ACGCCGCTCA AGCTGGTGAT15420TAACTCCGGG AACGGCGCGG CGGGTCCGGT GGTGGACGCC ATTGAAGCCC GCTTTAAAGC15480CCTCGGCGCA CCTGTGGAAT TAATCAAAGT ACACAACACG CCGGACGGCA ATTTCCCCAA15540CGGTATTCCT AACCCGCTGC TGCCGGAATG CCGCGACGAC ACCCGCAATG CAGTCATCAA15600ACACGGCGCG GATATGGGCA TTGCCTTTGA TGGCGATTTT GACCGCTGTT TCCTGTTTGA15660TGAAAAAGGG CAGTTTATCG AGGGCTACTA CATTGTCGGT CTTCTGGCAG AAGCGTTCCT15720CGAAAAAAAT CCCGGCGCGA AGATCATCCA CGATCCACGT CTCTCCTGGA ACACCGTTGA15780TGTGGTGACC GCCGCGGGCG GCACTCCGGT GATGTCGAAA ACCGGACACG CCTTTATTAA15840AGAACGTATG CGCAAGGAAG ACGCCATCTA CGGTGGCGAA ATGAGCGCCC ACCACTATTT15900CCGTGATTTC GCTTACTGCG ACAGCGGCAT GATCCCGTGG CTGCTGGTCG CCGAACTGGT15960GTGTCTGAAA GGAAAAACGC TGGGCGAACT GGTGCGCGAC CGGATGGCGG CGTTTCCGGC16020AAGCGGTGAG ATCAACAGCA AACTGGCGCA CCCCGTTGAG GCGATTAATC GCGTCGAACA16080GCATTTTAGC CGTGAGGCGC TGGCGGTGGA TCGCACCGAT GGCATCAGCA TGACCTTTGC16140CGACTGGCGC TTTAACCTGC GCTCCTCCAA CACCGAACCG GTGGTGCGGT TGAATGTGGA16200
ATCGCGCGGT GATGTACCGC TGATGGAAGA AAAGACAAAA CTTATCCTTG AGTTACTGAA16260Orf14的終止CAAGTAATTC AGTAATTTCA TATAAATGGG TTTTAAAAAA CGGAAAAGAT GAGATATCCG16320GTGTGGTATA GCCAAGGTAA TGCTATTCAG TATCTCTATG AGTGAGTTAA CATCTATACC16380ACATTTAAGC CGCACACTTG GCGGTAACCA CCCCTGACAG GAGTAAACAA TGTCAAAGCA16440ACAGATCGGC GTCGTCGGTA TGGCAGTGAT GGGACGCAAC CTCGCGCTCA ACATCGAAAG16500CCGTGGTTAT ACCGTCTCTA TTTTCAACCG TTCCCGTGAT AAGACGGAAG AAATTATTGC16560CGAAAATCCA GGCAAGAAAC TGGTTCCTTA CTATACGGTG AAAGAATTCG TTGAATCTCT16620TGAAACGCCT CGTCGCATCC TGTTAATGGT GAAAGCAGGT GCAGGCACGG ATGCTGCTAT16680TGATTCCCTT AAGCCATACC TCGATAAAGG TGACATCATC ATTGATGGTG GTAATACCTT16740CTTCCAGGAC ACCATTCGTC GTAACCGTGA GCTTTCTGCC GAAGGTTTTA ACTTCATCGG16800TACCGGTGTT TCCGGCGGTG AAGAGGGGGC GCTGAAAGGG CCTTCCATCA TGCCTGGTGG16860CCAGAAAGAA GCCTATGAAC TGGTTGCGCC GATCCTGACC AAAATCGCCG CCGTTGCTGA16920AGATGGCGAA CCGTGCGTTA CCTATATCGG TGCCGATGGC GCGGGTCACT ATGTGAAGAT16980GGTTCACAAC GGTATTGAAT ACGGTGATAT GCAACTGATT GCTGAAGCCT ATTCTCTCCT17040GAAAGGCGGC CTGAATCTCT CTAACGAAGA ACTGGCACAG ACCTTTACCG AGTGGAATAA17100CGGTGAACTG AGCAGCTACC TGATCGACAT CACCAAAGAT ATCTTCACCA AAAAAGATGA17160AGACGGTAAC TATCTGGTTG ATGTGATCCT GGATGAAGCG GCTAACAAAG GTACCGGTAA17220ATGGACCAGC CAGAGCGCGC TGGATCTCGG CGAACCGCTG TCGTTGATTA CTGAGTCAGT17280GTTTGCACGT TATATCTCGT CTCTGAAAGA TCAGCGCGTG GCCGCGTCTA AAGTTCTCTC17340TGGTCCGCAA GCACAGCCAG CTGGCGATAA AGCTGAGTTC ATCGAGAAAG TTCGTCGTGC17400C TGAAGAGTAC AACTGGGATC TGAACTACGG CGAAATCGCG AAGATTTTCC GTGCTGGCTG17520T T CGCTAACCTG CTGCTGGCTC CGTACTTCAA GCAAATTGCC GATGACTACC AGCAGGCGCT17640GCGTGATGTC GTTGCTTATG CAGTACAGAA CGGTATCCCG GTTCCGACCT TCGCTGCTGC17700GGTTGCCTAT TATGACAGCT ACCGTGCCGC TGTTCTGCCT GCGAACCTGA TTCAGGCCCA17760GCGTGACTA17769表中的序列是大腸桿菌O58的O抗原基因簇的核苷酸序列,痢疾志賀氏菌5型的O抗原基因簇的核苷酸序列與大腸桿菌O58的O抗原基因簇的核苷酸序列有99.76%是一樣的,不一樣的堿基用方框表示,在這個堿基的上方是痢疾志賀氏菌5型的核苷酸。從表4中可知大腸桿菌O58和痢疾志賀氏菌5型的O抗原基因簇的每個基因的起始和終止的位置都是一樣的。
以上僅是本發明較佳實施例,并非對本發明作任何限制,凡依本發明技術實質對以上實施例作修改、等同變化與修飾,均屬于本發明技術方案的范圍內。
權利要求
1.一種對大腸桿菌O58和痢疾志賀氏菌5型的O-抗原特異的核苷酸,其特征在于,其是如SEQ ID NO1所示的分離的大腸桿菌O58和痢疾志賀氏菌5型的核苷酸,全長都是17769個堿基;或者具有一個或多個插入、缺失或取代的堿基,同時保持所述分離的核苷酸功能的SEQ ID NO1的大腸桿菌O58和痢疾志賀氏菌5型的核苷酸。
2.按照權利要求1所述的對大腸桿菌O58和痢疾志賀氏菌5型的O-抗原特異的核苷酸,其特征在于,其包括命名為rmlB,rmlD,rmlA,rmlC,wzx,orf6,orf7,orf8,orf9,wzy,orf11,orf12,manC,manB的14個基因組成,都位于galF基因和gnd基因之間。
3.按照權利要求2所述的對大腸桿菌O58和痢疾志賀氏菌5型的O-抗原特異的核苷酸,其特征在于,所述基因中具有高度特異性的基因包括轉運酶基因,包括wzx基因或與wzx有相似功能的基因;聚合酶基因,包括wzy基因或與wzy有相似功能的基因;糖基轉移酶基因,包括orf6、orf9、orf11、orf12基因。其中所述的轉運酶基因是SEQ ID NO1中的4728至5915堿基的核苷酸;所述的聚合酶基因是SEQ ID NO1中的9803至11134堿基的核苷酸;所述的orf6基因是SEQ ID NO1中的5905至6513堿基的核苷酸;orf9基因是SEQ ID NO1中的8977至9798堿基的核苷酸;orf11基因是SEQ ID NO1中的11127至12251堿基的核苷酸;orf12基因是SEQ ID NO1中的12333至13442堿基的核苷酸。
4.按照權利要求1或2所述的對大腸桿菌O58和痢疾志賀氏菌5型的O-抗原特異的核苷酸,其特征在于,其還包括源于所述的wzx基因或wzy基因中的寡核苷酸或糖基轉移酶基因,以及它們的混合或它們的重組。
5.按照權利要求4所述的對大腸桿菌O58和痢疾志賀氏菌5型的O-抗原高度特異的核苷酸,其特征在于,所述的源于wzx基因的寡核苷酸對是SEQ ID NO1中的4967至4984堿基的核苷酸和5336至5353堿基的核苷酸,SEQ ID NO1中的5341至5358堿基的核苷酸和5839至5856堿基的核苷酸;所述的源于wzy基因的寡核苷酸對是SEQ ID NO1中的10475至10492堿基的核苷酸和11855至10872堿基的核苷酸,SEQ ID NO1中的10110至10127堿基的核苷酸和10932至10949堿基的核苷酸。
6.權利要求1所述的對大腸桿菌O58和痢疾志賀氏菌5型的O-抗原特異的核苷酸在檢測表達O-抗原的細菌、鑒定細菌的O-抗原和細菌的其它多糖抗原的應用。
7.權利要求1所述的對大腸桿菌O58和痢疾志賀氏菌5型的O-抗原特異的核苷酸的重組分子,在通過插入表達而提供表達大腸桿菌O58和痢疾志賀氏菌5型的O-抗原,以及制備細菌疫苗中的應用。
8.權利要求1所述的對大腸桿菌O58和痢疾志賀氏菌5型的O-抗原特異的核苷酸的應用,其特征在于,它作為引物用于PCR、作為探針用于雜交反應與熒光檢測、或者用于制造基因芯片或微陣列,供檢測細菌。
9.權利要求1所述的對大腸桿菌O58和痢疾志賀氏菌5型的O-抗原特異的核苷酸的分離方法,其特征在于,其包括下述步驟(1)基因組的提取在培養基中培養大腸桿菌O58和痢疾志賀氏菌5型,離心收集細胞;得到的基因組DNA通過瓊脂糖凝膠電泳檢測;(2)通過PCR擴增大腸桿菌O58和痢疾志賀氏菌5型中的O-抗原基因簇以大腸桿菌O58和痢疾志賀氏菌5型的基因組為模板通過Long PCR擴增其O-抗原基因簇,將得到的PCR產物,用瓊脂糖凝膠電泳檢測PCR產物的大小及其特異性,合并該long PCR產物,并用DNA純化試劑盒純化PCR產物;(3)構建O-抗原基因簇文庫將Long PCR純化產物應用鳥槍法構建O-抗原基因簇文庫;(4)對文庫中的克隆測序從文庫中挑選插入片段在1kb以上的克隆用實驗室常用的DNA自動測序儀對克隆中的插入片段進行測序,序列達到100%的覆蓋率,從而獲得O-抗原基因簇的所有序列;(5)核苷酸序列的拼接及分析應用生物信息學軟件拼接和編輯所有的序列,從而得到大腸桿菌O58和痢疾志賀氏菌5型的O-抗原基因簇的核苷酸全長序列;(6)特異基因的篩選針對大腸桿菌O58和痢疾志賀氏菌5型的O-抗原基因簇中的wzx、wzy、基因設計引物;在每個基因內各設計了兩對引物,每對引物分布在相應基因內的不同地方,以確保其特異性;用這些引物以166株大腸桿菌和43株志賀氏菌的基因組為模板進行PCR,確定wzx、wzy基因對大腸桿菌O51型的O-抗原的高度特異性;(7)引物靈敏度的檢測培養大腸桿菌O58和痢疾志賀氏菌5,細菌計數后分別將5×103,5×102,5×101,5個和0個活菌加入到一定量的某種待檢測物中,混入細菌的待檢測物作為檢測用樣品,將樣品加入LB培養基,取一些與樣品混合過的LB培養基過濾,將過濾液進行培養,從培養好的菌液中取數毫升處理后作為PCR模板用寡核苷酸進行PCR反應,檢測其對大腸桿菌O58和痢疾志賀氏菌5型的靈敏度。
10.權利要求9所述的對大腸桿菌O58和痢疾志賀氏菌5型的O-抗原特異的核苷酸的分離和鑒定方法,其特征在于,包括下述步驟(1)基因組的提取在5mL的LB培養基中37℃過夜培養大腸桿菌O58和痢疾志賀氏菌5型,離心收集細胞。用500ul 50mM Tris-HCl(pH8.0)和10ul0.4M EDTA重懸細胞,37℃溫育20分鐘,然后加入10ul 10mg/ml的溶菌酶繼續保溫20分鐘。之后加入3ul 20mg/ml的蛋白酶K、15ul 10%SDS,50℃溫育2小時,再加入3ul 10mg/ml的RNase,65℃溫育30分鐘。加等體積酚抽提混合物,取上清液,再用等體積的酚∶氯仿∶異戊醇(25∶24∶1)的溶液抽提兩次,取上清液再用等體積的乙醚抽提以除去殘余的酚,上清液用2倍體積乙醇沉淀DNA,用玻璃絲卷出DNA并用70%乙醇洗DNA,最后將DNA重懸于30ul TE中,基因組DNA通過0.4%的瓊脂糖凝膠電泳檢測;(2)通過PCR擴增大腸桿菌O58和痢疾志賀氏菌5型中的O-抗原基因簇以大腸桿菌O58和痢疾志賀氏菌5型的基因組為模板通過Long PCR擴增其O-抗原基因簇;首先根據經常發現于O-抗原基因簇上游的galF基因設計上游引物(5’ATT GTG GCT GCA GGG ATC AAA GAA ATC-3’),再根據O-抗原基因簇下游的gnd基因設計下游引物(5’-TAG TCG CGC TGN GCC TGG ATT AAGTTC GC-3’)。用Boehringer Mannheim公司的Expand Long Template PCR方法擴增O-抗原基因簇,PCR反應程序如下在94℃預變性2分鐘,然后94℃變性10秒,60℃退火30秒,68℃延伸15分鐘,這樣進行30個循環;最后,在68℃繼續延伸7分鐘,得到PCR產物,用0.8%的瓊脂糖凝膠電泳檢測PCR產物的大小及其特異性;合并6管long PCR產物,并用Promega公司的Wizard PCR Preps純化試劑盒純化PCR產物;(3)構建O-抗原基因簇文庫用被修改的Novagen DNaseI shot gun法構建O-抗原基因簇文庫;反應體系是300ng PCR純化產物,0.9ul 0.1MMnCl2,1ul 1∶2000稀釋的1mg/ml的DNaseI,反應在室溫中進行;酶切10分鐘使DNA片段大小集中在1kb-3kb之間,而后加入2ul 0.1M EDTA終止反應;合并4管同樣的反應體系,用等體積的酚抽提一次,用等體積的酚∶氯仿∶異戊醇(25∶24∶1)溶液抽提一次,再用等體積的乙醚抽提一次后,用2.5倍體積的無水乙醇沉淀DNA,并用70%乙醇洗沉淀,最后重懸于18ul水中;隨后在此混合物中加入2.5ul dNTP(1mMdCTP,1mMdGTP,1mMdTTP,10mMdATP),1.25ul 100mM DTT和5單位的T4DNA聚合酶,11℃反應30分鐘,將酶切產物補成平端,75℃終止反應后,加入5單位的Tth DNA聚合酶及其相應的緩沖液并將體系擴大為80ul,70℃反應20分鐘,使DNA的3′端加dA尾。此混合物經等體積氯仿∶異戊醇(24∶1)溶液抽提和等體積乙醚抽提后與Promega公司的3×103的pGEM-T-Easy載體于16℃連接24小時,總體積為90ul,其中有9ul的10×buffer和25單位的T4DNA連接酶;最后用1/10體積的3M NaAc(pH5.2)和2倍體積的無水乙醇沉淀連接混合物,再用70%乙醇洗沉淀,干燥后溶于30ul水中得到連接產物;用Bio-Rad公司的電轉化感受態細胞的制備方法制備感受態大腸桿菌DH5α細胞,取2-3ul連接產物與50ul感受態大腸桿菌DH5α混合后,轉到Bio-Rad公司的0.2cm的電擊杯中電擊,電壓為2.5千伏,時間為5.0毫秒-6.0毫秒,電擊后立即在杯中加入1ml的SOC培養基使菌復蘇,然后將菌涂在含有氨芐青霉素、X-Gal和IPTG的LB固體培養基上37℃過夜培養,次日得到藍白菌落,將得到的白色菌落即白色克隆轉到含有氨芐青霉素的LB固體培養基上培養,同時從每個克隆中提取質粒并用EcoRI酶切鑒定其中的插入片段的大小,得到的白色克隆群構成了大腸桿菌O58和痢疾志賀氏菌5型的O-抗原基因簇文庫;(4)對文庫中的克隆測序從文庫中挑選插入片段在1000bp以上的100個克隆由上海生物工程有限公司用ABI377型DNA自動測序儀對克隆中的插入片段單向進行測序,使序列達到80%的覆蓋率,再通過將相聯系的序列進行反向測序及測通得到剩余20%的序列,從而獲得O-抗原基因簇的所有序列。(5)核苷酸序列的拼接及分析用英國劍橋MRC(Medical ResearchCouncil)分子生物學實驗室出版的Staden package軟件包的Pregap4和Gap4軟件拼接和編輯所有的序列,從而得到大腸桿菌O58和痢疾志賀氏菌5型的O-抗原基因簇的核苷酸全長序列,序列的質量主要由兩個方面來保證1)對大腸桿菌O58和痢疾志賀氏菌5型的基因組作6個Long PCR反應,然后混合這些產物以產生文庫。2)對每個堿基,保證3個以上高質量的覆蓋率;在得到大腸桿菌O58和痢疾志賀氏菌5型的O-抗原基因簇的核苷酸序列后,用美國國家生物技術信息學中心(The National Center for BiotechnologyInformation,NCBI)的orffinder發現基因,找到14個開放的閱讀框,用blast系列軟件與GenBank中的基因比較以發現這些開放的閱讀框的功能并確定它們是什么基因,再用英國sanger中心的Artemis軟件完成基因注釋,用Clustral W軟件做DNA和蛋白質序列間的精確比對,最后得到大腸桿菌O58和痢疾志賀氏菌5型的O-抗原基因簇的結構;(6)特異基因篩選針對大腸桿菌O58和痢疾志賀氏菌5型的O-抗原基因簇中wzx和wzy基因設計引物;在每個基因內各設計兩對引物,每對引物分布在相應基因內不同地方以確保其特異性;用這些引物以166種血清型的大腸桿菌和43株志賀氏菌基因組為模板進行PCR,所有引物在大腸桿菌O58和痢疾志賀氏菌5型中得到陽性結果,在其他組中沒有擴增到任何大小正確的帶,也就是,在大多數組中沒有得到任何PCR產物帶,雖在少數組中得到PCR產物帶,但其大小不符合預期大小,所以wzx、wzy基因對大腸桿菌O58和痢疾志賀氏菌5型及其O-抗原都是高度特異的。(7)引物靈敏度的檢測將大腸桿菌O58和痢疾志賀氏菌5型的凍存菌液接種到有LB培養基的三角瓶中,30℃-40℃培養,180至250轉/分,培養數小時至飽和,取培養好的菌液稀釋,取稀釋菌液涂布LB瓊脂平板,30℃至40℃,培養數小時計數,計算原液中活菌濃度;在5份重量均為20g的生豬肉餡中分別摻入5×103,5×102,5×101,5個和0個活菌,攪拌均勻,加入LB培養基,過濾,過濾液于30℃-40℃培養,180至250轉/分,培養數小時;從培養好的菌液中取數ml于6,000g離心數分鐘,去上清,加MQ超純水吹開沉淀并混勻,放入100℃沸水中煮數分鐘,裂解液于12,000g離心數分鐘,取上清做為PCR模板;用寡核苷酸(SEQ ID NO1中的4 967至4984堿基的核苷酸和5336至5353堿基的核苷酸,SEQ ID NO1中的5341至5358堿基的核苷酸和5839至5856堿基的核苷酸,SEQ ID NO1中的10475至10492堿基的核苷酸和11855至10872堿基的核苷酸,SEQ ID NO1中的10110至10127堿基的核苷酸和10932至10949堿基的核苷酸)進行PCR反應,PCR反應體系如下MQ15.7μl,Mg2+2.5μl,Buffer2.5μl,dNTP1μl,Taq酶0.3μl,P11μl,P21μl,模板DNA1μl。PCR反應條件為95℃5′,95℃30″,56℃45″,72℃1′,72℃5′,共30個循環;反應結束后,取10μl反應產物電泳,若有與預期大小相符的擴增帶,則結果為陽性,若沒有,則結果為陰性;參入了5×103,5×102,5×101,和5個活菌的每份豬肉餡均在4對引物的PCR反應中得到陽性結果;參入0個活菌的豬肉餡在4對引物的PCR反應中得到陰性結果;說明使用上述方法時,這4對引物對豬肉餡中的大腸桿菌O58和痢疾志賀氏菌5的檢測靈敏度均為0.25個菌/g。
全文摘要
本發明提供一種對大腸桿菌O58和痢疾志賀氏菌5型的O-抗原特異的核苷酸,它是大腸桿菌O58和痢疾志賀氏菌5型中控制O-抗原合成的基因簇的核苷酸全序列,如SEQ ID NO1所示的分離的核苷酸,全長17769個堿基;或者具有一個或多個插入、缺失或取代的堿基,同時保持所述分離的核苷酸功能的SEQ ID NO1的核苷酸;還包括源于大腸桿菌O58和痢疾志賀氏菌5型的O-抗原基因簇中的寡糖單位處理基因的寡核苷酸;本發明通過PCR證實寡核苷酸對大腸桿菌O58和痢疾志賀氏菌5型的O-抗原都有高度的特異性;本發明還公開了用本發明的寡核苷酸檢測和鑒定人體及環境中的大腸桿菌O58和痢疾志賀氏菌5型的方法。
文檔編號C12P19/00GK1563062SQ20041001904
公開日2005年1月12日 申請日期2004年4月19日 優先權日2004年4月19日
發明者王磊, 楊靜華, 馮露 申請人:天津生物芯片技術有限責任公司