15/10/02说明:此前论坛服务器频繁出错,现已更换服务器。今后论坛继续数据库备份,不备份上传附件。

肝胆相照论坛

 

 

肝胆相照论坛 论坛 学术讨论& HBV English 存档 1 乙型肝炎病毒基因组中前-前-S区编码基因的界定 ...
查看: 1565|回复: 0

乙型肝炎病毒基因组中前-前-S区编码基因的界定 [复制链接]

Rank: 9Rank: 9Rank: 9

现金
101 元 
精华
帖子
3757 
注册时间
2002-10-6 
最后登录
2016-3-21 

荣誉之星

1
发表于 2003-9-8 04:21
摘要
目的: 乙型肝炎病毒(HBV)基因组内部结构基因与编码基因之间相互重叠,是基因组序列高度集中利用的一个典型. 早期研究中确定了编码病毒蛋白的4个开放读码框架(ORF),本研究通过对于中国HBV感染者的流行病毒株的基因序列进行分析比较,阐明基因组结构的特点,并探索是否存在新型ORF的可能性.

方法: 考虑到HBV基因组序列的准种特点以及多聚酶链反应(PCR)技术的精确度,我们采用的技术是长距离且精确PCR(LA-PCR)技术,根据中国HBV患者的病毒基因序列设计PCR扩增用引物,自慢性HBV感染患者外周血血清中扩增HBV基因组序列,克隆入pGEM Teasy质粒,挑选克隆进行全基因组DNA测序,与其他HBV基因组序列进行比较.

结果: 测序结果5株HBV全基因组核苷酸序列存在一新的ORF,定义为前-前-S区,并发现该区之前存在一TA富集区,提示存在新型启动子的可能性.新界定的前-前-S区ORF编码氨基酸序列为MQLIITSKLGIIYILCGRLVFY IREKLHAVPHFVGHHILGNKSYS,与前-S1、前-S2和表面抗原主蛋白编码基因框架一致表达.

结论: 在HBV基因组中存在有一新的ORF,命名为前-前-S区.

0   引言
乙型肝炎病毒(HBV)基因组全长3 200个核苷酸(nt)左右,为部分双链DNA病毒. 1979年Gelibert et al 发表了HBV基因组的第一个全长核苷酸序列[1, 2],长度为3 182 nt,血清型为ayw亚型,并在HBV基因组中界定了4个开放读码框架(ORF),分别命名为S、C、P、X区. 之后各种血清型的HBV基因组均被测序成功[3-6],并储存于GenBank中,我国学者[7,8]在1984年将中国大陆流行的adr亚型克隆测序成功. 4个ORF中表达的氨基酸长度不同,其生物学功能也不相同[9],其中全S区又因不同的起始密码子(ATG)而又人为的分为前-S1、前-S2和S三个区,前-S1、前-S2和表面抗原主蛋白是按照同一开放读码顺序(in frame)进行翻译的. 我们应用长距离并且精确PCR技术(long and accurate PCR,LA-PCR)研究了乙型肝炎患者血清中存在的HBV病毒子基因组,寻找新的ORF存在的证据,并在既往已克隆的HBV基因组中得到了证实.

1   材料和方法
1.1 材料  应用的LA-PCR试剂成套试剂均购自日本Takara公司,pGEM Teasy载体、玻璃奶试剂、和琼脂糖凝胶为Promega公司产品,细菌JM109为本室保存,蛋白酶K为Merck公司产品,酚、氯仿、氨苄青霉素、X-gal等均为国产试剂.

1.2 方法
1.2.1 血清来源和DNA分离  血清来源: 临床诊断为病毒性肝炎,乙型患者慢性2例,男女各1例,编码号分别为G683和G376,诊断均符合2000年西安会议《病毒性肝炎防治方案》 (试行)标准[10]. 临床检测表面抗原(HBsAg)、e抗原(HBeAg)、核心蛋白抗体(抗-HBc)阳性. 采集静脉血,蛋白酶K消化-饱和酚: 氯仿(1∶1)抽提法提取200 mL血清中的HBV DNA,-20 ℃保存备用.
1.2.2 多聚酶链反应(PCR)扩增目的片段  参考文献[11,12]中改进的全长HBV基因组扩增方法,设计引物为P1: 5'- CCG GAA AGC TTG AGC TCT TCT TTT TCA CCT CTG CCT AAT CA-3',P2: 5'- CCG GAA AGC TTG AGC TCT TCA AAA AGT TGC ATG GTG CTG G-3'.LA-PCR参数如下: 94 ℃预变性1 min,94 ℃变性60 s,55 ℃退火60 s,72 ℃延长5 min,共35个循环,72 ℃再延长10 min.
1.2.3 克隆目的片段  将PCR产物在10 g/L琼脂糖凝胶中电泳,切取长度为3.2 kb目的片段,玻璃奶法回收PCR产物,与pGEM Teasy载体连接. 将重组质粒转入细菌JM109,氨苄青霉素和X-gal蓝白斑法筛选阳性菌落,提取质粒进行限制性内切酶酶切分析鉴定.
1.2.4 DNA测序  选择经鉴定pGEM Teasy内插入3.2 kb产物的菌落送检测序,由上海博亚公司完成. 测序引物为pGEM Teasy载体自有的T7、SP6测序引物,同时根据测序结果设计测序引物进行序列测定,测序引物包括: P1: 5'-AGA TAG GGG CAT TTT GTG GT-3'; P2: 5'-ACG GGA CGT AGA CAA AGG AC-3'; P3: 5'-GGT TTC ACA TTT CCT GTC TT-3'; P4: 5'-CAT ATC CCA TGA AGT TAA GG-3'; P5: 5'-AAC TAC ACG CAG TGC CTC AT-3'. 测序结果存入美国国立卫生院GenBank中.
1.2.5 序列分析  应用DNA SIS对获得的5个克隆进行了ORF判读,并将推断的ORF翻译为氨基酸序列,应用Vector 6.0版软件对推定的ORF核苷酸序列与氨基酸序列与已经存储在GenBank中不同血清型的HBV核苷酸与氨基酸序列进行比较,血清型包括: adr[5,8]、ayr[4]、adw2[3]、adw4和ayw[1].

2   结果
2.1 HBV基因组核苷酸序列的测定  以2例乙型肝炎患者血清中抽提的HBV基因组为模板,应用TA克隆方法,将患者体内存在的HBV基因组克隆到测序载体中.经验证后,选择5个克隆测序,分别命名为G683-A1、G683-A2、G683-A3、G376-A6和G376-A7,获得的HBV基因组核苷酸长度分别为3 215、3 182、3 213、3 215和3 125 nt. 测序结果存入美国国立卫生院的GenBank中,序列号为AF363961、AF363962、AF363963、AF384371和AF384372.G683的3株克隆之间的同源性为97.5 %,G376的2株克隆之间的同源性为96.6 %,5株之间的同源性为93.6 %.
2.2 核苷酸序列的比较  通过序列分析,界定了4个主要ORF的长度,其中按照Gelibert最初定义的S区分析5株克隆的全S区ORF,包括前-S1、前-S2和主蛋白序列. 之后应用DNA SIS软件对上述5个克隆的ORF再分析过程中,发现在前-S1区的上游有一未定义的ORF,该区长135 bp,与前-S1、前-S2和S基因按照同一开放读码顺序(in frame)进行翻译,我们命名为前-前-S区. 为了排除选择样本的误差,在GenBank中选择不同血清型的全基因序列进行比较.选择的GenBank序列号为: D12980 (adr [5] ): 3 215 bp; G329616 (adr [8]): 3 221 bp; X04615 (ayr[4]): 3 215 bp; X02763 (adw2[3] ): 3 221 bp; Z35717(adw4): 3 221 bp和G329640 (ayw[1] ): 3 182 bp. 结果发现克隆株G329616、D12980、X04615存在前-前-S区ORF. 前-前-S基因的起始密码子为ATG,而克隆G329640为ATC,克隆X02763、Z35717为AGG,由于点替换突变导致表达终止.
        对前-前-S区上游核苷酸序列分析,发现存在一段TA富集区(TA-rich region),在前-前-S区起始密码子ATG上游有3段TA富基序列,无TATA-box结构,为TATA样盒(TATA-like box),分别为: ATG上游-8~-13: TATTAT; -17~-22: ATTAAA; -39~-46: AAATATTT.
2.3 氨基酸序列的比较  新的ORF长度为135 bp,编码45个氨基酸残基(aa),氨基酸残基序列为: MQLIIT SKLGIIYILCGRLV(A)FYIREKLHAVPHFV(A)GHHILGN KSYS,G683的3个克隆在第20和第30位均编码缬氨酸(V),而G376的2株克隆编码为丙氨酸(A).甘人宝et al [8]、Mukaide et al [5]、Okamoto et al [4]发表的克隆株的前-前-S区第20和第30位均编码A. 以G683的3个克隆编码的前-前-S多肽分析,该多肽Mr 5200左右,有19个疏水aa,10个极性aa,5个强碱性aa,1个半胱氨酸(C); 而G376的2个克隆编码的前-前-S多肽有21个疏水氨基酸残基.本研究5个克隆的前-前-S-大蛋白与其他克隆的比较见图1(略).
        在美国国立卫生院(NIH)的门户网站,应用BLAST软件,以G683-A1前-前-S区编码的推断氨基酸序列MQLIITSKLGIIYILCGRLVFYIREKLHAVPHFVGHHILGNKSYS进行搜索,发现存储的5个克隆有前-前-S区多肽序列,分别为BAA32849、S43492、CAA25747、BAA89327和CAB38230,氨基酸序列同源性分别为95 % (43/45)、93 % (42/45)、93 % (42/45)、77 % (35/45)和66 % (30/45).克隆BAA89327来自大猩猩[13].

3   讨论
1979年,Gelibert et al [1,2]首次报告了HBV基因组的全序列,并定位了4个ORF. 早期的研究学者大多采用将HBV基因组限制性内切酶消化后克隆入载体质粒中,之后进行测序的方法获得的全序列. 我国学者[7,8]于1984年报道了大陆HBV株(adr)的序列. 而后的学者多利用重叠引物PCR法扩增HBV基因,之后对PCR引物直接进行测序以揭示不同基因型、血清型之间的区别.目前在美国国立卫生院的GenBank中,存储了200多HBV全基因组序列,但之后的学者对4个ORF分区的界定并无异议.
        1995年,在分子生物学发展的基础上,Gunther et al [11,12]利用LA-PCR技术,之后以TA克隆法将患者体内的HBV基因组克隆到质粒载体中,该技术核心是应用DNA多聚酶具有3'-5'外切酶功能. 该方案保证了扩增片段与原模板之间的高度一致性,又展示了模板多样性,比Gelibert et al的研究方法简便,易于操作.本研究展示了同一患者来源的HBV基因组不同克隆之间的变异程度,G683的3株克隆之间的同源性为97.5 %,G376的2株克隆之间的同源性为96.6 %,5株之间的同源性为93.6 %,各个克隆之间均存有一定差异,证明患者血清内的序列是不完全相同的,符合准种表现. 本研究其他报道[13-22]以及其他学者近期的研究结果[23-26]证实了1990年代初病毒学家[27,28]提出的HBV准种假说.
        本研究在分析所获得的5个克隆的过程中,在前-S1区之前发现还存在一个ORF,长度135 bp,编码45 aa,命名为前-前-S区. 选择的GenBank中6个其他克隆株进行比较,其中3个克隆具有前-前-S区ORF,另3个克隆由于在前-前-S起始密码子的部位发生点替换突变而导致表达不能.应用DNA SIS软件的蛋白质分析功能分析了前-前-S、前-S1、前-S2和S基因的完全表达产物,前-前-S区较以往认为的大蛋白多出一个小的疏水区. 如果前-前-S区被证明是真实存在的,那么全S蛋白(含前-前-S区)与大蛋白有不小的差异. 其中的19(21)个疏水氨基酸在前-前-S区形成了一个小的疏水功能域,可能与蛋白的空间折叠或表面蛋白合成后分泌有关.前-前-S多肽推断氨基酸序列中含有6个亮氨酸(L),分别位于第3、9、15、19、27、39位,前3个L是否可形成亮氨酸拉链结构,尚需要进一步证实.
        我们应用了2种方法来证实前-前-S区的真实存在. 方法一是在GenBank中选择不同血清型的HBV基因组全序列,应用DNA SIS软件重新确定其ORF,结果发现甘人宝et al [8]、Mukaide et al [5]、Okamoto et al [4]克隆的HBV基因组序列中均存在前-前-S区ORF. 方法二是利用NIH网站的BLAST软件,将前-前-S区编码氨基酸序列输入后进行同源性搜索,结果发现已经存入GenBank中的序列中,有5个克隆中含有的氨基酸序列与本研究获得的序列有较高的同源性,分别为:  BAA32849[29] (1998年)、S43492[30] (1990年)、CAA25747[31] (1983年)、BAA89327[13] (2000年)和CAB38230 (资料未发表,1998年),氨基酸序列同源性分别为95 %、93 %、93 %、77 %和66 %. 综合上述2种方法证实的结果以及我们的资料,可以肯定前-前-S区是实际存在的,来源于不同的地域的HBV克隆株均有前-前-S区的明确编码. 前-前-S区ORF最早在1983年Fujiyama et al [31]克隆的adr亚型的S基因产物中被提及,作者认为存在一身份不明的ORF(unidentified reading frame (s gene)); 而Mimms et al [32]将克隆S43492进行再分析后,认为该段多肽是前-S1多肽内部,他们认为的前-S1长度为164 aa,而不是通常认为的119 aa或108 aa.我们认为多种资料的研究结果证明前-前-S区的存在,以往的研究认为该区的编码并不是一种普遍现象,因而未加以重视. Bruss et al [33,34]界定了HBV表面抗原大蛋白的基因结构之后,其他学者多认同这一观点,Gerlich et al [35]或其他教科书均未提及前-前-S区的存在.我们分析的结果提示具有前-前-S区的HBV克隆株多来自日本和中国,欧美学者在最初的研究中获得的样本存在一定的偏差,这可能是忽视该区域的原因之一. 另外,由于目前仍缺乏对HBV的大规模分子流行病学资料,因而早期发现前-前-S区的学者可能认为一些位点发生变异,而不认为这是一种主流现象,但我们自抽取其他学者获得的克隆中发现前-前-S区,应当认为前-前-S区的存在不是一种个别现象,至少在中国和日本是非常常见的. 由于HBV表面抗原不仅是病毒遗传结构的包装蛋白,而且截短型表面抗原中蛋白[36,37]和大蛋白[38]具有反式激活作用,这种功能与是表面抗原的多种形式激活癌基因有关[39],我们的早期研究已经证明了HBV截短型表面抗原中蛋白和X蛋白[40-42]具有强大的反式激活作用,进一步将研究前-前-S-大蛋白完全表达产物是否具有反式激活作用.
        来源于G683的三个克隆在前-前-S多肽的第20和第30位均编码V,而G376的2株克隆和甘人宝et al [8]、Mukaide et al [5]、Okamoto et al [4]发表的克隆株在这2个位点编码为疏水氨基酸A,这印证了我们[43-45]以前的关于HBV在不同患者体内存在个体化变异的报告.
        作为完整的基因,ORF之前应当存在启动子区域,经过比较发现在前-前-S区上游存在一段TA富集区.在前-前-S区起始密码子ATG上游有3段TA富集序列,无真核基因所特有的TATA-box结构,仅有TATA样盒,分别位于: TA1: TATTAT,ATG上游-8~-13 bp;  TA2: ATTAAA,上游-17~-22 bp; TA3: AAATATTT,上游-39~-46 bp.如继续上溯,在距前-前-S区ATG上游-79~-90 bp处有一长的TA区,为ATTAAAATTAATT AT. 这段上游序列中是否具有启动子功能,尚需要验证.在前-前-S区内,存在前-S区启动子1(SP I)[46],具有典型的TATA结构; 在前-S1区内,存在SP II[47]. SP I和SP II分别调控既往定义的大蛋白和中/主蛋白的表达[48-50]. 我们的初步分析认为前-前-S区之前可能存在一启动子区,如经实验证实其启动子作用,其功能为调控前-前-S区与大蛋白的融合表达. 我们已确立了检测启动子活性的方法[51,52],进一步的工作将验证SP III的存在.
        总之,在HBV前-S1 ORF之前存在有一融合编码的ORF,我们将其命名为前-前-S区. 前-前-S区之前可能有一新的启动子区域(SP III).如前-前-S多肽的表达得到进一步证实,将对HBV感染的检测、疫苗设计、HBV进入肝细胞机制(受体学说)、表面抗原的表达过程及功能、宿主抗感染机制、HCC产生机制研究均产生重大影响.

4     参考文献 (略)


——董菁, 成军, 中国人民解放军第302医院传染病研究所基因治疗研究中心、全军病毒性肝炎防治研究重点实验室  北京市  100039

[B][color=17,203]Hbvers of all countries,unite![/B]
‹ 上一主题|下一主题

肝胆相照论坛

GMT+8, 2024-10-9 00:41 , Processed in 0.021459 second(s), 11 queries , Gzip On.

Powered by Discuz! X1.5

© 2001-2010 Comsenz Inc.