基因

基因(Gene)又称遗传因子,是产生一条多肽链或功能核糖核酸所需的全部核苷酸序列。基因支持着生命的基本构造和性能,储存着生命的种族、血型、孕育、生长、凋亡等过程的全部信息。它是细胞内遗传物质的最小功能单位。

基因是由成百上千个核苷酸对组成,负载有特定遗传信息的脱氧核糖核酸片段,一般包括DNA编码序列、非编码调节序列和内含子。在原核生物中,一个基因就是DNA分子的一个片段;但在真核生物中,一个基因可以是DNA分子的一个片段或是若干片段的组合。基因的功能是编码生物活性物质,通过复制、转录、表达,完成生命繁衍、细胞分裂和蛋白质合成等重要生理过程。其产物为各种核糖核酸和蛋白质。基因具有双重属性:物质性和信息性。生物体的生、长、病、老、死等一切生命现象都与基因有关。它也是决定生命健康的内在因素。基因是控制生物性状的基本遗传单位。通常,组成简单生命最少要265到350个基因。而人类基因组包含大约4万个基因,其中约2.5万个为蛋白质编码基因,其余1.5万个为非编码RNA基因,此外还有大约1万个假基因。

1865年,格雷戈尔·孟德尔提出生物性状的遗传是由遗传因子控制的,遗传因子的传递遵循分离规律和自由组合规律。1909年,丹麦遗传学家约翰逊用基因(gene)这个词代替了遗传因子,并沿用至今。1953年,沃森和弗朗西斯·克里克提出了著名的DNA双螺旋结构模型。1955年,S.本泽发现在一个基因内部的许多位点上可以发生突变,并且可以在这些位点之间发生交换,从而说明一个基因是一个功能单位。1973年,美国赫伯特·博耶(Herber Boyer)教授和斯坦利科恩(Stanley Cohen)教授共同完成了一项实验,获得了具有两个复制起始位点的新的脱氧核糖核酸,将不同物种的基因组合在一起。自此,基因工程技术已应用在医疗健康、药物开发生产、农业育种、食品工业等领域,并取得了巨大社会和经济效益。

定义

基因:负责编码核糖核酸或多肽链的DNA片段,是DNA或RNA分子上具有特定功能的核苷酸序列(包括编码序列、编码序列外的侧翼序列及插入序列)。它位于染色体上,并在染色体上呈线性排列。它不仅可以通过复制把遗传信息传递给下一代,还可以使遗传信息得到表达,从而使后代表现出与亲代相近的表型。

基因是遗传变异的主要物质,支配着生命的基本构造和性能,具有物质性和信息性。在遗传算法中,基因是指字符串中的元素,用于表示个体的特征。例如有一个串S=1011,则其中的1,0,1,1这4个元素分别称为基因,它们的值称为等位基因(Alletes)。

简史

词源由来

早在1865年,格雷戈尔·孟德尔提出生物性状的遗传是由遗传因子控制的,遗传因子的传递遵循分离规律和自由组合规律。

1866年,奥地利学者G.J.孟德尔在他的豌豆杂交实验论文中,用大写字母A、B等代表显性性状如圆粒、子叶黄色等,用小写字母a、b等代表隐性性状如皱粒、子叶绿色等。他并没有严格地区分所观察到的性状和控制这些性状的遗传因子。但是从他用这些符号所表示的杂交结果来看,这些符号正是在形式上代表着基因,而且至今在遗传学的分析中为了方便起见仍沿用它们来代表基因。

1909年,丹麦遗传学家约翰逊在其《精密遗传学原理》一书中根据希腊语“给予生命”之义,用“基因(gene)”一词来代替格雷戈尔·孟德尔假定的“遗传因子”,正式提出了“基因”的概念。

研究史

1902年,加罗德(Garrod)提出尿黑酸尿症的病因是体内缺乏与某种生化反应相关的酶。1908年,英国医生加罗德(A.Garrod)通过对人类一种先天性代谢疾病—苯丙酮尿症(PKU)的研究,认为基因是通过控制酶和其他蛋白质的合成来控制细胞代谢的,首次提出基因与酶之间的关联,使人们开始把基因与酶联系起来。

1910年,托马斯·摩尔根和他的学生用不同品系果蝇的杂交、测交实验证实:基因位于染色体上,且呈直线排列,并提出了遗传学第三基本定律—连锁与互换定律。1911年摩尔根又在果蝇的X连锁基因白眼和斑胸短翅蝗莺两品系的杂交子二代中,发现了白眼、短翅果蝇和正常的红眼长翅果蝇,首先指出位于同一染色体上的两个基因可以通过染色体交换而分处在两个同源染色体上,交换是一个普遍存在的遗传现象。

1926年,摩尔根创立了《基因论》,提出基因载有生物的遗传信息,它是控制生物特定性状的功能单位,同时还是一个基本的突变单位和交换单位,即所谓的“三位一体”概念。也因此获得诺贝尔奖

1936年,比德尔(Beadle)等对果蝇朱砂眼型、朱红眼型和野生型进行研究,再次证实了基因与酶的关系。

1941年,比德尔(G.W.Beadle)和爱德华·塔特姆(E.L.Tatam)通过对红色面包菌营养缺陷型的研究,认为基因是通过控制酶来影响生物体的代谢反应,提出了“一个基因一种酶”的假说,发展了微生物遗传学和生化遗传学。随后,通过对人类镰刀形细胞贫血症的研究,人们发现基因决定了多肽链中氨基酸的序列,由此提出了“一个基因一条多肽链”的假说。之后人们又认识到,基因的功能产物不仅仅是蛋白质,还有转运RNA和rRNA等。

1944年奥斯瓦德·艾弗里肺炎双球菌体外转化实验和1952年赫尔希和蔡斯的T2噬菌体侵染实验等都直接证明了脱氧核糖核酸是遗传物质,基因的化学本质就是DNA。至此,人们对基因概念的内涵进一步清晰,基因是染色体上一个特定的DNA区段,决定着生物性状的遗传。

1951年,美国的遗传学家芭芭拉·麦克林托克(B.McClintock)根据对玉米籽粒颜色的长期研究,发现某些基因的位置是不固定的,可以在染色体上跳跃,称之为跳跃基因(jumping gene)。即基因可以在染色体上从一个位置跳到另一个位置,还可以从一条染色体跳到另一条染色体上。随后在原核生物真核生物中,都发现了基因组中某些成分位置的不固定性。人们把这种能够自发转移的遗传基因也叫作转座因子。转座因子还有调控其他基因开闭的功能。

1953年,沃森和弗朗西斯·克里克提出了著名的DNA双螺旋结构模型以后,人们对基因的本质有了进一步的认识,即基因是具有遗传效应的DNA片段。

1955年,S.本泽用大肠杆菌T4噬菌体作材料,研究快速溶菌突变型rⅡ的基因精细结构,发现在一个基因内部的许多位点上可以发生突变,并且可以在这些位点之间发生交换,从而说明一个基因是一个功能单位,但并不是一个突变单位和交换单位,因为一个基因可以包括许多突变单位(突变子)和许多重组单位(重组子)。1957年,本泽(S.Benzer)开展的噬菌体突变型顺反测验。他以大肠杆菌T4噬菌体为材料,在脱氧核糖核酸分子结构水平上分析了基因内部的精细结构,发现在一个基因内部的许多位点可以发生突变,而且这些位点之间可以交换,打破了托马斯·摩尔根“三位一体”的基因概念,并提出了顺反子学说。顺反子学说首次把基因定义为DNA分子。

1961年,法国的科学家雅可布(F.Jacob)和莫诺(J.L.Monod)通过大肠杆菌乳糖代谢实验,提出了操纵子(operon)模型学说。该学说认为,并不是所有的基因都能编码功能蛋白,能编码功能蛋白的基因称为结构基因。某些脱氧核糖核酸片段虽不进行转录,如启动基因、操纵基因等,但对结构基因的表达起着重要的调控作用。

1969年,J·夏皮罗等从大肠杆菌中分离到乳糖操纵子,并且使它在离体条件下进行转录,证实了一个基因可以离开染色体而独立地发挥作用,于是颗粒性的遗传概念更加确立。随着重组DNA技术和核酸的顺序分析技术的发展,对基因的认识又有了新的发展,主要是发现了重叠的基因、断裂的基因和可以移动位置的基因。

到20世纪70年代末,人们一直认为基因的编码序列是连续的、不间断的。1973年,美国赫伯特·博耶(Herber Boyer)教授和斯坦利科恩(Stanley Cohen)教授共同完成了一项实验,获得了具有两个复制起始位点的新的脱氧核糖核酸,将不同物种的基因组合在一起。1977年,美国的夏普(P.A.Sharp)和罗伯茨(R.J.Roberts)通过研究腺病毒科的基因序列发现了断裂基因,即在基因编码序列中插入了非编码序列。使人们逐渐认识到绝大部分真核基因的编码序列是不连续的,它们常被一些非编码的DNA序列间隔开来,形成一种断裂结构,这些非编码的DNA序列在转录后的mRNA加工过程中被剪切掉。1978年,唐娜戛纳(Tonagana)把断裂基因中的编码序列叫作外显子(exon),把非编码的间隔序列叫作内含子(intron)。同年,英国桑格(F.Sanger)通过对X174噬菌体环状DNA全部核苷酸序列的测定,发现其编码9种多肽的2000个氨基酸只有5375个碱基组成,提出了重叠基因,即两个或两个以上的基因共用一段DNA序列。

1990年,由诺贝尔奖获得者雷纳多·杜尔伯克发起,美国、英国、法国德国日本、中国以及丹麦俄罗斯韩国意大利等多国参加,共同开展研究的人类基因组计划(human genome project,HGP)正式启动。2006年,人类基因组计划最后一个1号染色体测序完成。

2007年5月,剑桥大学伦敦大学英国癌症研究院研究发现,有4种基因若发生变异可导致乳腺癌患病风险增加,其中有3个参与调控细胞的生长。。已经确定的4个基因包括FGFR2和TNRC9基因,一名女性如果有任何一个基因的一个变异副本,患乳腺癌风险将增加20%,如果有一个基因的两个变异副本,患病风险将提高40%—60%,而致命风险将从1/11增加至1/7甚至1/6。如果拥有其他两个基因中任何一个变异副本,患病风险将增加10%。研究小组在进一步检测第5个疑似基因是否与乳腺癌有关。

2016年11月2日,据英国每日邮报报道,女性生育的时间与基因存在关联。科学家通过研究发现特定的基因变异能够让生育期更长、更年期更迟,从而使一些女性拥有高于常人10%的生育率。Mills教授和其他250名研究员一起,通过对33万男女生育信息进行统计和分析,结果发现基因能够影响一个人首次性行为的时间,另外对首次怀孕的年龄以及更年期何时到来均有影响。

2022年8月,中国计量科学研究院复旦大学历时六年半,成功研制中华家系1号(同卵双胞胎家庭)人源B淋巴细胞系全基因组脱氧核糖核酸序列和全转录组核糖核酸标准物质,在日前召开的基因组测序质量及计量标准交流会上正式发布。该系列标准物质填补了国内外空白,将为基因测序的可靠性提供保障。

2022年12月13日,英国宣布了一项史无前例的研究计划,将从2023年底开始对10万名婴儿的基因组进行测序,旨在更好地检测和治疗遗传疾病。该项目由1.05亿英镑(约合1.22亿欧元)的公共资金支持,将研究是否应在全国范围内对新生儿的常规体检期间进行这类基因测序,以避免在诊断罕见疾病方面耽误数年时间。

2023年2月8日,英国剑桥大学的研究人员在《自然·生物技术》杂志上发表的一篇论文中提出了一种新的DNA测序法,可检测小分子药物与基因组之间的特定位置和相互作用。研究人员创造了一种名为Chem-map的新脱氧核糖核酸测序技术,能够以前所未有的精度原位绘制小分子—基因组相互作用。该技术表明,在暴露于组蛋白脱乙酰酶(HDAC)抑制剂西达本胺细胞上使用阿霉素的联合治疗,可能具有潜在的临床优势。这项技术还被用来绘制DNA G-四链体上某些分子的结合位置,即G4s。G4s是四链二级结构,与基因调控有关,可能成为未来抗癌治疗的靶点。

2023年,德国马克斯·普朗克分子细胞生物学与遗传学研究所研究人员开发出可对数百种动物进行基因比较的新方法,能非常准确地确定直系同源基因。

特性

基因主要有以下3个基本特性:

1、复制特性:脱氧核糖核酸通过以其自身为模板合成2分子完全相同的DNA分子,这样保证了亲代的遗传信息稳定地遗传到子代中去。核糖核酸也可通过复制(以RNA为模板合成RNA)或逆转录(以RNA为模板合成DNA)过程把遗传信息一代一代传下去。

2、决定表现型:基因通过转录和翻译等过程把基因中的碱基排列顺序转变为蛋白质中氨基酸的排列顺序,决定了各种蛋白质的功能,体现出种种性状(表现型)。

3、突变特性:突变是指基因分子中一个或几个核苷酸的异常变化。突变是生物进化、细胞分化的分子基础,是一种自然现象。但是,有些突变也可引起人类的多种疾病。

分类

按功能分

基因按功能可分为结构基因、调控基因和核糖核酸基因3类。

1、结构基因:结构基因是指能转录成mRNA并通过mRNA指导蛋白质或多肽链合成的基因。1941年美国生化遗传学家G·W·比德尔和生化学家E·L·塔特姆提出的“一个基因一个酶”的假说中所指的基因就是结构基因。人体内形形色色的蛋白质是结构基因表达的产物。

2、调控基因:可调节和控制结构基因表达的基因叫调控基因。人体的调控基因是各种被称为顺式作用元件的脱氧核糖核酸序列。主要有启动子、增强子和沉默子。

3、核糖核酸基因:这是指只转录而不翻译的基因,如:指导rRNA合成的DNA序列—rRNA基因:指导转运RNA合成的DNA序列—tRNA基因(tD-NA)。这类基因的特点是具有高度重复序列

按基因产物分

根据基因产物的不同形式,可以将其分为以下3种类型:

1、编码基因:编码基因就是编码蛋白质的基因,这类基因经转录、翻译之后最终产物为功能蛋白质。包括:结构蛋白、酶蛋白、免疫蛋白、转运蛋白、运动蛋白、调节蛋白等的基因。

2、非编码核糖核酸基因:非编码RNA基因是指经转录产生对应的RNA分子,但不翻译,也没有相应蛋白质产物的一类基因。非编码RNA常与其他蛋白形成配位化合物来行使其功能。非编码RNA参与核酸、蛋白质的加工和转运过程,以及不同水平的基因表达调控。在基因组上非编码RNA基因的分布包括编码基因间隔区及编码基因的内部区域。

3、不转录基因:不转录基因是指不转录的脱氧核糖核酸片段,如原核生物操纵子中的启动基因是发出转录的起始信号,操纵基因是控制结构基因的转录速度,虽然其本身不转录,但能控制结构基因转录的起始及速度。

按排列位置分

基因线性排列于染色体上,由DNA或者核糖核酸组成,但是大部分生物的基因都由DNA组成,只有某些病毒的基因由RNA构成。

1、核基因:在真核生物中,由于染色体都在细胞核内,所以又称核基因。

2、细胞质基因或核外基因:而位于线粒体叶绿体细胞器中的基因,称为细胞质基因或核外基因。

3、等位基因:在核基因或细胞质基因中都储存着遗传信息。每个基因在染色体上都有着特定的位置又称基因座。在同源染色体上占据相同基因座的不同形态的基因称为等位基因。不同的等位基因可以造成如发色或血型等遗传特征的差异。等位基因控制相对性状的显隐性关系及遗传效应,可将等位基因区分为不同的类别。在个体中,等位基因的某个形式(显性的)可以比其他形式(隐性的)表达得多。

4、显性基因、隐性基因:在杂合体中,两个不同的等位基因往往只表现一个基因的性状,这个基因称为显性基因,另一个基因则称为隐性基因。

5、复等位基因:在二倍体的生物群体中等位基因往往不止两个,基因如果存在多种等位基因的形式,这种现象就称为复等位基因。任何一个二倍体个体只存在复等位基中的两个不同的等位基因。在完全显性中,显性基因中纯合子和杂合子的表型不同。在不完全显性中,杂合子的表型是显性和隐性两种纯合子的中间状态。这是由于杂合子中的一个基因无功能,而另一个基因存在剂量效应所致。完全显性中杂合体的表型是兼有显、隐两种纯合子的表型。比如决定人类ABO血型系统四种血型的基因IA、IB、i,每个人只能有这三个等位基因中的任意两个。

6、拟等位基因:有一部分早期认为是属于复等位基因的基因,实际上并不是真正的等位,而是在功能上密切相关、在位置上又邻接的几个基因,它们称为拟等位基因。拟等位基因不仅在功能上和真正的等位基因很相似,而且在转位后能产生突变体表现型。它们不仅存在于果蝇中,而且在玉蜀黍属中也已发现,特别在某些微生物中发现的频率相当高。

7、同等位基因:某些表型效应差异极少的复等位基因的存在很容易被忽视,通过特殊的遗传学分析可以分辨出存在于野生群体中的几个等位基因。这种从性状上难以区分的复等位基因称为同等位基因。许多编码同工酶的基因也是同等位基因。

按蛋白质的作用分

根据基因编码的蛋白质的作用把基因分为结构基因和调节基因2种类型:

1、结构基因:凡是编码酶蛋白、血色素胶原蛋白晶体蛋白等蛋白质的基因都称为结构基因;

2、调节基因:凡是编码阻遏或激活结构基因转录的蛋白质的基因都称为调节基因。

按作用时间分

一个生物体内的各个基因的作用时间常不相同,可分为:

1、早期基因:有一部分基因在复制前转录,称为早期基因。

2、晚期基因:有一部分基因在复制后转录,称为晚期基因。

3、多效基因:一个基因发生突变而使几种看来没有关系的性状同时改变,这个基因就称为多效基因。

按相互作用分

生物的一切表型主要是蛋白质活性的表现。换句话说,生物的各种性状几乎都是基因相互作用的结果。所谓相互作用,一般都是代谢产物的相互作用,只有少数情况涉及基因直接产物,即蛋白质之间的相互作用。

非等位基因

依据非等位基因相互作用的性质可以将它们归纳为:

等位基因

1932年H.J.马勒依据突变型基因与野生型等位基因的关系归纳为无效基因、亚效基因、超效基因、新效基因和反效基因。

人类基因分类

基因是控制生物性状的基本遗传单位。通常,组成简单生命最少要265到350个基因。而人类基因组包含大约4万个基因,其中约2.5万个为蛋白质编码基因,其余1.5万个为非编码RNA基因,此外还有大约1万个假基因。人类的基因的功能序列可分为四大类,即单一基因、基因家族、假基因和串联重复基因。

1、单一基因:人类基因组中,25%~50%的蛋白质基因在单倍体基因组中只有一份或少数几份,故又称之为单一基因(solitary gene),也称为不重复序列。在单倍体基因组中,这些序列包括编码蛋白质和酶的结构基因以及基因的间隔序列。

2、基因家族:有许多基因不完全是单拷贝,而是重复的多拷贝,但不同拷贝之间还略有差异,这一部分基因属于两个或更多个相似基因的家族。在脊椎动物中,这类成倍基因约占编码蛋白质基因的一半。它们编码的蛋白质相似,但其氨基酸顺序不完全相同,称之为基因家族(genefamily)。

3、假基因:在各基因家族中,某些与正常功能基因在核苷酸序列上相似,但不能转录或转录后生成无功能基因产物的脱氧核糖核酸序列,被称为假基因(pseudogene)。假基因常用符号来表示。如人β珠蛋白基因家族中的ψβ1和ψβ2与有功能的β珠蛋白基因相似,但是没有相应的蛋白质产生,所以称为假基因。

4、串联重复基因:45SrRNA、5SrRNA、各种转运RNA基因以及蛋白质家族中的组蛋白基因是呈串联重复排列的,这类基因称为串联重复基因(tandemly repeated genes)。它们不同于成倍基因,编码了同一种或近乎同一种的RNA或蛋白质,rRNA基因的每个拷贝完全或几乎完全相同,但是在基因间的间隔DNA(linker 脱氧核糖核酸)序列上相差很大,组蛋白基因家族较复杂,但每种组蛋白基因的拷贝也完全相同。

结构

不同基因的大小差别很大,小的只有约100bp,大的则可达2.3x106bp。但是,大多数基因的大小为104~106bp。至今所发现的与疾病有关的最大基因是位于X染色体短臂上能编码肌营养不良蛋白(dystrophin)的基因,其大小超过2x106bp,此基因的变异可以导致临床上常见的杜兴型肌营养不良症(Duchenne muscular dystrophy,DMD)。不管基因大小如何,其基本结构都一样,包括外显子、内含子启动子、增强子和终止子等重要组成部分。外显子和内含子是基因的主要部分。启动子、增强子和终止子等统称为侧翼序列(flanking sequence)。侧翼序列不编码蛋白质,但对基因的表达起调控作用。

外显子与内含子

原核生物的基因是连续编码的一个脱氧核糖核酸片段。而真核生物生物的基因是断裂基因,它们常被一些非编码的DNA序列间隔开,形成断裂结构。这些非编码的DNA序列在转录后的加工过程中被剪切掉,不包含在成熟m核糖核酸的序列中。我们把断裂基因中的编码序列叫作外显子,把非编码的间隔序列叫作内含子。断裂基因一般由若干个外显子和内含子组成。在每个外显子和内含子的接头处,有一段高度保守的共有序列,即每个内含子的5'端起始的两个核苷酸都是GT,3'端末尾的两个核苷酸都是AG,这也是RNA剪接的信号,这种接头形式称为GT-AG法则。

原始转录产物RNA经剪接加工后成为成熟的mRNA,按照mRNA所编码的遗传信息,从起始密码子开始,翻译出特定的蛋白质或组成蛋白质的多肽亚基,到终止密码子结束。其间不存在任何终止密码,这一区域被称为开放阅读框(ORF)。

侧翼序列与调控序列

在每一个结构基因的第一个和最后一个外显子的外侧,都有一段不被转录和翻译的非编码区,叫作侧翼序列。其中从转录起始位点至起始密码子的这一段非翻译序列称为5'非翻译区(5'-UTR),从终止密码子至转录终止子的这一段非翻译序列称为3'非翻译区(3'-UTR)。侧翼序列虽然不能被转录和翻译,但却含有影响基因有效表达的脱氧核糖核酸序列。其中有些控制基因转录的起始和终止,如启动子、终止子;有些确定翻译过程中核糖体与m核糖核酸的结合,如核糖体结合位点;而另一些则与基因接受某些特殊信号有关,如加帽和加尾信号。这些对基因的准确表达起着调控作用的特殊序列统称为调控序列,主要包括以下几种:

一、启动子(助催化剂

启动子是指准确而有效地起始基因转录所需的一段特异的核苷酸序列。通常把转录起始位点记为+1,下游区域记为正区,上游区域记为负区。启动子通常位于转录起始位点上游100bp(-100bp)范围内,是RNA聚合酶识别和结合的区域,控制着基因转录的起始过程。

1、原核生物生物基因启动子含有两段保守序列结构

2、真核生物基因启动子结构要比原核生物基因的复杂,主要包括三种不同的序列(或元件)

二、终止子(terminator)

终止子是一段位于基因3'-UTR中与终止转录过程有关的序列。它由一段富含GC的反向重复序列以及6个寡聚的T组成,是核糖核酸聚合酶停止工作的信号。终止子与启动子不同,在这里真正起终止作用的不是脱氧核糖核酸序列本身,而是转录生成的RNA。当RNA转录到达终止子区域时,其自身形成了发夹式的结构,发夹式结构的末端形成6个寡聚的U串。发夹式的结构阻碍了RNA聚合酶的移动,寡聚的U串与DNA模板中A的结合不稳定,导致RNA聚合酶离开模板,终止转录。

三、加帽

真核生物mRNA的5'端都有一个帽子结构,它是在mRNA的5'端通过三磷酸酯键以5'-5的方式连接一个7-甲基鸟苷基团(m7G)形成的。这个帽子结构并不在脱氧核糖核酸序列上编码,而是在转录后mRNA的加工过程中形成的。

四、加尾信号

真核生物mRNA的3'端都有一段多聚的腺苷酸A尾巴(polyA tail),它不是由基因编码的,也是在转录后mRNA的加工过程中,通过多聚腺苷酸聚合酶作用加到mRNA上的。大部分真核基因在polyA加入位点上游15~30bp区域内存在一段高度保守的DNA序列,即为加尾信号序列。动物基因的加尾信号序列为AATAAA,它指导核酸内切酶在此序列下游15~30bp处的特定位点上裂解前体mRNA,在多聚腺苷酸聚合酶的催化作用下,在3'-OH上逐一引入100~300个腺嘌呤核苷酸。

五、增强子(enhancer)

增强子是一段特定的脱氧核糖核酸序列,也是一种基因表达的调控序列,它可以使启动子发动转录的能力显著增强,从而大大地提高基因的转录效率。一般长约50bp,多为重复序列,不同基因中的增强子序列差别较大,但都含有一个基本的核心序列,即(G)TTGA/TA/TA/T(G)。有人将珠蛋白基因放入含有72bp重复的DNA分子中,它的转录活性提高约200倍,当此72bp重复序列距转录起点1400bp或更远处时仍有作用。说明增强子的作用与它所处的位置、方向及与基因间的距离无关。无论它处于基因的上游、下游,还是基因的内部,无论其方向是5'→3'还是3'→5',无论是在距转录起点前后3000bp或更远处,增强子都能发生作用。另外增强子具有组织特异性和细胞特异性,例如免疫球蛋白基因的增强子只有在B淋巴细胞中活性最高。

六、沉默子(silencer)

沉默子是另一种与基因表达有关的调控序列,参与基因表达的负调控过程,其作用与增强子相反。它通过与有关蛋白质的结合,对转录起抑制作用,根据需要关闭某些基因的转录。与增强子相似之处是,沉默子也可以远距离作用于启动子,对基因的阻遏作用也没有方向性的限制。

七、核糖体结合位点

原核生物基因翻译起始位点附近有一组特殊的序列,控制着基因翻译的起始过程。其中最主要的一种是SD序列,它存在于mRNA的5'-UTR中,位于起始密码子之前10个碱基内,含有一个富含嘌呤六聚体AGGAGG的一部分或全部。SD序列是mRNA与核糖体的结合序列,通过与16SrRNA3'端CCUCCU的结合,对翻译起始配位化合物的形成和翻译的起始起着重要作用。

信号肽序列

在分泌蛋白基因的编码序列中,在起始密码子之后,有一段编码富含疏水氨基酸多肽的序列,称为信号肽序列。它所编码的信号肽行使着运输蛋白的功能。信号肽在核糖体合成后,与细胞膜上的特定受体相互作用,产生通道,使分泌蛋白穿过细胞的这种膜结构,到达相应的位置发挥其功能。信号肽在完成蛋白分泌过程后被切除,不留在新生的多肽链中。例如小鼠的激肽释放酶基因,编码含有265个氨基酸的蛋白质,其中含有一个长17个氨基酸的信号肽,该信号肽与内质网膜上的特殊受体相互作用,将与之相连的翻译初始物—原激肽释放酶原运输通过内质网膜结构。信号肽的使命完成后,通过酶切被除掉,形成激肽释放酶原。激肽释放酶原分泌到细胞表面后,进一步加工,除去多肽链中起始的11个氨基酸,最后形成有活性功能的激肽释放酶。

真核生物

大多数真核生物包括人类的基因,其编码序列在脱氧核糖核酸分子上是不连续的,被非编码序列间隔开,称为断裂基因(split gene);这是真核生物结构基因的组成特点。断裂基因主要由转录区和侧翼序列构成。

转录区

转录区是从转录起始点到转录终止点的区域,包括前导区、编码区和尾部区。

1.前导区(leader region):真核基因的5'端转录起始点与翻译起始点之间的核苷酸序列是不编码蛋白质的,称为前导区或5'非翻译区(5'untranslated region,5'UTR),该区序列对起始AUG的选择有一定的影响,也对m核糖核酸的翻译起着重要的调控作用。

2.编码区(coding region):是自起始密码至终止密码的一段DNA序列。包括外显子与内含子。外显子(exon)是基因内的编码序列,两个外显子之间的无编码作用的间隔序列称为内含子(intron)。内含子只转录,在转录后的RNA加工过程中被剪切掉,成熟的mRNA中无内含子序列。每个外显子和内含子的接头区都有一段高度保守的序列,一般内含子的5'端起始处有GT序列,3’端尾部有AG序列,称为GT-AG法则,它是真核生物基因转录后核糖核酸加工过程中内含子剪切与外显子拼接的识别信号。

3.尾部区(tailer sequence):3'端翻译终止点到转录终止点之间的序列称为尾部区或3'非翻译区(3'untranslated region,3'UTR),3'UTR主要含有终止信号及加尾信号

侧翼序列

真核基因转录区的两侧5'端和3'端都有一段不被转录的序列,称为侧翼序列(flankingsequence),主要有启动子和增强子,对基因的转录起调控作用。

1.启动子(助催化剂)一般位于基因转录起始点上游的100bp范围内,是核糖核酸聚合酶结合的部位,能促进转录过程,它包括以下几种不同序列。

2.增强子(enhancer)位于启动子上游或下游的一段DNA序列,能够起增强转录的作用。它不能启动一个基因的转录,但能明显地提高基因转录的效率。增强子有时也会出现在基因内部(内含子中),在距启动子几至几十kb处也可发挥作用。此外,增强子序列可与特异性细胞因子结合从而表现出组织特异性,对基因表达有组织、器官、时间等不同方面特异性的调节作用。

3.超级增强子(super enhancer)是一类具有超强转录活性的远端脱氧核糖核酸序列,跨度范围可达8~20kb,远高于200~300bp的普通增强子。超级增强子拥有更多的转录因子结合位点,调控基因表达的能力也更强。

功能

基因的功能是编码生物活性物质,其产物为各种核糖核酸蛋白质。但并不是所有的基因都能行使蛋白质编码的功能。比如某些基因在转录RNA后不再翻译成蛋白质(rRNA基因,转运RNA基因),而是在RNA水平上行使其功能;另外也有部分基因尽管也是DNA序列中的一个特定区段,但它并不是合成蛋白质的模板,而是对其他基因的表达起调节或识别的功能。

基因的功能主要包括三个方面:储存生物性状的遗传信息;准确地进行自我复制;通过基因表达,控制细胞内蛋白质和酶的合成,从而决定和维持生物体的表型。

遗传信息的储存

经过多年的研究证实,在脱氧核糖核酸脱氧核糖核苷酸长链上3个相邻碱基序列构成一个三联体,每个三联体密码能编码某种氨基酸,所以三联体是遗传信息的具体表现形式。因而三联体又称三联体密码(triplet code)、遗传密码(genetic code)或密码子(codon)。近年来的研究发现,三联体密码属于由DNA序列提供的传统意义上的遗传信息,还有一类基因组遗传信息是表观遗传信息,即基因组DNA的修饰,它提供了何时、何地、以何种方式去应用脱氧核糖核酸遗传信息的指令。

基因的复制

基因的复制是伴随着DNA复制而实现的,DNA的复制方式为半保留、半不连续复制。

基因的表达

基因表达(gene expression)是指存在于基因中的遗传信息,通过转录和翻译转变为由特定的氨基酸种类和序列构成的多肽链,再由多肽链构成蛋白质,从而形成生物体特定性状的过程。

转录

以DNA为模板,在RNA聚合酶作用下合成核糖核酸的过程称为转录(transcription)。真核生物生物及人类的转录过程在细胞核中进行。

1、转录的过程转录是脱氧核糖核酸分子上的遗传信息传递到RNA的过程。转录时,以DNA双链中3'→5'单链为模板链,按碱基互补配对原则,以4种三磷酸核苷酸(ATP、GTP、CTP、UTP)为原料,在启动子的控制下,在RNA聚合酶的催化下,从转录起始点开始,以碱基互补的方式合成出一条单链的RNA。

2、转录产物的加工和修饰转录终产物核糖核酸包括mRNA、转运RNA、rRNA。刚转录形成的RNA要经过加工和修饰,才能成熟并具备正常功能。由RNA聚合酶Ⅱ催化所形成的原始转录产物,要比成熟的mRNA大4~5倍,称为核内异质RNA(heterogeneous nuclear RNA,hnRNA)。hnRNA必须经过加工和修饰,才能形成有功能的mRNA。hnRNA的加工一般包括戴帽、加尾和剪接等步骤。

翻译

翻译(translation)是指在mRNA指导下的蛋白质生物合成过程。翻译过程实际上就是把脱氧核糖核酸转录到m核糖核酸的遗传信息“解读”为多肽链上的不同氨基酸种类和顺序的过程。翻译过程十分复杂,需要mRNA、tRNA、rRNA、核糖体、有关酶及蛋白质辅助因子的共同作用,还需要各种活化的氨基酸作为原料,并依赖ATP、GTP提供能量。整个过程在细胞质中的核糖体(ribosome)上进行,可分为蛋白质合成的起始、肽链的延伸、蛋白质合成的终止几个步骤。

基因表达的调控

生物体的生理生化过程是通过各种功能蛋白而得以实现的,并且与基因表达的调节和控制密切相关。虽然每个细胞都含有该物种的全套基因,但在特定的个体发育阶段,只有部分基因根据需要“定时定量”地表达和关闭,表现为阶段特异性或时间特异性。在不同的组织细胞中,基因表达情况也不相同,只是一些与该组织器官功能相关的基因得以表达,表现为组织特异性或空间特异性。基因表达的调控决定了上述基因表达的时空特性,是生物体能不断适应环境变化、调节自身代谢、生存并繁衍的前提。真核生物的基因表达调控十分精细和复杂,目前对其了解并不全面,一般认为真核基因的调控在转录前调控、转录水平调控、转录后调控、翻译水平和翻译后调控五个水平上进行。

转录前调控

真核生物基因组脱氧核糖核酸通常与组蛋白及少量非组蛋白等结合成染色质。酸性的非组蛋白带负电荷,与带正电荷的碱性组蛋白结合成配位化合物,后者与带负电荷的DNA排斥而脱离,使相应的DNA片段裸露,易被核糖核酸聚合酶识别结合,从而启动基因转录。

转录水平调控

转录调控涉及DNA顺式作用元件和反式作用因子之间的DNA-蛋白质的相互作用,以及反式作用因子之间的蛋白质-蛋白质相互作用来完成的。主要是反式作用因子结合顺式作用元件后影响转录起始复合物的形成过程。转录激活因子(如增强子结合因子)与增强子序列作用,可提高转录效率并决定基因表达的组织特异性。转录抑制因子可与抑制子序列作用,从而降低转录效率。真核基因转录水平的调控是十分复杂的,不同基因的调控方式既有某些共同之处,又各有其特点而不尽相同。但就某一特定基因而言,转录因子尤其是特异转录因子的性质和数量是转录调控的关键。

转录后调控

转录后的调控主要是对hnRNA进行加工和修饰,使之最终变成成熟的、有功能的mRNA。其中一些特异酶决定了加工和修饰的方式、效率和精确性。

翻译水平

调控翻译水平调控主要包括了对mRNA的稳定性和翻译效率等的调节。

翻译后调控

翻译后的调控主要是对翻译初始产物的加工和组装的调节。刚翻译出来的多肽链,需要进一步修饰、加工和组装,才能具有活性。例如,人类α珠蛋白肽链、β珠蛋白肽链必须各结合一个血红素构成单体,再聚合成α2β2四聚体,才能具备携带氧气二氧化碳的功能。

意义

人类基因组包含2万多个基因。1990年,美国“人类基因组计划”的启动,成功拉开了解读和研究遗传物质脱氧核糖核酸的序幕,截至2009年10月20日,全世界已有5973种生物进行基因组测序,其中1117种完成了发表。

基因变异、沉默、重组

基因变异

基因变异是指基因组脱氧核糖核酸分子发生的突然的可遗传的变异。从分子水平上看,基因变异是指基因在结构上发生核苷酸碱基对组成或排列顺序的改变。基因虽然十分稳定,能在细胞分裂时精确地复制自己,但这种稳定性是相对的。在一定的条件下基因也可以从原来的存在形式突然改变成另一种新的存在形式,就是在一个位点上,突然出现了一个新基因,代替了原有基因,这个基因叫作变异基因。于是后代的表现中也就突然地出现祖先从未有的新性状。

基因变异的后果除形成致病基因引起遗传病外,还可造成死胎、自然流产和出生后夭折等致死性突变;也可能对人体并无影响,仅仅造成正常人体间的遗传学差异;甚至可能给个体的生存带来一定的好处。

基因关闭或沉默

按照遗传基本原理,如果某些基因能帮助父母生存和繁殖,父母就会把这些基因传给后代。但一些研究表明,真实情况要复杂得多:基因可以被关闭或沉默,以应对环境或其他因素,这些变化有时也能从一代传到下一代。

马里兰大学遗传学家提出了一种特殊机制,父母通过这种机制可以把沉默基因遗传给后代,而且这种沉默可以保持25代以上。他们对一种叫作秀丽隐杆线虫蛔虫病进行了研究,让它的神经细胞产生了与特殊基因相配的双链核糖核酸分子(dsRNA)。dsRNA分子能在体细胞之间移动,当它们的序列与相应的细胞脱氧核糖核酸匹配时,就能使该基因沉默。此次发现dsRNA还能进入配子,使其中的基因沉默。长期稳定的沉默效果在开发遗传疾病疗法方面至关重要。研究人员一直把一种名为“RNA干扰”的过程(通常称为RNAi)作为一种潜在基因疗法,它可以用配对dsRNA瞄准任何疾病基因。

基因重组

基因重组是由于不同DNA链的断裂和连接而产生DNA片段的交换和重新组合,形成新DNA分子的过程。1974年波兰斯吉巴尔斯基(Waclaw Szybalski)称基因重组为合成生物学,1978年他在《基因》期刊中写道:限制酶将带领我们进入合成生物学的新时代。

基因与环境

基因作用的表现离不开内在的和外在的环境的影响。在具有特定基因的一群个体中,表现该基因性状的个体的百分数称为外显率;在具有特定基因而又表现该一性状的个体中,对于该一性状的表现程度称为表现度。外显率和表现度都受内在环境和外在环境的影响。

内在环境

内在环境指生物的性别、年龄等条件以及背景基因型

性别

性别对于基因作用的影响实际上是性激素对基因作用的影响。性激素为基因所控制,所以实质上这些都是基因相互作用的结果。

年龄

人类中各个基因显示它的表型的年龄有很大的区别。

背景基因型

通过选择,可以改变动植物品系的某一遗传性状的外显率和表现度,说明一些基因的作用往往受到一系列修饰基因或者背景基因型的影响。由于背景基因型的差异而造成的影响,在下述3种情况中可以减低到最低限度:

用这些体系作为实验系统,可以更为明确地显示环境因素的影响,更为确切地说明某一基因的作用。双生儿法在人类遗传学中的应用及纯系生物在遗传学和许多生物学研究中的应用都是根据这一原理。

外在环境

温度

温度敏感突变型只能在某些温度中表现出突变型的性状,对于一般的突变型来说,温度对于基因的作用也有程度不等的影响。

营养

家兔脂肪的黄色决定于基因y的纯合状态以及食物中的叶黄素的存在。如果食物中不含有叶黄素,那么yy纯合体的脂肪也并不呈黄色。y基因的作用显然和叶黄素的同化有关。

演化

就细胞中脱氧核糖核酸的含量来看,一般愈是低等的生物含量愈低,愈是高等的生物含量愈高。就基因的数量和种类来讲,一般愈是低等的生物愈少,愈是高等的生物愈多。DNA含量和基因数的增加与生理功能的逐渐完备是密切相关的。

基因最初是一个抽象的符号,后来证实它是在染色体上占有一定位置的遗传的功能单位。大肠杆菌乳糖操纵子中的基因的分离和离体条件下转录的实现进一步说明基因是实体。目前,已经可以在试管中对基因进行改造,甚至人工合成基因。对基因的结构、功能、重组、突变以及基因表达的调控和相互作用的研究始终是遗传学研究的中心课题。

基因工程

基因工程的含义

基因工程是现代生物技术的核心,主要研究基因的分离、合成、切割、重组、转移、表达等,是在分子水平上对基因进行操作的复杂技术。它是用人为的方法将所需要的某一供体生物的遗传物质—DNA大分子提取出来,在离体条件下用适当的工具酶进行切割后,把它与作为载体的脱氧核糖核酸分子连接起来,然后与载体一起导入某一更易生长、繁殖的受体细胞中,以让外源物质在其中“安家落户”,进行正常的复制和表达,从而获得新物种的一种崭新技术。

基因工程操作步骤

1、提取目的基因。获取目的基因是实施基因工程的第一步。如植物的抗病基因、人的胰岛素基因等,都是目的基因。要获得特定的目的基因,主要有两条途径:一条是从供体细胞的DNA中直接分离基因,另一条是人工合成基因。

2、目的基因与载体重组。重组载体的构建是实施基因工程的第二步,也是基因工程的核心。如果以质粒作为运载体,首先要用一定的限制酶切割质粒,使质粒出现一个缺口,漏出黏性末端。然后用同一种限制酶切断目的基因,使其产生相同的黏性末端。将切下的目的基因的片段插入质粒的切口处,再加入适量DNA连接酶,质粒的黏性末端与目的基因DNA片段的黏性末端就会因碱基互补配对而结合,形成一个重组的脱氧核糖核酸分子。

3、将重组载体导入受体细胞。将重组载体导入受体细胞是实施基因工程的第三步。基因工程中常见的受体细胞有大肠杆菌根癌农杆菌酿酒酵母和某些动植物细胞等。用人工方法使体外重组的DNA分子转移到受体细胞,主要是借鉴细菌或病毒侵染细胞的途径。例如,如果载体是质粒,受体细胞是大肠杆菌,UI版是将细菌用氯化钙处理,以增大细菌细胞膜的通透性,使含有目的基因的重组质粒进入受体细胞。目的基因导入受体细胞后,就可以随着受体细胞的繁殖而复制,由于细菌的繁殖速度非常快,在很短的时间内就能够获得大量的目的基因。

4、目的基因的检测和表达。目的基因导入受体细胞后,是否可以稳定维持和表达其遗传特性,只有通过检测与鉴定才能知道。这是基因工程的第四步。引入受体细胞的外源DNA分子,往往只有极少部分能实现复制表达功能。因此,必须通过一定的手段对受体细胞中是否导入了目的基因进行检测。检查的方法有很多种,例如,大肠杆菌的某种质粒具有氨苄西林抗性基因,当这种质粒与外源脱氧核糖核酸组合在一起形成重组质粒,并被转入受体细胞后,就可以根据受体细胞是否具有西林抗性来判断受体细胞是否获得了目的基因。重组DNA分子进入受体细胞后,受体细胞必须变现出特定的性状,才能说明目的基因完成了表达过程。

基因编辑技术

基因编辑,又称基因组编辑或基因组工程,是一种新兴的、能比较精确对生物体基因组特定目标基因进行修饰的基因工程技术。基因编辑技术能够让人类对目标基因进行定点“编辑”,实现对特定DNA片段的修饰,在基因研究、基因治疗和遗传改良等方面展示出了巨大的潜力。

基因编辑的应用

基因编辑已经开始应用于基础理论研究和生产应用中,从研究植物和动物的基因功能到人类的基因治疗,广泛应用于生命科学的许多领域。例如在动物基因的靶向修饰方面,基因编辑和牛体外胚胎培养等繁殖技术结合,允许使用合成的高度特异性的内切核酸酶直接在受精卵母细胞中进行基因组编辑,从而实现对哺乳动物受精卵的改变来改变动物的特性。植物基因的靶向修饰是基因编辑应用最广泛的领域,如将两种除草剂抗性基因(烟草ALSSuRA和SuRB)引入作物。基因编辑技术还被应用于改良农产品质量,比如改良大豆油品质和增加马铃薯的储存潜力。

2019年8月27日,美国科学家借助基因编辑技术制造出了第一种经过基因编辑的爬行纲—一些小型白化病蜥蜴,这是该技术首次用于爬行动物。由于白化病患者经常有视力问题,因此,最新突破有助于研究基因缺失如何影响视网膜发育。

分子进化工程

分子进化工程是继蛋白质工程之后的第三代基因工程。分子进化工程,核心是通过在试管里对以核酸为主的多分子体系施以选择压力,模拟生物进化历程的定向进化技术,借以达到创造新的基因、蛋白质及新物种的目的。

这需要三个步骤,即扩增、突变和选择。扩增是使所提取的遗传信息脱氧核糖核酸片段分子获得大量的拷贝;突变是在基因水平上施加压力,使DNA片段上的碱基发生变异,这种变异为选择和进化提供原料;选择是在表型水平上通过适者生存,不适者淘汰的方式固定变异。这三个过程紧密相连缺一不可。

科学家已应用此方法,通过试管里的定向进化,获得了能抑制凝血酶活性的DNA分子,这类DNA具有抗凝血药作用,它有可能代替溶解血栓的蛋白质药物,来治疗心肌梗死、脑血栓等疾病。

应用领域

医药领域

随着人类对基因研究的不断深入,发现许多疾病是由于基因结构与功能发生改变所引起的。科学家将不仅能发现有缺陷的基因,还能掌握如何对基因进行诊断、修复、治疗和预防。

基因识别和亲子鉴定

由于人类基因具有唯一性(双胞胎除外),在法医学上用途最广的方面就是个体基因识别和亲子鉴定。作为最前沿的刑事生物技术脱氧核糖核酸分析技术为法医物证检验提供了科学、可靠和快捷的手段。DNA检验能直接认定犯罪分子,为凶杀案等重大疑难案件的侦破提供准确可靠的依据。随着DNA技术的发展和应用,此方法作为亲子鉴定已经是非常成熟的,也是国际上公认的最好的一种方法。

基因检测诊断

检测

基因检测是通过血液、其他体液、或细胞对DNA进行检测的技术。基因检测可以诊断疾病,也可以用于疾病风险的预测。疾病诊断是用基因检测技术检测引起遗传性疾病的突变基因。目前应用最广泛的基因检测是新生儿遗传性疾病的检测、遗传疾病的诊断和某些常见病的辅助诊断。目前有1000多种遗传性疾病可以通过基因检测技术做出诊断。

科学家发现,基因的载体即脱氧核糖核酸分子类似“计算机磁盘”,拥有信息的保存、复制、改写等功能。将人体细胞核中的23对染色体中的DNA分子连接起来拉直,其长度大约为0.7米,但若把它折叠起来,又可以缩小为直径只有几微米的小球。因此,DNA分子被视为超高密度、大容量的分子存储器。基因芯片经过改进,利用不同生物状态表达不同的数字后还可用于制造生物计算机。基于基因芯片和基因算法,未来的生物信息学学领域,将有望出现能与当今的计算机业硬件巨头—英特尔、软件巨头—微软相匹敌的生物信息企业。

当环境中的有害物质进入受精卵或母体,当父母有一定的共同血缘或有一定相同数目的遗传基因关系,在这些情况下,后代的基因组里的基因会发生缺陷,产生疾病。通过使用基因芯片等技术分析人类基因组,可找出致病的遗传缺陷基因区域。癌症、糖尿病等,都是遗传基因缺陷引起的疾病。医学和生物学研究人员将能在数秒钟内鉴定出最终会导致癌症等的突变基因。借助一小滴测试液,医生们能预测药物对病人的功效,可诊断出药物在治疗过程中的不良反应,还能当场鉴别出病人受到了何种细菌、病毒或其他微生物的感染。利用基因芯片分析遗传基因,将使10年后对糖尿病的确诊率达到50%以上。

诊断

基因测序(gene sequencing)也叫 DNA测序(DNA sequencing),是对脱氧核糖核酸分子的核苷酸排列顺序进行测定的一门技术。核酸是生物遗传信息的贮藏者和传递者,DNA的碱基序列决定了基因的表达及其功能,其序列的改变意味着生物学含义的改变,因此核酸序列分析是现代分子生物学的一项核心技术,是分析基因结构、功能及其相互关系的前提,也是临床疾病分子诊断最为精确的判定依据。基因测序技术已经成为临床研究领域的重要技术手段,是基因诊断和个体化医疗的基础。

未来人们在体检时,由搭载基因芯片的诊断机器人对受检者取血,转瞬间体检结果便可以显示在计算机屏幕上。利用基因诊断,医疗将从千篇一律的“大众医疗”的时代,进一步精确到依据个人遗传基因而异的“定制医疗”的时代。

基因治疗

基因治疗是指用基因工程的技术方法,将正常的基因转入病患者的细胞中以取代病变基因,从而表达所缺乏的产物,或者通过关闭或降低异常表达的基因等途径,达到治疗某些遗传病的目的。目前,已发现的遗传病有6500多种,其中由单基因缺陷引起的就有约3000多种。因此,遗传病是基因治疗的主要对象。第一例基因治疗是美国在1990年进行的。当时,两个4岁和9岁的小女孩由于体内Ada缺乏而患了严重的联合免疫缺陷病症,科学家对她们进行了基因治疗并取得了成功。这一开创性的工作标志着基因治疗已经从实验研究过渡到临床实验。1991年,中国首例B型血友病的基因治疗临床实验也获得了成功。

治疗的最新进展是将基因枪技术用于基因治疗,其方法是将特定的脱氧核糖核酸用改进的基因枪技术导入小鼠的肌肉、肝脏、脾、肠道和皮肤获得成功的表达。这一成功预示着人们未来可能利用基因枪传送药物到人体内的特定部位,以取代传统的接种新型冠状病毒疫苗,并用基因枪技术来治疗遗传病。2017年10月19日,美国政府批准第二种基于改造患者自身免疫细胞的疗法(yescarta基因疗法)治疗特定淋巴癌患者。

基因疗法是通过基因克隆、转基因等技术来复制,制造与自己相匹配的器官,能够解决一些智力,有生理缺陷的患者的难题。通过现症分析、基因分析技术,人工合成基因技术等,制造可以匹配的健全器官。科学家们正在积极研究胎儿基因疗法,如果的实验疗效得到进一步的确认,就有可能将胎儿基因疗法扩大到其他遗传病,以防止出生患遗传病症的新生儿,从而在根本上提高后代的健康水平。

基因工程药物

基因工程药物是重组脱氧核糖核酸的表达产物。广义来说,凡是在药物生产过程中涉及基因工程的,都可以称为基因工程药物。基因工程药物研究的开发重点是从蛋白质类药物,如胰岛素、人生长激素、促红细胞生成素等分子蛋白质,转移到较小分子蛋白质药物。这是因为蛋白质的分子一般都比较大,不容易穿过细胞膜,因而影响其药理学作用的发挥,而小分子药物在这方面就具有明显的优越性。同时对疾病的治疗思路也开阔了,从单纯的用药发展到用基因工程技术或基因本身作为治疗手段。

农业领域

利用基因工程技术可改良农作物。其显著特点就是生物技术、农业、食品和医药行业将融合到一起。20世纪五六十年代,由于杂交品种推广、化肥使用量增加以及灌溉面积的扩大,农作物产量成倍提高,这就是“绿色革命”。但一些研究人员认为,这些方法已很难再使农作物产量有进一步的大幅度提高。基因技术的突破使科学家们得以用传统育种专家难以想象的方式改良农作物。例如,基因技术可以使农作物自己释放出杀虫剂,可以使农作物种植在旱地或盐碱地上,或者生产出营养更丰富的食品。科学家们还在用基因技术开发一些新的农作物,它们可以生产出能够防病的新型冠状病毒疫苗和食品。

利用基因工程育种,20世纪90年代前在农作物上的应用比较广泛,主要是用于提高农作物产量,近期则侧重于提高品质,如美国科学家据此提高马铃薯淀粉含量达20%~40%,最高达40%~60%。改良作物产品质量的基因及应用主要有:控制果实成熟的基因;谷物种子贮藏蛋白基因;控制脂肪合成基因;提高作物产量基因等。世界上有43种农作物品种得到改良,如水稻、番茄、马铃薯、瓜类、烟草等。基因技术也使开发农作物新品种的时间大为缩短。利用传统的育种方法需要七八年时间才能培育出一个新的植物品种。基因工程技术使研究人员可以将任何一种基因注入一种植物中,从而培育出一种全新的农作物品种,时间则缩短一半。

生产领域

人们可以利用基因技术,生产转基因食品,例如,科学家可以把某种肉猪体内控制肉的生长的基因植入鸡体内,从而让鸡也获得快速增肥的能力。

军事领域

生物武器已经使用了很长的时间,细菌、毒气都令人为之色变,传说中的基因武器更加令人胆寒。

环境保护领域

利用基因工程制成的脱氧核糖核酸探针能够十分灵敏地检测环境中的病毒、细菌等污染。利用基因工程培育的指示生物能十分灵敏地反映环境污染的情况,却不易因环境污染而大量死亡,甚至还可以吸收和转化污染物。基因工程与环境污染治理基因工程做成的“超级细菌”能吞食和分解多种污染环境的物质。通常一种细菌只能分解石油中的一种烃类,用基因工程培育成功的“超级细菌”能分解石油中的多种烃类化合物,有的还能吞食转化汞、镉等重金属,分解滴滴涕等毒害物质。

基因编码本源

生物基因编码的本源

在自然界中,大部分生命都使用64个密码子进行编码。这64个密码子中,61个密码子编码天然的20种氨基酸。这些氨基酸通过首尾相连、脱水缩合而形成不同长度的共价多肽链—不同分子量大小的蛋白质。剩下的3个密码子则起到终止翻译蛋白质的作用。研究人员发现,这20种天然氨基酸中的18种存在同义密码子(1种氨基酸有1个或多个密码子)编码。但实际上,这些同义密码子有着相似的功能,其原因尚不明确。

遗传密码起源各种学说

凝固事件假说(frozen accident hypothesis)

1968年,克里克(Crick)提出了凝固事件假说,认为密码子与氨基酸的关系是在某一时期固定的,之后很难再改变。现在所有的生物几乎使用着同样一套密码,似乎支持这一假说。笔者认为,这只是对演化事件时间节点的一种推测,并未说明密码系统是如何起源的。1979年,艾根(Eigen)和舒斯特(Schuster)指出:“在查尔斯·达尔文物种进化的前面,还有一个类似的分子进化的渐进过程,由此导致了唯一的一种运用普适性密码的细胞机构。这种密码最终确定起来,并不是因为它是唯一的选择,而是由于一种特殊的“一旦—永存”选择机制,可以从任何随机分配开始。”

立体化学假说(stereochemical hypothesis)

1966年,韦斯(Woese)等提出了立体化学假说,认为氨基酸与它们相对应的密码子有选择性的化学结合力,即遗传密码的起源和分配与RNA和氨基酸之间的直接化学作用密切相关,或者说,密码子的立体化学本质取决于氨基酸与相应的密码子之间物理和化学性质的互补性。2013年,波兰斯基(Polyansky)等发现,mRNAs中不同核酸碱基的密度分布非常类似于它们所编码的蛋白质中这些相同核酸碱基的氨基酸亲电子密度分布。笔者认为,氨基酸与密码子的立体联系固然重要,但单凭这一点还无法诠释一个完整的机制,这一假说也未涉及演化动因。

共进化假说(co-evolution hypothesis)

1975年,王子晖(Wong)提出了共进化假说,认为氨基酸和相应编码的忠实性反映的是氨基酸生物合成路径的相似性,而并非物理化学性质的相似性。笔者认为,这也只是在推测密码子起源的一种可能路线,并未说明为何如此演化。此外,从简单的原料合成各种氨基酸可能发生在前生命演化末期。

综合性假说(synthetic hypothesis)

1999年,奈特(Knight)等提出了综合性假说,认为遗传密码是由选择、历史和化学三个因素在不同阶段起作用的。初期主要是由氨基酸和密码子之间的直接相互作用来决定;在新氨基酸的引入和密码子扩展阶段,共进化作用可能占据主导地位;而随着tRNA的进化和蛋白质的功能增加,逐渐去除了氨基酸和密码子的直接相互作用,密码子在不同尺度上的交换在某些程度上允许通过密码子的重新分配进行优化。这是对几种主要假说的综合,但依然未能涉及演化的动因。

其他假说

1981年,曼弗雷德·艾根(Manfred Eigen)提出了试管选择(in vitroselection)假说,1989年,英国化学家莱斯利·奥格尔(Leslie Orgel)提出了解码(decoding)机理起源假说,1988年,比利时细胞生物学和生物化学家杜维(Christian de Duve)提出了第二遗传密码(second genetic code)假说。2005年,吴焕麟(Wu)等推测,三联体密码从两种类型的双联体密码逐渐进化而来。不过,也有人推测三联体密码子是从更长的密码子(如四联体密码子quadruplet codons)演变而来,因为长的密码子具有更多的编码冗余从而能抵御更大的突变压力。2009年,肖景发于军提出了遗传密码的分步进化假说(stepwise evolution hypothesis)。1994-1996年赵玉芬等提出了核酸与蛋白共同起源的观点,认为“磷是生命化学过程的调控中心”,因为磷酰化氨基酸能同时生成核酸及蛋白,又能生成LB膜及脂质体。

相关事件及争议

事件

2018年11月26日,中国双胞胎女孩露露和娜娜诞生,这对双胞胎的一个基因经过修改,使她们出生后即能天然抵抗艾滋病。这是世界首例免疫艾滋病的基因编辑婴儿。该事件随后引发巨大争议。2019年1月21日,广东省基因编辑婴儿事件”调查组查明,该事件是南方科技大学副教授贺建奎为追逐个人名利,自筹资金,蓄意逃避监管,私自组织有关人员,实施国家明令禁止的以生殖为目的的人类胚胎基因编辑活动。12月30日,“基因编辑婴儿”案在深圳市南山区人民法院一审公开宣判。贺建奎、张仁礼覃金洲等3名被告人因共同非法实施以生殖为目的的人类胚胎基因编辑和生殖医疗活动,构成非法行医罪,分别被依法追究刑事责任

2024年6月19日报道,据英国每日邮报报道,46岁的美国富翁布莱恩·约翰逊前往偏远岛屿,接受一项极端医疗程序,编辑他的DNA,以求“永生”,据称这项手术花费2万美元,需要在腹部和臀部注射。

争议

全球的科学家对于基因编辑技术应用于人类胚胎形成了观点鲜明对立的两派,支持这一技术大胆前行的科学家希望基因编辑技术能够拯救更多的人类,反对该技术应用于人类胚胎的科学家则担忧这一技术打开了技术对伦理的冲击、本身的风险以及其被不正当使用后的可怕后果。其实,即便是技术的安全性得到了解决,基因编辑技术能否应用于人体胚胎依旧是一个很难抉择的问题。科学技术永远是一把双刃剑,它的作用是好是坏完全取决于使用者的把控,基因编辑可以极大地推动人类文明的进展,但是一旦基因编辑技术被不法分子大肆用于危害人类的活动,那带来的结果将是灾难性的,将会给人类社会带来致命打击。在科学与伦理之间,似乎永远很难找到一个平衡点,我们所能做的就是完善技术,正确对待科学技术,只有在技术本身与使用的双重安全保障下,科学与伦理在碰撞中才能获得真正的平衡。

相关法律

国际法规

人类基因编辑技术的伦理和法律规范而言,有针对性的国际性文本形成于2000年前后,如联合国教科文组织(UNESCO)发布的《世界人类基因组与人权宣言》《国际人类基因数据宣言》《世界生物伦理与人权宣言》,国际医学组织理事会(CIOMS)和世界卫生组织(WHO)发布的《涉及人的生物医学研究国际伦理指南》,以及国际人类基因组组织发布的《关于基因研究正当行为的声明》《关于人类基因组数据库的声明》《关于DNA取样的声明:控制与获取》《关于利益分享的声明》等,主要偏重于维护人的尊严和自由,协调研究自由、技术进步与风险防范、权益保护等方面的关系。《世界人类基因组与人权宣言》在序言中强调,人类基因研究应充分尊重人的尊严、自由和权利,并禁止基于遗传特点的一切形式的歧视。《国际人类基因数据宣言》提出了尊重、非歧视和不侮辱、自主同意与知情、隐私与保密性、准确性与安全、合作与利益共享等伦理原则。《世界生物伦理与人权宣言》第3条强调应充分尊重人的尊严、人权和基本自由,个人的利益和福祉高于单纯的科学利益或社会利益。

欧美法律政策

就各国法律规范经验来看,英国德国法国、美国等都有相应的政策不一的立法,但基本上不允许以生殖为目的而对胚胎进行基因编辑。

英国采取了个案许可的法律政策。自从英国上院于2005年4月28日对Hashmi案作出允许应用胚胎植入前基因诊断(PGD)技术来治疗基因缺陷患者的最终裁决后,对《人类授精与胚胎学法》进行了修订,强调人类胚胎基因诊断技术的应用实行个案审批,必须以预防生育先天性疾病的患儿为目的,不得用于非医疗目的(如性别选择。

德国实行一概禁止的法律政策。德国1991年施行的《胚胎保护法》禁止对胚胎施加导致其无法发展为人的伤害,培育和使用胚胎仅限于辅助生育的目的,且胚胎数额以3个为限。2002年《胚胎干细胞法》允许在一定条件下使用从国外输人的胚胎干细胞进行研究。2009年《基因诊断法》虽然对胎儿性别、与医疗无关的遗传特质以及晚发性遗传病的基因检验一律禁止,但也在第15条规定对母体内的胚胎或胎儿可以进行基因诊断。2011年7月通过的《胚胎植入前诊断法》允许了PGD技术的应用,还规定在确认胚胎极可能患严重遗传病或成为死婴及流产时,可以不植入“母体”而让其死亡。但是不能通过PGD来“设计”所谓的“救命宝宝”,更不允许进行生殖性的人类胚胎基因编辑。

法国制定了专门的《生物伦理法》,禁止生殖性和治疗性克隆,但允许实施PGD,确立告知后同意、匿名捐献等原则,并创建了生物医学办公室作为主管机构。法国更是把自然人的基因权利写入了中华人民共和国民法典,主要包括人的尊严、人体及其组成部分和所生之物的非财产性、人体和基因的完整性、基因检查的科学和医疗目的、告知后同意、基因身份鉴定、禁止基因歧视等方面,尤其强调通过人的尊严和自由等法律价值对基因编辑技术进行法律约束。

美国联邦层面有作为权利保护法的《基因信息非歧视法》,甚至部分州有关基因隐私保护、禁止基因歧视等方面的相应立法表现得更为激进。美国国家科学院(NAS)发布的《人类胚胎干细胞研究指导原则》以伦理准则的形式提供了若干规制措施。该原则禁止生殖性克隆以及培养嵌合体胚胎,规定那些提取干细胞所使用的胚胎的生长期不能超过两个星期。

中国

中国有关人类基因编辑技术的规范主要有《基因工程安全管理办法》《人类遗传资源管理暂行办法》《人类辅助生殖技术规范》和《人类辅助生殖技术和人类精子库伦理原则》《人的体细胞治疗及基因治疗临床研究质控要点》《人基因治疗研究和制剂质量控制技术指导原则》《人胚胎干细胞研究伦理指导原则》《干细胞临床研究管理办法(试行)》《涉及人的生物医学研究伦理审查办法》等。在中国现行法上,人类基因编辑实验的基本立场是:通常限于医疗或研究目的,但不允许进行生殖性细胞基因改造,不允许培养人与其他生物的嵌合体胚胎,更不许克隆人。《人胚胎干细胞研究伦理指导原则》禁止进行生殖性克隆人的任何研究(第4条),禁止买卖人类配子、受精卵、胚胎或胎儿组织(第7条),并要求贯彻告知后同意与知情选择等原则,保护受试者的隐私(第8条)。尤其值得称道的是,该原则第六条明确规定,自受精或核移植开始,囊胚的体外培养期限不得超过两个星期,不得将其植入人或任何其他动物的生殖系统,不得培养人与其他物种的嵌合体。《人胚胎干细胞研究伦理指导原则》第5条规定,用于研究的人胚胎干细胞的获得途径仅限于4种情形(即:体外受精时多余的配子或囊胚、自然或自愿选择流产的胎儿细胞、体细胞核移植技术所获得的囊胚和单性分裂囊胚、自愿捐献的配子)。《干细胞临床研究管理办法(试行)》第3条规定干细胞临床研究必须遵循科学、规范、公开、符合伦理、充分保护受试者权益的原则。《人类辅助生殖技术规范》也明确规定,禁止人类与异种配子的杂交,禁止人类体内移植异种配子、合子和胚胎,禁止异种体内移植人类配子、合子和胚胎,更是明确禁止以生殖为目的对人类配子、合子和胚胎进行基因操作,禁止人类嵌合体胚胎试验研究以及对人的克隆。《人类辅助生殖技术和人类精子库伦理原则》也强调不得实施各种违反伦理、道德原则的配子和胚胎实验研究及临床工作。

Gene.genome.2025-08-27

科学家称获重大突破 发现4种乳腺癌风险基因.央视网.2025-08-28

牛津:基因不仅影响"初夜"时间 还有女性生育年龄.网易.2025-08-28

中华家系1号基因组和转录组标准物质发布.中国科学院.2025-08-27

英国将对10万名婴儿进行基因测序 研究涉及约200种疾病.参考消息.2025-08-28

新DNA测序法打开基因组“黑匣子”.人民政协网.2025-08-28

探究生命,守护健康更有效——2023年世界科技发展回顾·生物医学篇.极目新闻.2025-08-28

首例基因编辑婴儿诞生,人类需要“基因改造的婴儿”么?|界面新闻.界面新闻.2025-08-28

贺建奎现身发言:露露娜娜已健康出生,结果是不小心公布的.浙江经视.2025-08-28

广东初步查明“基因编辑婴儿事件”.人民网.2025-08-28

“基因编辑婴儿”案一审宣判 贺建奎等三被告人被追究刑事责任.央视新闻客户端.2025-08-28

【换血疗法失败,#4....福布斯中文网微博.2025-08-28