参考书籍
《医学遗传学》第7版,左伋等主编。北京人民卫生出版社出版,2018,全国高等学校五年制本科临床医学专业第九轮规划教材,ISBN 978-7-117-26440-2。
医学遗传学概念
在传统的观念上,遗传因素与环境因素在疾病发生、发展中的交互作用考虑得较少,所以比较局限。
一般把遗传因素
作为唯一或主要病因的疾病称为遗传病。相应地,医学遗传学
就是用人类遗传学的理论和方法来研究这些遗传病从亲代传递至子代
的特点和规律、起源和发生 、病理机制 、病变过程及其与临床关系(包括诊断、治疗和预防)的一门综合性学科。
人类基因组计划
促使医学遗传学
发生革命性变化的是20世纪90年代开始的人类基因组计划
。
该计划的研究目标是从整体上阐明人遗传信息的组成和表达。包括遗传图绘制
、物理图构建
、测序
、转录图绘制
和基因鉴定
等方面的工作,为人类遗传多样性的研究提供基本数据,揭示上万种人类单基因异常
和上百种严重危害人类健康的多基因病
(例如心血管疾病、 糖尿病、 恶性肿瘤、 自身免疫性疾病等)的致病基因
或疾病易感基因
,建立对各种基因病新的诊治方法,实现精确医疗,从而推动整个生命科学和医学领域的发展。
人类基因组介绍
基因(gene)是细胞内遗传物质的结构和功能单位,以脱氧核糖核酸(DNA)的化学形式存在于染色体上。
基因的化学本质
组成DNA分子的基本单位是脱氧核苷酸
。4种不同的脱氧核苷酸:
- 脱氧腺嘌呤核苷酸 (dAMP, A)
- 脱氧鸟嘌呤核苷酸 (dGMP, G)
- 脱氧胞嘧啶核苷酸 (dCMP, C)
- 脱氧胸腺嘧啶核苷酸 (dTMP, T)
按一定顺序排列起来构成脱氧多核苷酸长链(DNA单链
)。两条反向平行
排列的脱氧多核苷酸单链通过A与T
、C与G
的碱基互补方式组成DNA双链。4种脱氧核苷酸(A, T, G, C)的排列顺序在不同的DNA分子中各不相同,蕴含着各种生物性状的遗传信息。
基因的结构
包括人类在内的真核生物
的结构基因是割裂基因
,由编码序列(外显子
)和非编码序列(内含子
)组成,两者相间排列。不同基因所含内含子的数目和大小各不相同。
割裂基因中的内含子
和外显子
的关系不是固定不变的,即在同一条 DNA 分子上的某一段 DNA 序列,在作为编码某一条多肽链的基因时是外显子;作为编码另一条多肽链的基因时是内含子,这是由于 mRNA 剪接加工
的方式不同所致。结果使同一个基因(确切地说是同一段DNA序列
)产生两条或以上的 mRNA 链。这是真核生物基因的表达中,由于一个基因的内含子成为另一个基因的外显子,产生基因的差异表达,构成剖裂基因结构上的一个重要特点。
每个剖裂基因中第一个外显子的上游和最末一个外显子的下游,都有一段不被转录的非编码区,称为侧翼序列
。包括启动子
、增强子
以及终止子
等对 DNA 转录起调控作用
的DNA序列。
剖裂基因结构中外显子-内含子
的接头区是高度保守的一致序列,称为外显子-内含子接头
。这是剖裂基因结构上的又一个重要特点。每一个内含子的两端具有广泛的同源性和互补性,5’端起始的两个碱基是 GT,3’端最后的两个碱基是 AG,通常把这种接头形式叫作GT-AG 法则
(GT-AG rule)。这两个序列是高度保守的,在各种真核生物基因的内含子中均相同。
人类基因组构成
随着人类基因组计划研究
的深入和结构基因组学的基本完成,已知人类基因约有20000~22000个基因
。这些与蛋白质合成有关的基因序列只占整个基因组序列的1.1%左右;4%为基因调控序列和RNA基因序列;20%为内含子、基因非翻译区序列以及假基因;75%为基因外(extragenic)序列,其中55%为重复DNA序列。近年来发现人类基因组存在8000多种非编码RNA基因
,表明了人类基因组实际上具有很高的复杂性。人类基因组按DNA序列分类既有单拷贝序列,也有重复频率不等的多拷贝序列。
基因表达与调控
基因表达
基因表达(gene expression)
一般是所储存的遗传信息转变为由特定的氨基酸种类和序列构成的多肽链,再由多肽链构成蛋白质或酶分子,从而决定生物各种性状(表型)的过程。
基因表达包括两个步骤:
以DNA为模板转录合成mRNA
转录 转录(transcription)
是在RNA聚合酶催化下,以DNA的3’→5’单链(模板链)为模板,按照碱基互补配对原则(但RNA以U和DNA的A配对,其余配对形式与DNA复制时一致),以三磷酸核苷酸(NTP)为原料合成RNA的过程。
转录的最终产物是mRNA、tRNA和rRNA等
。合成不同的RNA所需的RNA聚合酶不同,RNA聚合酶I合成rRNA;RNA聚合酶II合成mRNA的前体,RNA聚合酶III合成snRNA及tRNA等小分子RNA。
将遗传信息翻译成多肽链中相应的氨基酸种类和序列
翻译(translation)
是以mRNA为模板指导蛋白质合成的过程。蛋白质合成在细胞质内的核糖体上进行。mRNA、tRNA和核糖体
在翻译中起着重要的作用,mRNA携带遗传信息,作为合成蛋白质的模板;tRNA转运活化的氨基酸和识别mRNA分子上的遗传密码;核糖体是蛋白质合成的场所,把各种特定的氨基酸分子连接成多肽链。蛋白质合成通常分为3个阶段:起始、延长和终止
。每个阶段都涉及许多不同而重要的生化过程。
要成为有功能的成熟的翻译产物,需要对合成初级翻译产物进行加工。mRNA只能决定多肽链中的氨基酸顺序,而蛋白质分子的空间结构是由翻译后修饰所决定的。
基因调控
奢侈基因
:一种组织细胞中通常只有一种或几种蛋白质发挥优势作用,如上皮细胞为角蛋白、结缔组织为胶原蛋白和弹性蛋白、红细胞为血红蛋白、胰岛细胞为胰岛素等,这些特异表达的基因称为奢侈基因(luxury gene)
。持家基因
:几乎在一切体细胞中均能被表达的基因称为持家基因(housekeeping gene)
,如与DNA复制、RNA转录和蛋白质合成酶有关的基因及控制糖酵解和三羧酸循环的基因。
这表明,细胞表现的分化是由于编码这些蛋白质的基因被选择性地表达,而其他多数基因则处于失活状态或效率相对低的表达状态。
转录水平调控
基因表达的转录水平调控可通过蛋白因子与旁侧或内含子序列中的调控序列相结合来进行。
顺式作用元件
在真核基因的转录调控区
含有的特异的DNA序列被称为顺式作用元件
(cis-acting element),包括启动子
、增强子
和沉默子
等。顺式作用元件是决定基因表达的内在因素,影响与其自身同处于一个DNA分子上的基因。
启动子
:启动基因转录的一段特异DNA序列,一般距转录起始点200bp以内,包括核心启动子和近侧启动子区域。TATA框位于核心启动子区,其序列是TATAAAA,是基本转录因子TFIID的识别和结合位点。GC框和CAAT框位于近侧启动子区,其序列分别为GGGCGG和GCCAAT(CCAAT),用于调节核心启动子的基础转录。增强子
:位于真核基因转录调控区的一段DNA序列,能增强核心启动子元件起始的基础转录。增强子可位于远离转录起始位点的区域,决定基因的时空特异性表达。沉默子
:位于调控区抑制或阻遏基因转录的DNA序列,可降低或抑制转录。沉默子可以位于临近启动子的区域,启动子上游或者内含子内部。
反式作用因子
在真核生物中与顺式作用元件特异性结合
,并参与调节RNA转录的蛋白统称为转录因子
(transcription factor,TF)或转录调节蛋白。大部分转录因子以反式作用方式结合到靶基因启动子的特定DNA序列上增强或抑制靶基因的转录,又被称为反式作用蛋白(trans-acting protein)。
转录因子能够与基因上游的非编码区
内特定的DNA模块结合,通过调控核糖核酸酶(RNA聚合酶)与DNA模板的结合,起到激活或者抑制基因表达的作用。在DNA上能够与转录因子相结合的DNA序列即为转录因子结合位点(TFBS),大部分位于基因的启动子区域。
同一转录因子结合位点有很高的序列相似性
,通常为6~20bp的一段短序列。单个转录因子可以与许多不同的调节区结合,从而调节多个基因的转录;而同一个靶基因也可以受到多个转录因子或转录因子形成的复合物的调节。
组蛋白修饰和染色质重构
核小体
的致密结构能够阻止DNA与蛋白质之间的相互作用,而组蛋白修饰
和染色质重构
有助于局部的染色质可逆地由浓缩状态转变为易接近的构象。
- 组蛋白乙酰基转移酶可以使组蛋白乙酰化,使组蛋白与DNA的结合力降低。
染色质重构
则是指染色质重构复合体通过ATP水解暂时改变核小体的结构,从而使各种蛋白质易于与DNA接近。
转录后水平调控
前面提到,真核细胞mRNA转录后形成成熟的mRNA
需要经过剪接、加帽、加尾等过程,影响其中任何一个环节都将调控基因的表达,如选择性剪接、RNA编辑等。
-
选择性剪接:
选择性剪接(alternative splicing)
又称可变剪接,是指在RNA剪接过程中,同一基因的转录产物经过不同的剪接方式,产生不同的mRNA,进而表达出多个不同的相关蛋白产物,行使不同的生理功能。可变剪接的产物称为亚型。大于90%的人类基因将经历可变剪接。 -
RNA编辑:
RNA编辑(RNA editing)
是导致形成的mRNA分子在编码区的核苷酸序列不同于它的DNA模板相应序列的过程。RNA编辑与真核生物mRNA前体的修饰(如截帽、加尾和剪接等)不同,后者不改变DNA的编码序列。
RNA编辑的生物学意义主要表现在:
- 经过编辑的mRNA具有翻译活性;
- 使该mRNA能被通读;
- 在一些转录物5’末端可创造生成起始密码子AUG,以调节翻译活性;
- RNA编辑可能与生物进化有关;
- RNA编辑不偏离中心法则,因为提供编辑的信息源仍然来源于DNA贮藏的遗传信息。
翻译水平的调控
许多基因在蛋白合成的水平上也受到调节,由于免去了改变mRNA转录水平所需的时间,翻译水平的调控对外界刺激的反应更为迅速。
-
翻译起始的调控:在翻译起始阶段,许多蛋白质参与了翻译的起始,如
帽结合蛋白
对核糖体与mRNA的结合起着关键的连接作用。而mRNA的序列也参与了翻译的起始调控,如起始密码AUG的旁侧序列、5’的非翻译区等。 -
microRNA的调控作用
:microRNA(miRNA)
是一类长度约18~25个核苷酸的小单链RNA(ssRNA),由DNA转录产生,不翻译成蛋白质,通过碱基互补配对的方式与靶基因的3’UTR区部分或完全互补,剪切靶基因的转录产物或者抑制转录产物的翻译,从而起到转录后调控靶基因的表达的作用。
microRNA
的调控作用主要包括:
miRNA
对靶mRNA翻译起始的抑制;miRNA
对靶mRNA翻译起始后抑制;miRNA
诱导mRNA转录衰减;miRNA
的正调控与去抑制。
翻译后水平的调控
有些蛋白质合成完成后需经过适当的加工修饰才有活性,因而翻译后修饰
是蛋白质结构和功能调节的一种重要方式,大大增加了蛋白质的多样性和复杂性。
常见的蛋白质翻译后修饰
:体内最常见的蛋白质翻译后修饰是磷酸化修饰
,即在蛋白激酶的作用下,将ATP或GTP上的磷酸基团转移到底物上。除此以外,糖基化、泛素化、类泛素化(SUMOylation)、乙酰化和甲基化
等也是常见的蛋白质翻译后修饰的方式。通过翻译后修饰维持蛋白质的活性,发挥其生理功能,参与蛋白质的降解和蛋白间的相互作用,影响蛋白在细胞内的分布等。翻译后修饰的协同作用
:细胞中翻译后修饰种类繁多,往往是多种修饰协同发挥作用,形成调控网络。无论是生理还是病理过程,都需要各种修饰的蛋白质共同作用。
表观调控
一个基因的结构除了编码特定功能产物的DNA序列外,还包括对这个特定产物表达所需的邻接DNA序列
。在对某些遗传病的家系研究中发现,虽然基因的编码部分结构完整,也未发生改变,但若它的邻接DNA序列发生了改变,如常见的邻接序列某些区域单个碱基的替换可使此功能产物不能表达,也可能引发疾病。
另外,在基因的核苷酸序列不发生突变的情况下,基因的修饰如DNA甲基化
、组蛋白的乙酰化
等也可能导致基因的活性发生改变,使基因决定的表型出现变化,且可传递少数世代。这是表观遗传学(epigenetics)
所涉及的主要内容。
遗传病概述
遗传病的特点
遗传病的传播方式
如果某些疾病是由于环境因素致病,在群体中应该按水平方式
出现,如果是遗传性的,一般则以垂直方式
出现,不延伸至无亲缘关系的个体,这在显性遗传方式的病例中尤其突出。
遗传病的数量分布
患者在亲祖代和子孙中是以一定数量比例出现的
,即患者与正常成员间有一定的数量关系,通过特定的数量关系,可以了解疾病的遗传特点和发病规律,并预期再发风险等。
遗传病的先天性
遗传病往往有先天性
特点,但并非所有的遗传病都是先天的。反过来,先天性疾病也有两种可能性,即有些先天性疾病是遗传性的,如白化病,有些则是获得性的,如妇女妊娠时因风疹病毒感染,致胎儿患有先天性心脏病。 虽然患儿出生时有心脏病,但按传统概念来说它是不遗传的
。
遗传病的家族性
遗传病往往有家族性
等特点。 所谓家族性是疾病的发生所具有的家族聚集性
。 但并非所有的遗传病都表现为家族性。反过来,家族性疾病可能是遗传的,但不是所有的家族性疾病都是遗传的。
如有一种夜盲症(即当光线比较弱时,视力极度低下的一种疾病)是由于饮食中长期缺乏维生素A引起的,如果同一家庭饮食中长期缺乏维生素A,则这个家庭中的若干成员就有可能出现夜盲症。 这一类家族性疾病是由共同环境条件的影响,而不是出自遗传原因,如果在饮食中补充足够的维生素A后,全家患者的病情都可以得到改善。所以说,由于维生素A缺乏所引起的夜盲症,尽管表现有家族性,但它不是遗传病。
遗传病的传染性
一般的观点认为,遗传病是没有传染性的
,故在传播方式上,它是垂直传递,而不是水平传递的。
但在目前已知的疾病中,人类朊粒蛋白病
则是一种既遗传又具传染性的疾病。朊粒蛋白
是一种功能尚不完全明确的蛋白质。目前认为PrP基因突变会导致PrP的错误折叠或通过使其他蛋白的错误折叠进而引起脑组织的海绵状病变,最终导致脑功能紊乱,称为蛋白折叠病
;而错误折叠的PrP可以通过某些传播方式使正常人细胞中的正常蛋白质也发生错误折叠并致病。
总之,必须正确地、辩证地认识人类遗传病,这将有助于在医学实践中采取相应的诊断、 治疗和预防措施。
人类遗传病的分类
单基因病
单基因病是由单基因突变
所致。这种突变可发生于两条染色体中的一条,由此所引起的疾病呈常染色体(或性染色体)显性遗传;这种突变也可同时存在于两条染色体上,由此所引起的疾病呈常染色体(或性染色体)隐性遗传。
单基因病相对较少见,在各个种族或民族中的发生频率不同,发生率较高时也仅为1/500,但由于其遗传性,因而危害极大。
多基因病
多基因病是有一定家族史,但没有单基因性状遗传中所见到的系谱特征的一类疾病,如先天性畸形及若干人类常见病(高血压、动脉粥样硬化、糖尿病、哮喘、自身免疫性疾病、老年痴呆、癫痫、精神分裂症、类风湿关节炎、智能发育障碍等)。
环境因素在这类疾病的发生中起不同程度的作用。多基因病是最常见的遗传病
。
染色体病
染色体病是染色体结构或数目异常
引起的一类疾病(综合征)。
从本质上说,这类疾病涉及一个或多个基因结构或数量的变化,故其对个体的危害往往大于单基因病和多基因病,其中最常见的染色体病为Down综合征。染色体病在新生儿中的发病率约为0.5%。
体细胞遗传病
单基因病、多基因病和染色体病的遗传异常发生在人体所有细胞包括生殖细胞(精子和卵子)
的DNA中,并能传递给下一代,而体细胞遗传病的累积突变只在特定的体细胞中发生
,体细胞基因突变是此类疾病发生的基础。这类疾病包括恶性肿瘤、白血病、自身免疫缺陷病以及衰老等。
在经典的遗传病的概念中,并不包括这一类疾病。
线粒体遗传病
线粒体
是细胞内的一个重要细胞器,是除细胞核之外唯一含有DNA的细胞器,具有自己的蛋白质翻译系统和遗传密码。线粒体遗传病
就是由线粒体DNA缺陷引起的疾病,包括Leber视神经萎缩
等。
在线《人类孟德尔遗传》 OMIM
OMIM,由Johns Hopkins大学医学院Victor A. McKusick教授主编的权威医学遗传学
百科全书和数据库。
该数据库至1998年已出到第12版,网址为http://www.omim.org。
疾病的发生与遗传因素和环境因素的关系
- 完全由遗传因素决定发病:与环境因素无关,如先天性成骨不全症等;
- 基本上由遗传决定,但需要环境中一定诱因的作用:如苯丙氨酸尿症、蚕豆病等;
- 遗传因素和环境因素对发病都有作用:不同疾病中遗传率不同:唇裂、腭裂等遗传率在70%以上;先天性心脏病等遗传率不足40%;脊柱裂、高血压等遗传率为50%~60%;
- 发病完全取决于环境因素,与遗传基本上无关:如烧伤、烫伤等外伤。