第三章 真核生物基因组



《第三章 真核生物基因组》由会员分享,可在线阅读,更多相关《第三章 真核生物基因组(56页珍藏版)》请在文档大全上搜索。
1、第三章第三章 真核生物基因组真核生物基因组细胞核基因组(细胞核基因组(cytoblast cytoblast genomegenome)细胞器基因组(细胞器基因组(organelle organelle genomegenome)由染色体由染色体DNADNA组成:组成:DNADNA+ +蛋白质蛋白质= =核小体核小体线性双链线性双链DNADNA分子分子染色体的数目,绝大多数真核生物染色体的数目,绝大多数真核生物体细胞都是二倍体体细胞都是二倍体基因表达与染色质结构相关基因表达与染色质结构相关*M期期染色体形式染色体形式大部分细胞周期大部分细胞周期染色质染色质( (弥散状弥散状) ) DNADNA
2、染色质的电镜图像染色质的电镜图像a a、常染色质:密度较低,、常染色质:密度较低,一部分基因能被表达一部分基因能被表达b b、异染色质:密度较高,、异染色质:密度较高,不被表达不被表达( (着丝粒、端粒着丝粒、端粒) )DNADNA:约约200bp200bp 组蛋白:组蛋白:H1H1 H2A H2A,H2BH2B H3 H3 H4 H4 核小体核小体 染色体的基本结构染色体的基本结构多为多为 串珠状核小体结构串珠状核小体结构- 念珠样结构不利于基念珠样结构不利于基因表达因表达- 乙酰化组蛋白有利于乙酰化组蛋白有利于基因表达基因表达 核小体的细微结构影响基因表达核小体的细微结构影响基因表达真核生
3、物基因组都是由大分子双链线状真核生物基因组都是由大分子双链线状DNA构成。染色体通常成对出现(双倍构成。染色体通常成对出现(双倍体)。体)。2. 基因组非常庞大,结构基因组非常庞大,结构非常复杂,有多个复制非常复杂,有多个复制起始位点。起始位点。 基因组中存在大量的基因组中存在大量的重复序列重复序列以及以及非编非编码序列码序列。真核生物基因组内非编码序列。真核生物基因组内非编码序列占占90%以上,是与细菌、病毒的重要区以上,是与细菌、病毒的重要区别,在一定程度上也是生物进化的标尺。别,在一定程度上也是生物进化的标尺。 功能基因大多不连续,存在有内含子和功能基因大多不连续,存在有内含子和外显子;
4、外显子;真核生物基因组中也存在一些可移动的真核生物基因组中也存在一些可移动的DNA序列(转座元件)。序列(转座元件)。 多数的真核生物不存在操纵子结构,每一多数的真核生物不存在操纵子结构,每一个基因都单独构成一个转录单位,转录产个基因都单独构成一个转录单位,转录产生单顺反子生单顺反子mRNA,及编码一种蛋白质。,及编码一种蛋白质。 这是原核生物基这是原核生物基因的操纵子结构,因的操纵子结构,转录产生多顺反转录产生多顺反子子mRNA,可编,可编码多种蛋白质。码多种蛋白质。原核生物的多顺反子原核生物的多顺反子真核生物的单顺反子真核生物的单顺反子非编码序列非编码序列核蛋白体结合位点核蛋白体结合位点起
5、始密码子起始密码子终止密码子终止密码子编码序列编码序列PPP5 3 蛋白质蛋白质PPPmG -5 3 蛋白质蛋白质AAA 真核生物结构基因的真核生物结构基因的DNA序列由编码序序列由编码序列和非编码序列两部分交替组成,编码序列和非编码序列两部分交替组成,编码序列是不连续的,被非编码序列分割开来,列是不连续的,被非编码序列分割开来,称为断裂基因。其包括外显子和内含子。称为断裂基因。其包括外显子和内含子。 断裂基因断裂基因(split gene) 外显子(外显子(exonexon):编码的:编码的DNADNA序列,即被序列,即被表达的表达的DNADNA区段区段内含子(内含子(intronintro
6、n):非编码的:非编码的DNADNA序列序列Gilbert Gilbert (19781978年)提出内含子、外显子概念年)提出内含子、外显子概念 在每个外显子和内含子的接头区都是一段在每个外显子和内含子的接头区都是一段高度保守的共有序列,内含子的高度保守的共有序列,内含子的5端是端是GT,3端是端是AG,这种接头方式称为,这种接头方式称为GT-AG法则法则,普遍存在于真核生物中,是普遍存在于真核生物中,是RNA剪接的识剪接的识别信号,转录后的前体别信号,转录后的前体RAN中的内含子剪中的内含子剪接位点。接位点。 断裂基因存在是生物进化的结果,是从断裂基因存在是生物进化的结果,是从复制水平而言
7、,复制水平而言,不同的外显子可分别编不同的外显子可分别编码不同的功能结构域,基因外显子不同码不同的功能结构域,基因外显子不同的组合产生新的编码蛋白质,即是外显的组合产生新的编码蛋白质,即是外显子改组子改组。如血红蛋白和肌红蛋白均由独。如血红蛋白和肌红蛋白均由独立的外显子编码结合血红素的结构域。立的外显子编码结合血红素的结构域。 重复序列:多拷贝的相同或近似序列的重复序列:多拷贝的相同或近似序列的DNADNA片段片段真核生物基因组中通常存在大量的重复序真核生物基因组中通常存在大量的重复序列,可占整个基因组列,可占整个基因组DNADNA的的90%90%以上。以上。按复性动力学方法可将这些重复序列分
8、为按复性动力学方法可将这些重复序列分为高度重复序列高度重复序列,中度重复序列中度重复序列和和低度重复低度重复序列(单拷贝序列)序列(单拷贝序列)三大类。三大类。 (一)高度重复序列(一)高度重复序列高度重复序列在基因组中重复频率高,高度重复序列在基因组中重复频率高,可达可达10106 6次,因此复性速度很快。高度次,因此复性速度很快。高度重复序列在基因组中所占比例随种属重复序列在基因组中所占比例随种属而异,一般在而异,一般在101060%60%范围内。范围内。人的高度重复序列约占整个基因组的人的高度重复序列约占整个基因组的20%20%左右。左右。是由两个相同顺序的是由两个相同顺序的互补拷贝在同
9、一互补拷贝在同一DNADNA双链上反向排列而成。双链上反向排列而成。高度重复序列按其结构特点可分为两种:高度重复序列按其结构特点可分为两种: 反向重复序列(反向重复序列(inverted repeatsinverted repeats)反向重复序列的两种形式反向重复序列的两种形式发卡结构发卡结构回回 文文 结结 构构卫星卫星DNADNA(satellite DNAsatellite DNA)卫星卫星DNADNA的重复单位一般由的重复单位一般由2 270 bp70 bp组组成,成串排列。成,成串排列。卫星卫星DNADNA占基因组的比例随种属而异,占基因组的比例随种属而异,在在0.50.531%
10、31% 范围内。范围内。人类基因组中可分离出三类卫星:人类基因组中可分离出三类卫星:大卫星大卫星DNADNA(macrosatellite DNAmacrosatellite DNA):):其重复单位为其重复单位为5 5 171 bp171 bp,主要分布于染色体的,主要分布于染色体的着丝粒区。着丝粒区。小卫星小卫星DNADNA(minisatellite DNAminisatellite DNA):):其重复单位为其重复单位为1515 70 bp70 bp,存在于常染色体。,存在于常染色体。微卫星微卫星DNA/DNA/短串联重复序列(短串联重复序列(microsatellite micros
11、atellite DNA/short tandem repeat, STRDNA/short tandem repeat, STR):): 其重复单位为其重复单位为2 2 5 bp5 bp,存在于常染色体,常见,存在于常染色体,常见于内含子中。于内含子中。 人类基因组人类基因组DNADNA中平均每中平均每6 610kb10kb就有一个就有一个STRSTR位点位点 。不同个体之间在一个同源。不同个体之间在一个同源STRSTR位点的重复位点的重复次数不同。次数不同。 由于重复单位及重复次数不同,使由于重复单位及重复次数不同,使其在不同种族,不同人群之间的分布具有很大差其在不同种族,不同人群之间的分