提要文摘: | 类受体蛋白激酶(receptor-like kinase, RLK)是植物基因组中广泛存在的较大的 基因家族,其广泛参与调节植物生长、胁迫反应和信号转导等生物学过程。番木瓜 基因组有9对染色体组成(2n=18),具有一个相对较小的基因组(大约 372 Mb)。 同时,番木瓜生长速度快、世代较短(9—15个月)、全年持续开花,具有年轻的性 染色体和成熟的遗传转化系统,是果树分子遗传育种中的优势材料。本研究利用生 物信息学方法对番木瓜(Carica papaya L.)基因组中 RLK 基因家族进行全基因组分 析。目前,对 RLK 基因家族和 LysM-RLK 亚家族的系统性研究主要集中在模式植物 拟南芥和水稻中,番木瓜中暂未对 RLK 基因家族和 LysM-RLK 家族进行鉴定和分 析。本文利用生物信息学方法,通过对番木瓜基因组中 RLK 基因家族进行鉴定,从 而获得较为完整的番木瓜 RLK 家族信息。同时,对该家族成员的分类、理化性质、 基因结构、进化、基因复制、功能分化等情况进行全面分析,为下一步 RLK 基因家 族的深入研究奠定信息学基础。本文主要研究结果如下: 1. 通过 RGAs 数据库初步鉴定 RLK 家族,根据 Pfam 数据库中 RLK 家族的结构 域信息对番木瓜的基因进行结构域比对,共获得 378 个 RLK 类型基因。 2. 对鉴定得到的 378 个 RLK 基因进行基因结构预测和基序预测,推断其 CDS 区的插入、缺失和基序数量差异可能造成基因功能分化。 3. 使用软件 Muscle 对 RLK 基因家族的蛋白序列进行多序列比对,通过 IQ-tree 软件来构建进化树,使用软件 iTAK 进行进化树的亚族分类,将 378 个 RLK 家族基 因共划分为 62 个亚族。 4. 从 NCBI 收集到的转录原始测序数据(抗病、抗逆、不同组织及发育过程相关 转录组数据)经过质控以后,用 HISAT2 比对到该参考基因组,然后采用 StringTie 组 装比对上的 reads。采用 FPKM 算法对 read count 做归一化处理,处理后计算差异表 达量和差异表达显著性 P-value。根据差异表达量和 P-value 值筛选差异显著复制基因 对,挑选出 2 对基因对表达量差异显著,进行功能分化验证。 5. 对筛选得到的两对候选基因进行表达量分析,分析结果表明:同源基因响应 干旱胁迫时存在差异,可能发生功能分化。 6. 对 LysM-RLK 基因家族鉴定,共得到 7 个番木瓜 LysM-RLK 家族基因,进化 分析表明番木瓜的 7 个 LysM-RLK 基因可划分为 3 个亚组( Lym-II, Lym-III, LymIV),并分布于 4 条染色体上。基因复制是番木瓜 LysM-RLK 亚家族进化的主要驱 动力,基因复制分析鉴定得到 7 对复制基因。 7. 启动子序列调控元件分析发现 LysM-RLK 家族基因包含多个光响应元件及参 与低温应答和逆境相关激素信号应答的元件。 8. 大规模比较转录组分析系统地解析 LysM-RLK 在番木瓜生物胁迫、非生物胁 迫条件下及不同组织中的基因表达模式,揭示其特异性的表达模式及潜在的生物学 功能。复制基因对的表达分化、结构域组成差异和蛋白质三级结构的变化,暗示其 在进化过程中的亚功能化现象。生物和非生物胁迫条件下的核心共表达网络分析鉴 定了 27 个与 LysM-RLK3 强关联的核心基因,揭示了 LysM-RLK3 潜在的转录调控 模式。相关结果为番木瓜 LysM-RLK 亚家族起源演化、功能分化及其在逆境响应和 生长发育过程中的角色提供了重要见解。 |