摘要:目的挖掘与款冬萜类化合物生物合成途径相关的关键酶基因。方法利用IlluminaHiSeq测序平台对野生款冬花蕾和叶进行转录组测序,使用Trinity软件denovo从头组装,并通过基因功能注释、差异表达基因分析等生物信息学方法进行分析,挖掘款冬中萜类化合物生物合成途径相关的酶基因。结果转录组测序获得条高质量reads(SRA号:SRR,SRR),组装获得条Unigene,条Unigene在NR、Swiss-Prot、GO、COG、KEGG等数据库得到注释。鉴定出参与款冬萜类化合物生物合成相关酶基因的个Unigene,包括91个参与三萜骨架生物合成酶基因,32个萜类合成酶基因,6个细胞色素P基因,其中差异表达基因25个,涉及上游MVA途径的4个差异基因在花蕾中表达量高于叶,MEP途径的5个差异基因在叶中表达高于花蕾,另外还有10个基因在叶中高表达,9个基因在花蕾中高表达。根据差异基因HMGR、TPS、AS、CYP基因在花蕾中高表达,推测可能与花蕾中萜类物质含量高有关。结论从款冬转录组数据库中初步获得了可能参与萜类化合物生物合成途径的候选关键酶基因,为进一步阐明款冬萜类化合物生物合成的分子机制奠定基础。
款冬TussilagofarfaraL.为菊科款冬属植物,其干燥花蕾是我国传统中药材款冬花,具有润肺下气、止咳化痰的功效,临床用于治疗新旧咳嗽、喘咳痰多、劳嗽咳血等症[1]。在欧洲,款冬叶也是一种具有悠久历史的治疗咳嗽的草药[2]。研究发现款冬花含有倍半萜、三萜皂苷、黄酮、苯丙素、生物碱、挥发油、色原酮等多种化合物[3],其中萜类化合物是一类主要活性物质,现已分离出款冬酮(tussilagone)、款冬花酮(tussilagonone)、款冬花素内酯(tussilagolactone)等42个倍半萜成分,具有升高血压、呼吸兴奋、抗炎、抗过敏、抗肿瘤等作用[4-6];款冬二醇(faradiol)、山金车二醇(arnidiol)、巴耳新二醇(bauer-7-ene-3β,16α-diol),巴耳三萜醇(bauenenol)和异巴耳三萜醇(isobauerenol)等三萜类成分[3-4],具镇痛、抗炎、抗肿瘤等作用[3,7-10]。尽管萜类化合物具有重要的药理作用,但这些化合物大多在款冬中含量非常低,提高其含量不仅能提高款冬花药材的品质,也能满足不断增长的市场需求。
随着高通量测序技术的发展,可以对基因组信息匮乏物种的基因组和转录组功能基因进行全面细致的研究分析,高通量转录组测序技术已广泛应用于人参、西洋参、凤丹等药用植物次生代谢生物合成途径功能基因的研究[11-13]。应用转录组测序技术,聂佳慧等[14]对不同生长时期款冬叶中苯丙素类成分生物合成相关基因的表达进行了比较分析,贾岩等[15]对款冬花不同发育阶段的苯丙素类成分生物合成相关酶基因进行了比较研究,但作为一种非模式植物,款冬基因组和功能基因的研究还是比较缺乏,生物合成途径信息有限。李静等[16]研究显示款冬花和叶含有相似的化学成分,款冬酮、款冬花素酯等倍半萜类物质在款冬花蕾中的含量远远高于叶,所以为了获得款冬萜类物质生物合成途径的相关酶基因,本研究利用IlluminaHiSeq平台对款冬花蕾、叶进行比较转录组测序分析,挖掘款冬中参与萜类化合物生物合成途径的关键酶基因,为款冬品质改良与功能基因研究奠定基础。
1材料
年3月7日于山西省榆次市榆社县采集未出土野生款冬的带花蕾根茎(海拔m,37°15′N,°59′E),移栽于花盆中,室内自然条件下生长,室内温度16~20℃,3月10日采集新鲜花蕾,花蕾呈紫红色,4月15日采集新鲜叶片,每样重复3次,纯净水冲洗干净,以铝箔纸包裹液氮速冻后,于–80℃保存,用于总RNA的提取。样品经山西中医药大学刘计权副教授鉴定为款冬TussilagofarfaraL.的花蕾和叶。
2方法
2.1总RNA提取
使用Trizol试剂盒(TotalRNAExtractorSK,上海生工生物工程股份有限公司)分别提取款冬花蕾和叶的总RNA,提取流程严格参照说明书进行操作。采用Nanodrop、Qubit2.0、Aglient方法检测RNA样品的纯度、浓度、完整性等,检测合格后,将3份RNA样品分别等量混合用于转录组测序。
2.2文库构建、转录组测序和数据组装
用带有Oligo(dT)的磁珠从总RNA中分离mRNA,加入fragmentationbuffer将mRNA随机打断为短片段;以短片段mRNA为模板,使用六碱基随机引物和逆转录酶合成双链cDNA;纯化双链cDNA并进行末端修复、加poly(A)尾、连接测序接头;用AMPureXPbeads进行片段大小选择,最后通过PCR扩增得到cDNA文库。分别使用Qubit2.0、Agilent对文库的浓度和插入片段大小进行检测,库检合格后,用IlluminaHiSeq
2×bp(Illumina公司,美国)平台进行双末端测序。将测序所得的原始序列进行过滤,去除接头序列及低质量序列等获得高质量序列(cleanreads),利用Trinity软件通过序列之间的重叠信息进行从头组装获得重叠群(contigs),依据序列双端信息及重叠群间的相似性进行聚类整合和延长,得到转录本(transcripts),从中选取最长的转录本作为非重复序列基因(Unigenes)[13]。
2.3功能注释
使用BLASTx软件将Unigene序列分别与NR(ftp://ftp.ncbi.nih.gov/blast/db/)、Swiss-Prot(