多组学关联分析在微生物研究中的应用

日期:2018-12-17 09:20

浏览量:170

微生物作为地球上进化历史最长、生物量最大、生物多样性最丰富的生命形式,推动地球化学物质循环,影响人类健康乃至地球生态系统,蕴藏着极为丰富的物种资源和基因资源。微生物还可分泌多种多样功能各异的活性物质,在天然药物开发、食品加工、环境处理中应用广泛。微生物群落更是因为复杂的群落结构以及多样性,直接或间接影响了地球上包括人在内的所有生命体的疾病与健康状况。
随着组学技术的发展,转录组学、蛋白质组学、代谢组学等在微生物领域的应用,拓展了我们对微生物的认识。多个组学的整合应用,更是让我们对微生物的群落结构、功能、代谢等系统研究成为可能。
微生物培养技术使得研究者能从微生物单一克隆的角度对微生物进行研究,加深对于微生物生理特征、代谢功能的认识,以此来实现微生物的开发与利用。组学技术目前已经深入到几乎所有的可培养微生物研究当中。
通常,通过各种培养技术得到不同处理、不同种属、不同生长阶段的微生物材料后,进行转录组、蛋白质组、代谢组数据的测定。不同的组学技术分别可以进行差异表达分析和功能富集,再通过生物信息学手段将关键基因/蛋白/代谢物进行关联分析。获得基因-蛋白-代谢物的全景图,有助于全面多角度的阐释微生物的研究意义。

                                                                       

下面通过一则以酵母为研究对象的案例看一下多组学关联分析在微生物研究中的具体应用。其文献名为“Absolute Quantification of Protein and mRNA Abundances Demonstrate Variability in Gene-Specific Translation Efficiency in Yeast”,2017年3月于Cell Systems期刊上发表。

文献

增值细胞中,蛋白合成是能量消耗的主要过程,了解控制蛋白质合成的因素在生物领域及生物技术领域至关重要。
该文对10种不同的环境条件下(EN.PK113-7D、三中胁迫条件(乙醇、渗透压、温度),每种胁迫分别设置3个梯度)的酿酒酵母,采用多组学及信息分析方法进行研究。在10种环境中培养的酵母中共鉴定到了5354个 mRNA 和2198个蛋白质以及在参比条件下的1384个蛋白的转换。所有环境中的总蛋白质和 mRNA 相关系数较低(0.46),但对于差异表达蛋白质(n=202)与 mRNA 相关系数为0.88。基于以上数据模拟转化效率,不同基因转换效率差异在400倍以上。通过回归分析发现 mRNA 丰度(61%)和翻译延伸(15%)是控制蛋白合成的主要原因。代谢通量平衡分析进一步证明只有线粒体代谢与转录组水平呈正相关。基于以上分析,为后续酵母的研究提供了更广阔的空间。

 
研究结果
1.  参比条件下蛋白质和 mRNA 的绝对定量

                                                                                                       

2.  10种环境条件下 mRNA 和蛋白丰度的整合

不同条件下,差异表达的蛋白质与相应的 mRNA 高度一致,该图证明:转录对蛋白质水平的变化起重要作用。图2A展示了所有 mRNA 和蛋白质的相关性,图2B展示差异蛋白和 mRNA 的相关性,普遍偏高。图2C通过皮尔逊线性回归方程在研究的环境条件下统计 mRNA 和蛋白质之间的线性关系,灰色(中位数:0.88)是显著差异 mRNA 和蛋白质的相关性,绿色(中位数:0.48)是所有鉴定到的蛋白与 mRNA 的差异性。

                                                        

3.  葡萄糖限制条件下的蛋白质转换

首先进行赖氨酸相关基因敲除,每隔半个小时转换一次,先轻后重(C13,N15)轮流在培养基中培养,合计培养13h。转换率最高的前100个蛋白主要集中在核糖体和氨基酸代谢途径。用于生物合成的21%蛋白质能量用在蛋白质转换上(文献支持),从而蛋白质转变成为生物新陈代谢的一个重要方面。

                                                                                   

4.翻译效率及其调控因素

通过回归分析发现相应的 mRNA 丰度(61%)和核糖体延伸速度(15%)是控制蛋白合成的主要原因(图4A)。下图B展示了翻译效率前10位的氨基酸序列信息,可以看出起始密码子旁边嘌呤含量较高,尤其在-1和-3位点(赖氨酸-AAA和丝氨酸-TCT频率较高)。图4C展示了翻译效率后10位的氨基酸序列,没有发现什么共同点。另外,不同条件下蛋白质表达效率基本一致,除了高温条件(翻译效率增加)。
                                                              
5.  转录调节通路聚类
利用一个基因组级别的代谢模型研究转录调控对代谢组的调控。下图中黄点代表线粒体、蓝色代表过氧化物、白色代表细胞质、绿色代表内质网。图中可以看出转录组调控的代谢流与线粒体功能有关,酵母的新陈代谢是 ATP 最大能量的输出。
                                                                    

参考资料

 

Lahtvee P J, Sánchez B J, Smialowska A, et al. Absolute Quantification of Protein and mRNA Abundances Demonstrate Variability in Gene-Specific Translation Efficiency in Yeast[J]. Cell Systems, 2017, 4.