深层神经网络“DeepTFactor”可预测转录因子
2021年1月12日PNAS报道,韩国科学技术高等研究院(KAIST)和美国加州大学圣地亚哥分校(UCSD)的联合研究团队开发了一个名为“DeepTFactor”的深层神经网络,可以预测给定蛋白质序列是否为转录因子(transcription factors,TFs)。该工具突破了以往TFs预测的局限,可以对所有生物体转录系统实现精准预测,将成为了解生物体调控系统的有用工具。
转录因子是具有序列特异性的DNA结合蛋白,通过调节特定基因的转录,来调节细胞基因表达。以往通过分析与已经定性的TFs的DNA结合域的序列同源性来进行TF功能识别和预测,如果没有可参照同源序列的TFs就很难预测。此次,研究者开发了一个基于深度学习的工具DeepTFactor,使用卷积神经网络来提取蛋白质的特征,通过比对DNA结合域和其他潜在特征进行TF预测。DeepTFactor在大肠杆菌K-12 MG1655中预测了332个候选TFs。其中,84个候选TFs属于y-ome,这是一组缺乏实验证据的功能基因集合。研究者通过实验验证了DeepTFactor预测的结果,进一步表征了YqhC、YiaU和YahB三个预测TFs的全基因组结合位点。
DeepTFactor将作为预测TF的有用工具,这对于理解感兴趣的生物体的调控系统是必要的。研究者将DeepTFactor作为一个独立的程序,适用于所有生物体的转录系统预测。
吴晓燕 编译自 https://phys.org/news/2021-01-deeptfactor-transcription-factors.html
原文链接:https://www.pnas.org/content/118/2/e2021171118
原文标题:DeepTFactor: A deep learning-based tool for the prediction of transcription factors