[发明专利]一种大规模标注lncRNA功能的方法有效
申请号: | 201610406692.9 | 申请日: | 2016-06-12 |
公开(公告)号: | CN106446601B | 公开(公告)日: | 2019-10-01 |
发明(设计)人: | 张祖平;邓磊;张敬普 | 申请(专利权)人: | 中南大学 |
主分类号: | G16B20/00 | 分类号: | G16B20/00 |
代理公司: | 长沙朕扬知识产权代理事务所(普通合伙) 43213 | 代理人: | 周志中 |
地址: | 410000 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种大规模标注lncRNA功能的方法,根据lncRNA‑蛋白质的共表达数据及相互作用数据、lncRNA的表达谱数据和蛋白质的相互作用数据,构建一个全局的异构无向图,通过Katz度量计算lncRNA顶点和蛋白质顶点的相似性,从而依据相似蛋白质的功能标注信息对未知的lncRNA进行功能标注。本发明与现有的技术相比,在考虑lncRNA‑蛋白质共表达信息的基础上,也整合了lncRNA‑蛋白质相互作用数据、lncRNA的表达谱数据和蛋白质的相互作用数据。独立测试表明,本发明预测的召回率、准确性和F‑measure都比其它的方法更高,效果更好。由于本发明是一种基于图的全局计算方法,所以可以一次标注出大量的lncRNA,有效的克服了以前局部方法一次只能标注少量lncRNA功能的问题。 | ||
搜索关键词: | 一种 大规模 标注 lncrna 功能 方法 | ||
【主权项】:
1.一种大规模标注lncRNA功能的方法,其特征在于,包括如下步骤:步骤1、根据lncRNA‑蛋白质的共表达数据、相互作用数据计算lncRNA和蛋白质的皮尔逊相关系数,并根据相关系数构造lncRNA‑蛋白质关系网络;步骤2、根据lncRNA在人类24个组织或者细胞类型中的表达谱计算lncRNA之间的皮尔逊相关系数,据此构造lncRNA相似性网络;步骤3、根据蛋白质相互作用数据构造蛋白质相互作用网络,并结合lncRNA‑蛋白质关系网络和lncRNA相似性网络构建全局网络的邻接矩阵A;步骤4、利用上述构建的全局网络,根据公式(1)计算lncRNA节点和蛋白质节点的Katz度量,此Katz度量代表lncRNA节点和蛋白质节点的相似性度量,Katz度量值越大,说明这个蛋白质与lncRNA越相似;其中,公式(1)为:SLP=βLP+β2(L*LP+LP*P)+β3(LP*LPT*LP+L2*LP+L*LP*P+LP*P2) (1)其中,β是不同长度路径的权重系数,满足β<1/||A||2;L为lncRNA相似性网络的邻接矩阵;LP是lncRNA‑蛋白质的关系网络的邻接矩阵;P为蛋白质相互作用网络;步骤5、对上述步骤得到的SLP进行降序排列,按照分值选择其中前N个蛋白质,分别找出前N个蛋白质中每个蛋白质所对应的功能注释,对每个功能注释,根据公式(2)计算此lncRNA具有该功能的概率,其中,公式(2)为:其中,Pl(Ti)为从SLP中降序排列的分值中选择前N个蛋白质,对于每一个GO术语被指定给lncRNA的概率;SLP是lncRNA l和它的邻近编码基因的Kazt相似性分数;Ind(Ti)是一个指示函数,定义如下:Pl(Ti)越大,则lncRNA l越可能具有该功能。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610406692.9/,转载请声明来源钻瓜专利网。