[发明专利]一种大规模标注lncRNA功能的方法有效

专利信息
申请号: 201610406692.9 申请日: 2016-06-12
公开(公告)号: CN106446601B 公开(公告)日: 2019-10-01
发明(设计)人: 张祖平;邓磊;张敬普 申请(专利权)人: 中南大学
主分类号: G16B20/00 分类号: G16B20/00
代理公司: 长沙朕扬知识产权代理事务所(普通合伙) 43213 代理人: 周志中
地址: 410000 湖*** 国省代码: 湖南;43
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种大规模标注lncRNA功能的方法,根据lncRNA‑蛋白质的共表达数据及相互作用数据、lncRNA的表达谱数据和蛋白质的相互作用数据,构建一个全局的异构无向图,通过Katz度量计算lncRNA顶点和蛋白质顶点的相似性,从而依据相似蛋白质的功能标注信息对未知的lncRNA进行功能标注。本发明与现有的技术相比,在考虑lncRNA‑蛋白质共表达信息的基础上,也整合了lncRNA‑蛋白质相互作用数据、lncRNA的表达谱数据和蛋白质的相互作用数据。独立测试表明,本发明预测的召回率、准确性和F‑measure都比其它的方法更高,效果更好。由于本发明是一种基于图的全局计算方法,所以可以一次标注出大量的lncRNA,有效的克服了以前局部方法一次只能标注少量lncRNA功能的问题。
搜索关键词: 一种 大规模 标注 lncrna 功能 方法
【主权项】:
1.一种大规模标注lncRNA功能的方法,其特征在于,包括如下步骤:步骤1、根据lncRNA‑蛋白质的共表达数据、相互作用数据计算lncRNA和蛋白质的皮尔逊相关系数,并根据相关系数构造lncRNA‑蛋白质关系网络;步骤2、根据lncRNA在人类24个组织或者细胞类型中的表达谱计算lncRNA之间的皮尔逊相关系数,据此构造lncRNA相似性网络;步骤3、根据蛋白质相互作用数据构造蛋白质相互作用网络,并结合lncRNA‑蛋白质关系网络和lncRNA相似性网络构建全局网络的邻接矩阵A;步骤4、利用上述构建的全局网络,根据公式(1)计算lncRNA节点和蛋白质节点的Katz度量,此Katz度量代表lncRNA节点和蛋白质节点的相似性度量,Katz度量值越大,说明这个蛋白质与lncRNA越相似;其中,公式(1)为:SLP=βLP+β2(L*LP+LP*P)+β3(LP*LPT*LP+L2*LP+L*LP*P+LP*P2)   (1)其中,β是不同长度路径的权重系数,满足β<1/||A||2;L为lncRNA相似性网络的邻接矩阵;LP是lncRNA‑蛋白质的关系网络的邻接矩阵;P为蛋白质相互作用网络;步骤5、对上述步骤得到的SLP进行降序排列,按照分值选择其中前N个蛋白质,分别找出前N个蛋白质中每个蛋白质所对应的功能注释,对每个功能注释,根据公式(2)计算此lncRNA具有该功能的概率,其中,公式(2)为:其中,Pl(Ti)为从SLP中降序排列的分值中选择前N个蛋白质,对于每一个GO术语被指定给lncRNA的概率;SLP是lncRNA l和它的邻近编码基因的Kazt相似性分数;Ind(Ti)是一个指示函数,定义如下:Pl(Ti)越大,则lncRNA l越可能具有该功能。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201610406692.9/,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top