[发明专利]一种长链非编码RNA亚细胞定位的预测方法在审
申请号: | 201910688416.X | 申请日: | 2019-07-29 |
公开(公告)号: | CN110415765A | 公开(公告)日: | 2019-11-05 |
发明(设计)人: | 樊永显;陈梅君;朱庆祺;徐海波;崔娟 | 申请(专利权)人: | 桂林电子科技大学 |
主分类号: | G16B20/00 | 分类号: | G16B20/00;G16B5/00 |
代理公司: | 桂林市华杰专利商标事务所有限责任公司 45112 | 代理人: | 杨雪梅 |
地址: | 541004 广西*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种长链非编码RNA亚细胞定位的预测方法,包括如下步骤:1)特征提取;2)选取特征子集及特征参数;3)提取最优特征集;4)用逻辑回归作为预测模型对最优特征集进行预测,从而实现对长链非编码RNA亚细胞的定位预测。这种方法预测速度快、预测准确率高。 | ||
搜索关键词: | 预测 非编码RNA 长链 亚细胞定位 特征集 逻辑回归 特征参数 特征提取 特征子集 预测模型 亚细胞 准确率 | ||
【主权项】:
1.一种长链非编码RNA亚细胞定位的预测方法,其特征在于,包括如下步骤:1)特征提取:在细胞核,细胞质,核糖体和外泌体四个亚细胞位置获取数据集,采用 k联体核苷酸组分方法、伪二核苷酸组分方法和局部结构‑序列三元组方法这三种方法对数据集中的长链非编码 RNA序列进行编码,得到k联体核苷酸组分特征、伪二核苷酸组分特征和局部结构‑序列三元组特征;2)选取特征子集及特征参数:对k联体核苷酸组分特征采用二项分布方法进行筛选,按照二项分布置信度高低对k联体核苷酸组分特征进行排序,再用增量添加特征策略,逐步添加置信度高的特征进行训练,得到最佳数量的k联体核苷酸组分特征子集,然后对伪二核苷酸组分特征进行参数调整,选取伪二核苷酸组分特征的最佳参数;3)提取最优特征集:将步骤1)中的局部结构‑序列三元组特征和步骤2)筛选得到的k联体核苷酸组分特征子集、最佳参数下的伪二核苷酸组分特征合并,采用F‑score方法对合并特征集的每个特征进行评分,将特征按照得分高低重新排序,再用增量添加特征策略,逐步添加得分高的特征进训练集,优化提取特征,得到最优特征集;4)用逻辑回归作为预测模型对最优特征集进行预测,从而实现对长链非编码RNA亚细胞的定位预测。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于桂林电子科技大学,未经桂林电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910688416.X/,转载请声明来源钻瓜专利网。