[发明专利]基于网络表示学习的表型关联关系分析方法在审

专利信息
申请号: 201910501477.0 申请日: 2019-06-11
公开(公告)号: CN110246542A 公开(公告)日: 2019-09-17
发明(设计)人: 彭佳杰;惠薇薇;管姣姣;尚学群 申请(专利权)人: 西北工业大学
主分类号: G16B20/00 分类号: G16B20/00;G16B40/00
代理公司: 西北工业大学专利中心 61204 代理人: 王鲜凯
地址: 710072 *** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 表型 关联关系分析 特征向量 网络表示 子网 蛋白质交互 表型特征 准确度 相似度 网络 表型研究 欧氏距离 向量化 预测表 映射 学习 衡量 挖掘 应用
【权利要求书】:

1.一种基于网络表示学习的表型关联关系分析方法,其特征在于包括以下步骤:

步骤一、根据表型和基因的关系,将与表型相关的所有基因映射到蛋白质交互网络中得到表型子网;

步骤二、利用公式(1)获取随机游走节点序列;

其中,vk是当前节点,x是vk的邻居节点之一,是指节点x和vk之间边的权重,对于无向图,X是节点x的邻居节点的集合,是归一化的权重值;α(t,x)定义如下:

此处,t是节点v的上一个节点,这意味着随机游走序列刚经过边(t,v),并且当前节点是v;dtx是指两个网络中的节点t和x之间的最短路径长度;节点x是节点v的邻居节点之一;dtx的值此处只考虑三种情况,即0,1和2;即节点x到节点t的距离是三种情况之一;p是一个返回参数,控制了随机游走序列返回到节点t的概率;参数q是一个控制搜索向内和向外不同采样策略的节点,调节参数大小,允许有两种不同的搜索方向,即深度优先搜索和广度优先搜索;深度优先搜索允许远离节点t,广度优先搜索更倾向于访问节点t附近的节点;

步骤三、对于随机游走序列中的每个节点分配表型子网;在蛋白质网络中,子网之间是有重叠的,一个节点可能属于多个不同的子网,不同序列中相同的节点在子网上服从一种分布;对于同一个节点生成的不同序列,假定不同的采样结果是随机游走到不同的子网导致的;基于这个假设,随机游走序列同时获取子网之间的拓扑关系,在不同的节点序列中,对于同一个节点,其所属的子网的概率也不同;

其中,N(p,s)表示序列s中有多少个基因节点属于表型子网p;P是s中涉及到的所有的表型,p′属于P;除了考虑序列中涉及到的子网的个数之外,每一个表型子网涉及到的基因数目也会影响这个分布情况;因此,每一个表型子网的大小;

在一个序列中,每一个节点上每个表型的分布概率与Pr1×Pr2成正比;通过对这个序列中每个基因节点属于的不同的表型进行采样;为所有序列中的每一个节点都分配了一个特定的子网;

步骤四、子网的向量化表示;基于skip-gram模型,定义目标函数;

其中,|s|是指节点的随机游走序列s的长度;对于节点序列s中的每一个节点vi,N(vi)是指与节点vi同时出现在大小为t的滑动窗口中的节点;pi是指在序列s中分配给节点vi的表型子网;N(pi)是指N(vi)中节点对应的表型子网;目标函数包括两部分,一个是已知一个节点,最大化该节点邻居与该节点同时出现的概率,另一个是最大化给出表型的邻居出现的概率;此处,基于独立性假设,即已知节点vi,生成每一个邻居节点的概率之间是相互独立的;定义如下公式:

其中,pj是pi的邻域中的一个元素;使用softmax函数计算预测概率,该函数是由节点的上下文表示和自身表示的点积表示的;

其中,是表型pj的特征表示,是表型pi的特征表示;和分别是基因节点vj和vi的特征表示;最终的目标函数为:

针对提出的目标函数,使用随机梯度下降的方法求得解析解;在得到节点和子网的低维向量表示之后,为了充分利用子网包含的信息,将与该表型相关的节点特征和子网的特征表示拼接起来作为子网最终的特征向量;

其中,是学习到的子网p的低维向量表示,vi是与表型子网p相关的基因节点之一;假设最终得到的特征表示的维度为d,根据公式(12)得到两个表型之间的相似度;p1i和p2i分别对应表型p1和p2特征的第i个分量;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910501477.0/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top