[发明专利]蛋白质特征构建方法、装置、设备、存储介质及程序产品在审

专利信息
申请号: 201911329568.7 申请日: 2019-12-20
公开(公告)号: CN111091874A 公开(公告)日: 2020-05-01
发明(设计)人: 汤一凡;崔朝辉;赵立军;张霞 申请(专利权)人: 东软集团股份有限公司
主分类号: G16B35/00 分类号: G16B35/00;G16B40/20;G16B50/10
代理公司: 北京集佳知识产权代理有限公司 11227 代理人: 柳欣
地址: 110179 辽*** 国省代码: 辽宁;21
权利要求书: 查看更多 说明书: 查看更多
摘要: 本申请公开了一种蛋白质特征构建方法,预先得到基因本体数据库中每条基因本体信息对应的向量,当需要针对某个蛋白质例如待识别蛋白质构建特征向量时,根据基因本体数据库确定待识别蛋白质的目标基因本体信息,根据目标基因本体信息具有的身份标识从预先得到的向量中确定目标基因本体信息对应的目标向量。接着,根据目标向量构建待识别蛋白质的特征向量。由于基因决定了蛋白质的功能及特性,故该方法基于基因本体信息构建的蛋白质的特征向量,基因本体信息反映了基因信息及分子功能或生物过程,即在构建蛋白质特征时考虑了蛋白质的基因信息及分子功能或生物过程,从而提高构建的蛋白质特征的准确率。
搜索关键词: 蛋白质 特征 构建 方法 装置 设备 存储 介质 程序 产品
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东软集团股份有限公司,未经东软集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201911329568.7/,转载请声明来源钻瓜专利网。

同类专利
  • 一种基于深度学习的糖肽质谱图预测装置-202310828711.7
  • 杨奕;方群 - 浙江大学杭州国际科创中心
  • 2023-07-07 - 2023-09-29 - G16B35/00
  • 本发明公开了一种基于深度学习的糖肽质谱图预测装置,包含肽段编码模块、糖链编码模块、特征融合模块、肽段谱图输出模块、糖链谱图输出模块和谱图合并模块;预测过程为:将糖肽分为肽段和糖链;将肽段部分输入肽段编码模块,生成多个特征表示;将糖链部分输入糖链编码模块,生成多个特征表示;将肽段部分和糖链部分的多个特征表示分别输入特征融合模块进行特征融合;将肽段部分特征表示输入肽段谱图输出模块,输出肽段部分谱图;将糖链部分特征表示输入糖链谱图输出模块,输出糖链部分谱图;将肽段部分谱图和糖链部分谱图输入谱图合并模块,拼合成糖肽的完整质谱图。本发明能够处理糖肽非线性结构问题,准确预测糖肽质谱图。
  • 一种单细胞转录组细胞碎片和多细胞过滤方法、介质和设备-202310181167.1
  • 陈哲名;郎秋蕾;韩斐然 - 杭州联川生物技术股份有限公司
  • 2022-11-03 - 2023-09-26 - G16B35/00
  • 本发明公开了一种单细胞转录组低质量细胞过滤方法,涉及涉及生物数据处理方法。包括以下步骤:对细胞进行分群;按基因取表达量平均值,生成细胞群的特征表达谱;将所述细胞群的特征表达谱随机两两组合,生成人工多细胞;合并所述人工多细胞表达谱和真实细胞表达谱,计算每个细胞间的距离;在规定范围内设置若干等距的邻域,计算每个邻域下,每个真实细胞在邻域内的人工多细胞比例;统计每个邻域下的人工多细胞比例分布,求其双峰系数,并以双峰系数最大的邻域为最优邻域;在最优邻域下,将人工多细胞比例最大的规定数量的真实细胞认定为多细胞,将其从真实细胞表达谱中删除。提高了单细胞转录组数据的过滤标准和精准度,增强了数据的可靠性。
  • 一种蛋白质复合体结构预测方法-202310945078.X
  • 郑伟;张阳 - 郑伟
  • 2023-07-31 - 2023-09-19 - G16B35/00
  • 本申请涉及人工智能及生物技术领域,尤其涉及一种蛋白质复合体结构预测方法。该方法包括:构建宏基因组序列数据库,所述宏基因组序列数据库包括第三方数据库和自主构建数据库;基于所述宏基因组序列数据库,构建蛋白质单体MSA;对所述蛋白质单体MSA进行配对,将配对MSA进行排序并连接,以构建蛋白质复合体MSA;基于Mscore评价得到目标数量的蛋白质复合体MSA,并将所述目标数量的蛋白质复合体MSA输入DMFold‑Multimer算法中,以生成对应的蛋白质复合体结构模型;根据预测的TM‑score打分标准对所述蛋白质复合体结构模型进行排序,选取打分最高的蛋白质复合体结构模型作为目标模型集。
  • 一种单细胞转录组濒死细胞和多细胞过滤方法、介质和设备-202310175918.9
  • 陈哲名;郎秋蕾;韩斐然 - 杭州联川生物技术股份有限公司
  • 2022-11-03 - 2023-07-25 - G16B35/00
  • 本发明公开了一种单细胞转录组低质量细胞过滤方法,涉及涉及生物数据处理方法。包括以下步骤:对细胞进行分群;按基因取表达量平均值,生成细胞群的特征表达谱;将所述细胞群的特征表达谱随机两两组合,生成人工多细胞;合并所述人工多细胞表达谱和真实细胞表达谱,计算每个细胞间的距离;在规定范围内设置若干等距的邻域,计算每个邻域下,每个真实细胞在邻域内的人工多细胞比例;统计每个邻域下的人工多细胞比例分布,求其双峰系数,并以双峰系数最大的邻域为最优邻域;在最优邻域下,将人工多细胞比例最大的规定数量的真实细胞认定为多细胞,将其从真实细胞表达谱中删除。提高了单细胞转录组数据的过滤标准和精准度,增强了数据的可靠性。
  • 一种单细胞转录组Pseudo-Cell分析方法、模型及存储介质和设备-202211523697.1
  • 胡超;胡龙飞 - 新格元(南京)生物科技有限公司
  • 2022-12-01 - 2023-05-26 - G16B35/00
  • 本发明公开了一种单细胞转录组Pseudo‑Cell分析方法、模型及存储介质和设备。所述方法包括以下步骤:(1)基于单细胞表达矩阵构建细胞与细胞之间基于表达谱高维空间距离的关系矩阵,通过关系矩阵分析细胞之间的相似性;(2)通过社区发现算法基于所述细胞之间的相似性划分为不同的子细胞群;(3)基于步骤(2)得到的细胞分群信息,整合每个子细胞群内部的表达谱,得到新整合的表达谱矩阵。本发明通过在划分细胞分群关系的社区发现算法中引入社区规模限制参数以及高分辨率下迭代分群的思路,将表达相似性最高的细胞分群整合为Pseudo‑Cell,解决了在单细胞数据中广泛存在的以dropout为主的数据噪音问题。
  • 一种基于卷积神经网络的特异性启动子表达信息预测方法-202211438896.2
  • 林娜;孙红波;王滔;何涛 - 南京腾鸿医疗科技有限公司
  • 2022-11-17 - 2023-04-07 - G16B35/00
  • 本发明公开了一种基于卷积神经网络的特异性启动子表达信息预测方法,该方法包括以下步骤:启动子序列及表达信息数据的预处理;构建卷积神经网络模型;将特征序列的表达信息进行分类;对所述卷积神经网络模型进行编译;对所述卷积神经网络模型进行训练及评估。本发明通过对特异性启动子序列的特征提取与表达信息分类的模型构建,能够快速对启动子的表达位置以及结合蛋白进行预测,相比于通过实验的方法提取启动子序列再进行测序的一系列实验步骤而言,该方法能够节省耗材成本,同时非常便捷,不需要复杂的实验过程,其预测的速度也比经过实验得来的结果快很多,这对于基因的转录调控研究也具有重要的指导作用。
  • 生物组学调控关系分析方法及装置、电子设备、介质-202211591661.7
  • 刘超 - 南京医基云医疗数据研究院有限公司
  • 2022-12-12 - 2023-03-10 - G16B35/00
  • 本发明涉及生物技术领域,具体涉及一种生物组学调控关系分析方法及装置、电子设备、介质,所述方法包括:获取多个对象在特定时间的生物组学特征数据,构建所述多个对象与所述特定时间、所述特征数据的第一数据矩阵;通过混合线性模型获取所述第一数据矩阵中满足预设阈值的特征数据,得到第二数据矩阵;通过重复采样滞后相关性模型确定第二数据矩阵中任意两个特征数据之间的相关性系数及置信度。所述方法通过在控制环境下等时间间隔的采集多个生物组学的特征数据进行分析,以实现动态数据趋势下的多组调控关系分析,并能够根据构建的多条件筛选机制,对目标研究方向预设筛选条件而获取相应的调控关系分析结果。
  • 一个计算机控制及数据匹配方法-202211464548.2
  • 管仁初;孙航;曾安;王禹霄飞;丰小月 - 吉林大学
  • 2022-11-22 - 2023-03-07 - G16B35/00
  • 本发明一个计算机控制及数据匹配方法,计算机控制及数据匹配方法利用单细胞数据和空间转录组数据作为输入,使用利用阻尼加权最小二乘法来扩展并且确定空间点的细胞类型,形成精确组成的反卷积步处理,精确组成的反卷积处理对空间转录组数据进行第一反卷积处理,通过阻尼加权最小二乘法识别每个空间点的细胞类型,然后推断每个空间点中存在不同细胞类型以及每种细胞类型的比例,其中以细胞类型只有一种的空间点作为种子节点。
  • 一种单细胞转录组低质量细胞过滤方法、介质和设备-202211367300.4
  • 陈哲名;郎秋蕾;韩斐然 - 杭州联川生物技术股份有限公司
  • 2022-11-03 - 2023-02-10 - G16B35/00
  • 本发明公开了一种单细胞转录组低质量细胞过滤方法,涉及生物数据处理方法。包括以下步骤:对细胞进行分群;按基因取表达量平均值,生成细胞群的特征表达谱;将所述细胞群的特征表达谱随机两两组合,生成人工多细胞;合并所述人工多细胞表达谱和真实细胞表达谱,计算每个细胞间的距离;在规定范围内设置若干等距的邻域,计算每个邻域下,每个真实细胞在邻域内的人工多细胞比例;统计每个邻域下的人工多细胞比例分布,求其双峰系数,并以双峰系数最大的邻域为最优邻域;在最优邻域下,将人工多细胞比例最大的规定数量的真实细胞认定为多细胞,将其从真实细胞表达谱中删除。提高了单细胞转录组数据的过滤标准和精准度,增强了数据的可靠性。
  • 一种基于失调调控关系的个性化病前状态识别方法-202211192906.9
  • 许鹏;霍彦好;鲍振申;李先彬;刘文斌 - 广州大学
  • 2022-09-28 - 2023-02-03 - G16B35/00
  • 本发明属于生物信息学领域,公开了一种基于失调调控关系的个性化病前状态识别方法,包括以下步骤:S1:计算每个时间点调控关系的调控强度;S2:计算调控关系每个时间点调控强度的变化分数;S3:计算每个时间点个体的调控变化分数;S4:确定特定疾病病前状态相关失调调控标志物;S5:基于疾病病前状态相关失调调控标志物识别疾病病前状态。本发明提供的技术方案在识别疾病病前状态方面有很高的精度,可以确定一组特定疾病固定的失调调控关系标志物,具有临床实施意义;计算过程简单,计算耗时少。
  • 一种基于生物网络的个性化疾病病前状态识别方法-202210380866.4
  • 刘文斌;鲍振申;许鹏;李先彬;霍彦好;顾丽丽 - 广州大学
  • 2022-04-12 - 2022-07-22 - G16B35/00
  • 一种基于生物网络的个性化疾病病前状态识别方法,包括:对获取的单个体个性化时序样本数据进行标准化处理,根据时间点将标准化处理后的样本时序数据分为参考样本数据与待测样本数据;根据参考样本数据,得到基准样本数据;从全局蛋白质互作网络提取每个基因的表达模式,计算待测样本数据或参考样本数据中,每个时间点中每个基因相对于基准样本的距离分数;根据距离分数,得到每个时间点标准化的距离分数,根据每个时间点标准化距离分数,识别疾病病前状态;本发明识别疾病病前状态精度高,由于该方法主要是使用基因间调控关系作为背景进行数据处理和分析,因此该方法更具有生物意义,计算过程简单,计算耗时少。
  • 一种基于统计机器学习的生物芯片数据特征工程算法-202210403504.2
  • 王恒;薛松;连锋 - 上海交通大学医学院附属仁济医院
  • 2022-04-18 - 2022-07-08 - G16B35/00
  • 一种基于统计机器学习的生物芯片数据特征工程算法,包括以下步骤:生成数据矩阵;进行z‑score标准化;计算值,筛选大值基因数据;生成相关系数矩阵;筛选基因对;计算复相关系数;标记基因复相关系数改变。本发明有利于在大量生物芯片数据中,分析数据之间的相关性,利用特征选择的方法根据需求选取反映数据组间差异的统计量F值较大的一定数目的基因。本发明利用相关分析统计量相关系数、偏相关系数和复相关系数进行特征选择,有利于进一步减少数据维度,且有利于推测不同实验处理条件下,两两基因表达之间的相关关系改变。
  • 一种基因表达数据处理方法及其相关设备-202210243208.0
  • 张陈;金圣海;田广库;艾迪歌 - 东软集团股份有限公司
  • 2022-03-11 - 2022-06-28 - G16B35/00
  • 本申请实施例公开了一种基因表达数据处理方法及其相关设备,该方法包括:在获取到大量信号通路、大量基因表达数据及其在目标疾病下的标注信息之后,可以先利用这些信号通路、这些基因表达数据及其在目标疾病下的标注信息,构建待使用分类模型,以使该待使用分类模型在目标疾病下具有较好的分类性能;再依据该待使用分类模型以及这些信号通路,对这些基因表达数据进行信息分析处理,得到这些基因表达数据在所述目标疾病下的信息分析结果,以使该信息分析结果能够准确地表示出与目标疾病相关的生物信息,如此能够实现从大量基因表达数据中挖掘出与目标疾病相关的生物信息,从而能够实现针对大量基因表达数据的生物信息分析。
  • 治疗性蛋白和肽临床免疫原性评估报告的生成方法-202210009749.7
  • 郭东升;史绮霞;李春燕;王晔 - 科临达康医药生物科技(北京)有限公司
  • 2022-01-05 - 2022-04-15 - G16B35/00
  • 本发明涉及一种治疗性蛋白和肽临床免疫原性评估报告的生成方法、装置和设备,通过电子数据采集模块采集治疗性蛋白和肽临床免疫原性评估报告所涉及的基础数据,之后根据所述基础数据确定抗药抗体免疫反应的特征数据;根据所述基础数据确定抗药抗体结果与药代动力学和药效学的关系数据;根据所述基础数据确定抗药抗体结果与临床安全性和有效性的关系数据;根据所述基础数据确定抗药抗体临床相关阈值数据;最终将上述数据进行调整组合,生成治疗性蛋白和肽临床免疫原性评估报告。本发明能够自动生成治疗性蛋白和肽临床免疫原性评估报告,可以使临床试验的效率提高,进而增加临床试验的成功率,最终增加新药开发的效率。
  • 建立肠道菌数据库的方法和相关检测系统-201780093662.X
  • 张智闵 - 极诺生技股份有限公司
  • 2017-08-16 - 2020-05-08 - G16B35/00
  • 本发明是关于建立肠道菌数据库的方法和相关检测系统,特别是建立一种具有在体外评估宿主健康状况的量化指标的肠道菌数据库的方法。其次,本发明所提供的肠道菌的检测系统,该检测系统包括计算机系统,该计算机系统能处理分析肠道菌的相关生物资讯并产出具有在体外评估宿主健康状况的量化指标的肠道菌数据库。
  • 蛋白质特征构建方法、装置、设备、存储介质及程序产品-201911329568.7
  • 汤一凡;崔朝辉;赵立军;张霞 - 东软集团股份有限公司
  • 2019-12-20 - 2020-05-01 - G16B35/00
  • 本申请公开了一种蛋白质特征构建方法,预先得到基因本体数据库中每条基因本体信息对应的向量,当需要针对某个蛋白质例如待识别蛋白质构建特征向量时,根据基因本体数据库确定待识别蛋白质的目标基因本体信息,根据目标基因本体信息具有的身份标识从预先得到的向量中确定目标基因本体信息对应的目标向量。接着,根据目标向量构建待识别蛋白质的特征向量。由于基因决定了蛋白质的功能及特性,故该方法基于基因本体信息构建的蛋白质的特征向量,基因本体信息反映了基因信息及分子功能或生物过程,即在构建蛋白质特征时考虑了蛋白质的基因信息及分子功能或生物过程,从而提高构建的蛋白质特征的准确率。
  • 基于谱图相似度计算的搜库匹配结果的计算机模拟统计验证方法-201610905439.8
  • 乔振刚 - 浙江和谱生物科技有限公司
  • 2016-10-17 - 2019-02-05 - G16B35/00
  • 本发明提供一种基于谱图相似度计算的搜库匹配结果的计算机模拟统计验证方法,所述方法包括以下步骤:利用“相似谱图模型法”计算P值;利用“随机谱图模型法”计算错误检出率FDR值。本发明的基于谱图相似度计算的搜库匹配结果的计算机模拟统计验证方法通过P值和FDR值大小表征待评价样品搜库匹配结果的可靠性;P值越大,FDR值越小,表示搜库结果的可靠性越好;P值越小,FDR值越大,表示搜库结果的可靠性得不到保证。应用时,可通过显著性试验确定P值和FDR值的显著性水平,凡待评价样品P值大于其相应的显著性水平,FDR值小于其相应的显著性水平的表示搜库结果可靠性能得到保证。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top