[发明专利]蛋白质特征构建方法、装置、设备、存储介质及程序产品在审

申请号：	201911329568.7	申请日：	2019-12-20
公开（公告）号：	CN111091874A	公开（公告）日：	2020-05-01
发明（设计）人：	汤一凡;崔朝辉;赵立军;张霞	申请（专利权）人：	东软集团股份有限公司
主分类号：	G16B35/00	分类号：	G16B35/00;G16B40/20;G16B50/10
代理公司：	北京集佳知识产权代理有限公司 11227	代理人：	柳欣
地址：	110179 辽***	国省代码：	辽宁;21
权利要求书：	查看更多	说明书：	查看更多
摘要：	本申请公开了一种蛋白质特征构建方法，预先得到基因本体数据库中每条基因本体信息对应的向量，当需要针对某个蛋白质例如待识别蛋白质构建特征向量时，根据基因本体数据库确定待识别蛋白质的目标基因本体信息，根据目标基因本体信息具有的身份标识从预先得到的向量中确定目标基因本体信息对应的目标向量。接着，根据目标向量构建待识别蛋白质的特征向量。由于基因决定了蛋白质的功能及特性，故该方法基于基因本体信息构建的蛋白质的特征向量，基因本体信息反映了基因信息及分子功能或生物过程，即在构建蛋白质特征时考虑了蛋白质的基因信息及分子功能或生物过程，从而提高构建的蛋白质特征的准确率。
搜索关键词：	蛋白质特征构建方法装置设备存储介质程序产品
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

暂无信息

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于东软集团股份有限公司，未经东软集团股份有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201911329568.7/，转载请声明来源钻瓜专利网。

上一篇：一种硬件钱包及其管理方法
下一篇：检测模型的训练方法、检测方法及相关装置

同类专利

一种基于深度学习的糖肽质谱图预测装置-202310828711.7
发明人：杨奕;方群 -专利权人：浙江大学杭州国际科创中心
申请日： 2023-07-07 - 公布日： 2023-09-29 - 主分类号： G16B35/00
摘要：本发明公开了一种基于深度学习的糖肽质谱图预测装置，包含肽段编码模块、糖链编码模块、特征融合模块、肽段谱图输出模块、糖链谱图输出模块和谱图合并模块；预测过程为：将糖肽分为肽段和糖链；将肽段部分输入肽段编码模块，生成多个特征表示；将糖链部分输入糖链编码模块，生成多个特征表示；将肽段部分和糖链部分的多个特征表示分别输入特征融合模块进行特征融合；将肽段部分特征表示输入肽段谱图输出模块，输出肽段部分谱图；将糖链部分特征表示输入糖链谱图输出模块，输出糖链部分谱图；将肽段部分谱图和糖链部分谱图输入谱图合并模块，拼合成糖肽的完整质谱图。本发明能够处理糖肽非线性结构问题，准确预测糖肽质谱图。

一种单细胞转录组细胞碎片和多细胞过滤方法、介质和设备-202310181167.1
发明人：陈哲名;郎秋蕾;韩斐然 -专利权人：杭州联川生物技术股份有限公司
申请日： 2022-11-03 - 公布日： 2023-09-26 - 主分类号： G16B35/00
摘要：本发明公开了一种单细胞转录组低质量细胞过滤方法，涉及涉及生物数据处理方法。包括以下步骤：对细胞进行分群；按基因取表达量平均值，生成细胞群的特征表达谱；将所述细胞群的特征表达谱随机两两组合，生成人工多细胞；合并所述人工多细胞表达谱和真实细胞表达谱，计算每个细胞间的距离；在规定范围内设置若干等距的邻域，计算每个邻域下，每个真实细胞在邻域内的人工多细胞比例；统计每个邻域下的人工多细胞比例分布，求其双峰系数，并以双峰系数最大的邻域为最优邻域；在最优邻域下，将人工多细胞比例最大的规定数量的真实细胞认定为多细胞，将其从真实细胞表达谱中删除。提高了单细胞转录组数据的过滤标准和精准度，增强了数据的可靠性。

一种蛋白质复合体结构预测方法-202310945078.X
发明人：郑伟;张阳 -专利权人：郑伟
申请日： 2023-07-31 - 公布日： 2023-09-19 - 主分类号： G16B35/00
摘要：本申请涉及人工智能及生物技术领域，尤其涉及一种蛋白质复合体结构预测方法。该方法包括：构建宏基因组序列数据库，所述宏基因组序列数据库包括第三方数据库和自主构建数据库；基于所述宏基因组序列数据库，构建蛋白质单体MSA；对所述蛋白质单体MSA进行配对，将配对MSA进行排序并连接，以构建蛋白质复合体MSA；基于Mscore评价得到目标数量的蛋白质复合体MSA，并将所述目标数量的蛋白质复合体MSA输入DMFold‑Multimer算法中，以生成对应的蛋白质复合体结构模型；根据预测的TM‑score打分标准对所述蛋白质复合体结构模型进行排序，选取打分最高的蛋白质复合体结构模型作为目标模型集。

基于大语言模型的蛋白质工程系统、平台-202310662391.2
发明人：沈逸卿;周冰心;朱厚英;王宇光 -专利权人：上海途深智合人工智能科技有限公司
申请日： 2023-06-06 - 公布日： 2023-08-22 - 主分类号： G16B35/00
摘要：本发明公开了一种蛋白质工程系统，用以实现蛋白质工程。该系统包括，项目经理模块，该模块用于解释、确定用户提出的以自然语言表达的蛋白质工程任务；领域专家模块，该模块将收到的用户提出的蛋白质任务分解为多个子任务，按照子任务的不同类型，分派给不同类型的子领域专家模块，以解决不同的子任务；展示者模块，该模块接收由所述领域专家模块输出的任务完成结果，将该结果转化为易读的自然语言展示给用户。

一种单细胞转录组濒死细胞和多细胞过滤方法、介质和设备-202310175918.9
发明人：陈哲名;郎秋蕾;韩斐然 -专利权人：杭州联川生物技术股份有限公司
申请日： 2022-11-03 - 公布日： 2023-07-25 - 主分类号： G16B35/00
摘要：本发明公开了一种单细胞转录组低质量细胞过滤方法，涉及涉及生物数据处理方法。包括以下步骤：对细胞进行分群；按基因取表达量平均值，生成细胞群的特征表达谱；将所述细胞群的特征表达谱随机两两组合，生成人工多细胞；合并所述人工多细胞表达谱和真实细胞表达谱，计算每个细胞间的距离；在规定范围内设置若干等距的邻域，计算每个邻域下，每个真实细胞在邻域内的人工多细胞比例；统计每个邻域下的人工多细胞比例分布，求其双峰系数，并以双峰系数最大的邻域为最优邻域；在最优邻域下，将人工多细胞比例最大的规定数量的真实细胞认定为多细胞，将其从真实细胞表达谱中删除。提高了单细胞转录组数据的过滤标准和精准度，增强了数据的可靠性。

信使核糖核酸的5＇非翻译区序列优化方法及装置、设备-202310453568.8
发明人：万季;刘宇;陈伟填;夏迪;潘有东;赵钊;王弈 -专利权人：深圳新合睿恩生物医疗科技有限公司;深圳市新合生物医疗科技有限公司;北京新合睿恩生物医疗科技有限公司
申请日： 2023-04-25 - 公布日： 2023-06-30 - 主分类号： G16B35/00
摘要：本发明属于生物信息学技术领域，公开了一种信使核糖核酸的5'非翻译区序列优化方法，通过提取mRNA样本的5'UTR样本序列的特征，计算每个特征的重要性分值并筛选重要性高的特征，计算特征与蛋白表达的相关值，根据相关值与重要性计算特征的概率值，据此对原始5'UTR序列进行定向遗传变异迭代直至收敛，获得优化后的目标5'UTR序列，从而通过明确不同特征与蛋白表达的相关性、重要性，可以更好地解释序列改造的过程，具备可解释性，还能够指导有益的变异朝着更加优化的方向前进，实现更好的序列优化效果。

一种单细胞转录组Pseudo-Cell分析方法、模型及存储介质和设备-202211523697.1
发明人：胡超;胡龙飞 -专利权人：新格元（南京）生物科技有限公司
申请日： 2022-12-01 - 公布日： 2023-05-26 - 主分类号： G16B35/00
摘要：本发明公开了一种单细胞转录组Pseudo‑Cell分析方法、模型及存储介质和设备。所述方法包括以下步骤：（1）基于单细胞表达矩阵构建细胞与细胞之间基于表达谱高维空间距离的关系矩阵，通过关系矩阵分析细胞之间的相似性；（2）通过社区发现算法基于所述细胞之间的相似性划分为不同的子细胞群；（3）基于步骤（2）得到的细胞分群信息，整合每个子细胞群内部的表达谱，得到新整合的表达谱矩阵。本发明通过在划分细胞分群关系的社区发现算法中引入社区规模限制参数以及高分辨率下迭代分群的思路，将表达相似性最高的细胞分群整合为Pseudo‑Cell，解决了在单细胞数据中广泛存在的以dropout为主的数据噪音问题。

一种基于卷积神经网络的特异性启动子表达信息预测方法-202211438896.2
发明人：林娜;孙红波;王滔;何涛 -专利权人：南京腾鸿医疗科技有限公司
申请日： 2022-11-17 - 公布日： 2023-04-07 - 主分类号： G16B35/00
摘要：本发明公开了一种基于卷积神经网络的特异性启动子表达信息预测方法，该方法包括以下步骤：启动子序列及表达信息数据的预处理；构建卷积神经网络模型；将特征序列的表达信息进行分类；对所述卷积神经网络模型进行编译；对所述卷积神经网络模型进行训练及评估。本发明通过对特异性启动子序列的特征提取与表达信息分类的模型构建，能够快速对启动子的表达位置以及结合蛋白进行预测，相比于通过实验的方法提取启动子序列再进行测序的一系列实验步骤而言，该方法能够节省耗材成本，同时非常便捷，不需要复杂的实验过程，其预测的速度也比经过实验得来的结果快很多，这对于基因的转录调控研究也具有重要的指导作用。

生物组学调控关系分析方法及装置、电子设备、介质-202211591661.7
发明人：刘超 -专利权人：南京医基云医疗数据研究院有限公司
申请日： 2022-12-12 - 公布日： 2023-03-10 - 主分类号： G16B35/00
摘要：本发明涉及生物技术领域，具体涉及一种生物组学调控关系分析方法及装置、电子设备、介质，所述方法包括：获取多个对象在特定时间的生物组学特征数据，构建所述多个对象与所述特定时间、所述特征数据的第一数据矩阵；通过混合线性模型获取所述第一数据矩阵中满足预设阈值的特征数据，得到第二数据矩阵；通过重复采样滞后相关性模型确定第二数据矩阵中任意两个特征数据之间的相关性系数及置信度。所述方法通过在控制环境下等时间间隔的采集多个生物组学的特征数据进行分析，以实现动态数据趋势下的多组调控关系分析，并能够根据构建的多条件筛选机制，对目标研究方向预设筛选条件而获取相应的调控关系分析结果。

一个计算机控制及数据匹配方法-202211464548.2
发明人：管仁初;孙航;曾安;王禹霄飞;丰小月 -专利权人：吉林大学
申请日： 2022-11-22 - 公布日： 2023-03-07 - 主分类号： G16B35/00
摘要：本发明一个计算机控制及数据匹配方法，计算机控制及数据匹配方法利用单细胞数据和空间转录组数据作为输入，使用利用阻尼加权最小二乘法来扩展并且确定空间点的细胞类型，形成精确组成的反卷积步处理，精确组成的反卷积处理对空间转录组数据进行第一反卷积处理，通过阻尼加权最小二乘法识别每个空间点的细胞类型，然后推断每个空间点中存在不同细胞类型以及每种细胞类型的比例，其中以细胞类型只有一种的空间点作为种子节点。

一种单细胞转录组低质量细胞过滤方法、介质和设备-202211367300.4
发明人：陈哲名;郎秋蕾;韩斐然 -专利权人：杭州联川生物技术股份有限公司
申请日： 2022-11-03 - 公布日： 2023-02-10 - 主分类号： G16B35/00
摘要：本发明公开了一种单细胞转录组低质量细胞过滤方法，涉及生物数据处理方法。包括以下步骤：对细胞进行分群；按基因取表达量平均值，生成细胞群的特征表达谱；将所述细胞群的特征表达谱随机两两组合，生成人工多细胞；合并所述人工多细胞表达谱和真实细胞表达谱，计算每个细胞间的距离；在规定范围内设置若干等距的邻域，计算每个邻域下，每个真实细胞在邻域内的人工多细胞比例；统计每个邻域下的人工多细胞比例分布，求其双峰系数，并以双峰系数最大的邻域为最优邻域；在最优邻域下，将人工多细胞比例最大的规定数量的真实细胞认定为多细胞，将其从真实细胞表达谱中删除。提高了单细胞转录组数据的过滤标准和精准度，增强了数据的可靠性。

一种基于失调调控关系的个性化病前状态识别方法-202211192906.9
发明人：许鹏;霍彦好;鲍振申;李先彬;刘文斌 -专利权人：广州大学
申请日： 2022-09-28 - 公布日： 2023-02-03 - 主分类号： G16B35/00
摘要：本发明属于生物信息学领域，公开了一种基于失调调控关系的个性化病前状态识别方法，包括以下步骤：S1：计算每个时间点调控关系的调控强度；S2：计算调控关系每个时间点调控强度的变化分数；S3：计算每个时间点个体的调控变化分数；S4：确定特定疾病病前状态相关失调调控标志物；S5：基于疾病病前状态相关失调调控标志物识别疾病病前状态。本发明提供的技术方案在识别疾病病前状态方面有很高的精度，可以确定一组特定疾病固定的失调调控关系标志物，具有临床实施意义；计算过程简单，计算耗时少。

一种HCC关键蛋白表达水平数据的预测方法及装置-202210920133.5
发明人：黄通毅;张睿;徐明;张晓儿;郭焕玲;谢晓华;谢晓燕 -专利权人：中山大学附属第一医院
申请日： 2022-08-01 - 公布日： 2022-11-01 - 主分类号： G16B35/00
摘要：本发明提供了一种HCC关键蛋白表达水平数据的预测方法及装置，通过获取多种肝脏肿瘤的超声影像数据，并输入至预设的多模态超声组学预测模型获取肝脏肿瘤的HCC关键蛋白表达水平，本发明通过超声影像数据和多模态超声组学预测模型获取肝脏肿瘤的蛋白水平，实现了无创预测HCC关键蛋白表达水平。相比于现有技术，本发明能够提高HCC关键蛋白表达水平数据的准确性，有利于根据获得的HCC关键蛋白表达水平数据辅助临床医师的诊断以及治疗安排。

一种碳末端酰胺化多肽结构的动力学预测方法和装置-202111669925.1
发明人：李静;何建锋;梁国龍;樊欣迎;刘月峰;闻亚磊 -专利权人：北京博康健基因科技有限公司;北京理工大学
申请日： 2021-12-31 - 公布日： 2022-10-28 - 主分类号： G16B35/00
摘要：本发明属于生物信息分析领域，公开了一种碳末端酰胺化多肽结构的动力学预测方法和装置。本发明针对现有的结构预测技术难以进行特异性结构建模，采用常规的分子动力学进行从头算的折叠模拟难以充分地进行构象采样，且计算量大的问题，提供了一种能节省大量时间和费用，可以体现出多肽结构的特异性，便于与实验结果相比较的预测方法和装置。

一种基于生物网络的个性化疾病病前状态识别方法-202210380866.4
发明人：刘文斌;鲍振申;许鹏;李先彬;霍彦好;顾丽丽 -专利权人：广州大学
申请日： 2022-04-12 - 公布日： 2022-07-22 - 主分类号： G16B35/00
摘要：一种基于生物网络的个性化疾病病前状态识别方法，包括：对获取的单个体个性化时序样本数据进行标准化处理，根据时间点将标准化处理后的样本时序数据分为参考样本数据与待测样本数据；根据参考样本数据，得到基准样本数据；从全局蛋白质互作网络提取每个基因的表达模式，计算待测样本数据或参考样本数据中，每个时间点中每个基因相对于基准样本的距离分数；根据距离分数，得到每个时间点标准化的距离分数，根据每个时间点标准化距离分数，识别疾病病前状态；本发明识别疾病病前状态精度高，由于该方法主要是使用基因间调控关系作为背景进行数据处理和分析，因此该方法更具有生物意义，计算过程简单，计算耗时少。

一种基于统计机器学习的生物芯片数据特征工程算法-202210403504.2
发明人：王恒;薛松;连锋 -专利权人：上海交通大学医学院附属仁济医院
申请日： 2022-04-18 - 公布日： 2022-07-08 - 主分类号： G16B35/00
摘要：一种基于统计机器学习的生物芯片数据特征工程算法，包括以下步骤：生成数据矩阵；进行z‑score标准化；计算值，筛选大值基因数据；生成相关系数矩阵；筛选基因对；计算复相关系数；标记基因复相关系数改变。本发明有利于在大量生物芯片数据中，分析数据之间的相关性，利用特征选择的方法根据需求选取反映数据组间差异的统计量F值较大的一定数目的基因。本发明利用相关分析统计量相关系数、偏相关系数和复相关系数进行特征选择，有利于进一步减少数据维度，且有利于推测不同实验处理条件下，两两基因表达之间的相关关系改变。

一种基因表达数据处理方法及其相关设备-202210243208.0
发明人：张陈;金圣海;田广库;艾迪歌 -专利权人：东软集团股份有限公司
申请日： 2022-03-11 - 公布日： 2022-06-28 - 主分类号： G16B35/00
摘要：本申请实施例公开了一种基因表达数据处理方法及其相关设备，该方法包括：在获取到大量信号通路、大量基因表达数据及其在目标疾病下的标注信息之后，可以先利用这些信号通路、这些基因表达数据及其在目标疾病下的标注信息，构建待使用分类模型，以使该待使用分类模型在目标疾病下具有较好的分类性能；再依据该待使用分类模型以及这些信号通路，对这些基因表达数据进行信息分析处理，得到这些基因表达数据在所述目标疾病下的信息分析结果，以使该信息分析结果能够准确地表示出与目标疾病相关的生物信息，如此能够实现从大量基因表达数据中挖掘出与目标疾病相关的生物信息，从而能够实现针对大量基因表达数据的生物信息分析。

治疗性蛋白和肽临床免疫原性评估报告的生成方法-202210009749.7
发明人：郭东升;史绮霞;李春燕;王晔 -专利权人：科临达康医药生物科技（北京）有限公司
申请日： 2022-01-05 - 公布日： 2022-04-15 - 主分类号： G16B35/00
摘要：本发明涉及一种治疗性蛋白和肽临床免疫原性评估报告的生成方法、装置和设备，通过电子数据采集模块采集治疗性蛋白和肽临床免疫原性评估报告所涉及的基础数据，之后根据所述基础数据确定抗药抗体免疫反应的特征数据；根据所述基础数据确定抗药抗体结果与药代动力学和药效学的关系数据；根据所述基础数据确定抗药抗体结果与临床安全性和有效性的关系数据；根据所述基础数据确定抗药抗体临床相关阈值数据；最终将上述数据进行调整组合，生成治疗性蛋白和肽临床免疫原性评估报告。本发明能够自动生成治疗性蛋白和肽临床免疫原性评估报告，可以使临床试验的效率提高，进而增加临床试验的成功率，最终增加新药开发的效率。

建立肠道菌数据库的方法和相关检测系统-201780093662.X
发明人：张智闵 -专利权人：极诺生技股份有限公司
申请日： 2017-08-16 - 公布日： 2020-05-08 - 主分类号： G16B35/00
摘要：本发明是关于建立肠道菌数据库的方法和相关检测系统，特别是建立一种具有在体外评估宿主健康状况的量化指标的肠道菌数据库的方法。其次，本发明所提供的肠道菌的检测系统，该检测系统包括计算机系统，该计算机系统能处理分析肠道菌的相关生物资讯并产出具有在体外评估宿主健康状况的量化指标的肠道菌数据库。

蛋白质特征构建方法、装置、设备、存储介质及程序产品-201911329568.7
发明人：汤一凡;崔朝辉;赵立军;张霞 -专利权人：东软集团股份有限公司
申请日： 2019-12-20 - 公布日： 2020-05-01 - 主分类号： G16B35/00
摘要：本申请公开了一种蛋白质特征构建方法，预先得到基因本体数据库中每条基因本体信息对应的向量，当需要针对某个蛋白质例如待识别蛋白质构建特征向量时，根据基因本体数据库确定待识别蛋白质的目标基因本体信息，根据目标基因本体信息具有的身份标识从预先得到的向量中确定目标基因本体信息对应的目标向量。接着，根据目标向量构建待识别蛋白质的特征向量。由于基因决定了蛋白质的功能及特性，故该方法基于基因本体信息构建的蛋白质的特征向量，基因本体信息反映了基因信息及分子功能或生物过程，即在构建蛋白质特征时考虑了蛋白质的基因信息及分子功能或生物过程，从而提高构建的蛋白质特征的准确率。

质谱数据的评估方法和质谱法以及MALDI TOF质谱仪-201780064259.4
发明人：托比亚斯·博斯坎普 -专利权人：布鲁克道尔顿有限公司
申请日： 2017-09-22 - 公布日： 2019-06-07 - 主分类号： G16B35/00
摘要：本发明涉及一种用于分析生物样品中肽的质谱数据评估方法，尤其MALDI‑TOF质谱数据评估方法，具有以下步骤：a)提供期望质量亏损；b)确定测量质量亏损，即由质谱数据得出的质量亏损；c)将测量质量亏损与期望质量亏损相比较。

基于谱图相似度计算的搜库匹配结果的计算机模拟统计验证方法-201610905439.8
发明人：乔振刚 -专利权人：浙江和谱生物科技有限公司
申请日： 2016-10-17 - 公布日： 2019-02-05 - 主分类号： G16B35/00
摘要：本发明提供一种基于谱图相似度计算的搜库匹配结果的计算机模拟统计验证方法，所述方法包括以下步骤：利用“相似谱图模型法”计算P值；利用“随机谱图模型法”计算错误检出率FDR值。本发明的基于谱图相似度计算的搜库匹配结果的计算机模拟统计验证方法通过P值和FDR值大小表征待评价样品搜库匹配结果的可靠性；P值越大，FDR值越小，表示搜库结果的可靠性越好；P值越小，FDR值越大，表示搜库结果的可靠性得不到保证。应用时，可通过显著性试验确定P值和FDR值的显著性水平，凡待评价样品P值大于其相应的显著性水平，FDR值小于其相应的显著性水平的表示搜库结果可靠性能得到保证。

专利分类

G 物理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]蛋白质特征构建方法、装置、设备、存储介质及程序产品在审

专利文献下载