[发明专利]DNA结合蛋白序列信息特征提取与分类方法及装置在审

申请号：	201710335862.3	申请日：	2017-05-12
公开（公告）号：	CN108875310A	公开（公告）日：	2018-11-23
发明（设计）人：	王伟	申请（专利权）人：	河南师范大学
主分类号：	G06F19/22	分类号：	G06F19/22
代理公司：	郑州睿信知识产权代理有限公司 41119	代理人：	崔旭东
地址：	453007 ***	国省代码：	河南;41
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明涉及一种DNA结合蛋白序列信息特征提取与分类方法及装置，该方法首先进行理论论证，对收集的数据分析和整理，获得具有生物学意义和统计意义的可靠数据集，然后从复杂的蛋白三维结构中提取有效的蛋白质序列数据特征参数成为关键环节，也就是如何将序列字符信息转换为数字特征信息，对提取的特征数据，设计合理的分类算法，筛选有助于分类的特征以实现分类目标，最后对分类性能采用合理公正的评价体系，如测试方法、检验手段和评价指标选择等。本发明能满足对高通量的蛋白测序功能注释的需求，能够实现自动化的DNA结合蛋白序列的功能注释，同时提出的这些特征也能帮助生物学家对DNA结合蛋白序列进行实验分析研究。
搜索关键词：	功能注释特征提取序列信息分类蛋白质序列数据数字特征信息生物学意义蛋白测序分类目标分类算法分类性能关键环节可靠数据理论论证评价体系评价指标三维结构实验分析数据分析特征参数特征数据信息转换序列字符高通量蛋白自动化筛选测试检验统计帮助研究
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种DNA结合蛋白序列信息特征提取与分类方法，其特征在于，包括如下步骤：1)选择蛋白质类数据库中的DNA结合蛋白，从中提取出蛋白质序列数据集；2)提取蛋白质序列数据集中的蛋白质数据序列信息对应的不同类型的蛋白序列特征；3)将不同类型的蛋白序列特征的序列特征矩阵进行统一维度，提取局部特征信息；4)根据每类蛋白序列特征，将蛋白质数据序列进行分类，对分类结果进行特征分类性能评价。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于河南师范大学，未经河南师范大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201710335862.3/，转载请声明来源钻瓜专利网。

同类专利

一种病原微生物基因组快速分析方法及系统-201510932914.6
发明人：阮陟;陈欢;冯晔;单杲 -专利权人：浙江大学
申请日： 2015-12-15 - 公布日： 2018-12-21 - 主分类号： G06F19/22
摘要：本发明公开了一种病原微生物基因组快速分析方法及数据分析平台；该方法在菌株数据库系统的基础上提供了基于细菌基因组序列的分型与溯源功能，用户只需作简单的参数设置并上传菌株的基因组序列，系统将在极短的时间内反馈该菌株的MLST分型结果、耐药与毒力基因分布、参考菌株名称并提供用户上传菌株与数据库中所有菌株间的系统发生树。该方法适用于建立一个整合遗传学、基因组学和系统发育学研究的病原微生物学数据分析平台。与现有的分型技术相比，分辨率更高，能更准确区同一克隆的菌株；结果反馈速度快，采用高效的参考菌株设定与基因组SNP序列映射技术，用户可快速获得数据分析结果，便于病原微生物克隆传播的实时跟踪与快速溯源。

一种预测影响长非编码RNA生物学功能的SNP位点的方法-201810122529.9
发明人：陈小伟;范珍;陈润生 -专利权人：中国科学院生物物理研究所
申请日： 2018-02-07 - 公布日： 2018-12-07 - 主分类号： G06F19/22
摘要：本发明公开了一种预测影响长非编码RNA生物学功能的SNP位点的方法。本发明首先建立了长非编码RNA所包含的RNA结合蛋白能够识别的特异的motif序列的识别及显著性评价方法，然后基于此方法对位于这些特定序列中的SNP位点所产生的影响进行评价。利用此方法可以发现对长非编码RNA生物学功能产生重要影响的SNP位点，为实验人员提供可靠的功能研究线索，也为长非编码RNA的临床应用提供指导。

一种高度相似微生物的鉴定和分类方法-201710882205.0
发明人：屠奇超;周集中;束文圣;叶脉;李猛;毛喆 -专利权人：广东美格基因科技有限公司
申请日： 2017-09-26 - 公布日： 2018-12-04 - 主分类号： G06F19/22
摘要：本发明公开了一种高度相似微生物的鉴定和分类方法，其包括：(1)使用eggNOG数据库对微生物基因组编码的蛋白序列进行比对，赋予每个微生物基因组一个eggNOG基因ID，生成一个基于eggNOG数据库的微生物基因谱；(2)计算基因谱中不同待测微生物之间的基因内容非相似性，得到一个非相似性矩阵；(3)对矩阵进行聚类分析，将基因内容类似的微生物聚为一簇，判定为同一类微生物，完成微生物的鉴定和分类。本发明方法针对高度相似微生物，创造性地提出微生物水平差异主要驱动因子为基因的获得与丢失，而非传统手段常考虑的核酸位点突变。本发明对高度相似微生物的鉴定和分类有极高的准确性，具有良好的应用前景。

鉴定基因组中的变异的定相和连接方法-201480054553.3
发明人： B.G.克马尼;R.德马纳克;B.A.彼得斯 -专利权人：考利达基因组股份有限公司
申请日： 2014-10-01 - 公布日： 2018-11-30 - 主分类号： G06F19/22
摘要：长片段读出技术可以用于鉴定缺失并解析碱基识别，其通过利用读出与任意对应于单体型的杂合基因座(het)的读出的共享标签(例如，共享的等分试样)进行。例如，将基因座连接到多个het的单体型可以增加在所述基因座处的可用读出，用于确定特定单体型的碱基识别。对于半合子缺失，可以将某个区域连接到一个或多个het，并且特定单体型的标签可以用于鉴定区域中的哪些读出对应哪个单体型。以这种方式，由于可以鉴定特定单体型的读出，可以确定半合子缺失。此外，可以使用脉冲的定相率鉴定大缺失。可以在定相率足够低的情况下鉴定缺失，并可以使用其它标准。

一种将Needleman-Wunsch算法在FPGA平台实现并优化的新方法-201810794180.3
发明人：王忆文;王刚 -专利权人：电子科技大学
申请日： 2018-08-30 - 公布日： 2018-11-27 - 主分类号： G06F19/22
摘要：该发明公开了一种将Needleman‑Wunsch(以下简称N‑W)算法在FPGA平台实现并优化的新方法。本发明是围绕N‑W算法的打分与回溯两方面进行优化。N‑W算法打分方面，本发明提出优化的删减策略和优化的动态规划(Dynamic Programming)分块方案来减少FPGA实现的时间消耗和资源消耗；N‑W算法回溯方面，本发明采用简化的回溯方向，更加便于FPGA实现，本发明采用两组回溯模块，与打分系统构成流水线处理，大大提高打分系统硬件利用效率，减少序列比对的整体时间。

多种图像检测技术综合分析基因子图相似概率量的方法-201610600500.8
发明人：余孟春;何庆瑜;特伦斯·古力;谢清禄;朱军;王一为 -专利权人：广州麦仑信息科技有限公司
申请日： 2016-07-27 - 公布日： 2018-11-27 - 主分类号： G06F19/22
摘要：本发明涉及图像检测与处理技术领域，同时涉及生物信息学领域，具体涉及一种利用多种图像检测技术综合分析基因子图相似概率量的方法，它采用如下的方法步骤：A、人体基因序列全图和目标基因子图的数据准备；B、利用CNN卷积神经网络检测基因子图相似概率量；C、利用HOG+SVM分类检测基因子图相似概率量；D、利用Adaboost+LBP特征算法检测基因子图相似概率量；E、利用标准相关系数模板匹配法检测基因子图相似概率量；F、利用BP神经网络分类器综合分析步骤B、步骤C、步骤D、步骤E的各方法所得概率量，得到加权求和后的最终概率量；可应用于疾病基因检测，能够快速并准确地检测出人体基因序列中是否包含疾病易感基因，预测身体患疾病风险。

用于多个分子信号的数据处理方法和装置-201510061908.8
发明人：李雷;王博;万林 -专利权人：中国科学院数学与系统科学研究院
申请日： 2015-02-05 - 公布日： 2018-11-27 - 主分类号： G06F19/22
摘要：本发明提出了用于多个分子信号的数据处理方法。该方法计算任意不同的分子簇A与分子簇B的荧光信号之间的混杂系数C(A←B)和C(B←A)，用于衡量所述分子簇A和分子簇B的荧光信号相互混杂的严重程度，进而，可以干预、减少不同分子簇间相互混杂的干扰，以提高分子识别技术的辨识精度。

一种判断美花石斛纯种相近度的方法的建立、判断标准以及判断方法-201710330869.6
发明人：赵田;童行伟 -专利权人：北京蓝标一成科技有限公司
申请日： 2017-05-11 - 公布日： 2018-11-23 - 主分类号： G06F19/22
摘要：本发明涉及一种判断美花石斛纯种相近度的方法的建立、判断标准以及判断方法，所述判断方法的建立过程为，S1：采集与基因测序结论一致的美花石斛样本，测定每个样本的第三个节间茎直径；S2：对样本第三个节间茎直径变量进行正态性检验；S3：标准区间：若步骤S2中所得到的结果为服从正态分布，则按照正态分布总体计算公式得出均值的95％置信区间和标准差的95％置信区间；该置信区间便能够作为鉴别未知样本纯净度的标准范围。根据实际采集的数据建立的判断标准为：均值的95％置信区间和标准差的95％置信区间分别为：(2.9498，3.1363)和(0.4556，0.5887)，被测美花石斛样本只需要与该区间对比便可。本发明能够通过美花石斛形态学相关的特征来鉴别其品种的纯净度，从而可以简单的判断人工种植的美花石斛其价值大小或是否存在；其鉴别的准确率高，具有重要的现实意义。

DNA结合蛋白序列信息特征提取与分类方法及装置-201710335862.3
发明人：王伟 -专利权人：河南师范大学
申请日： 2017-05-12 - 公布日： 2018-11-23 - 主分类号： G06F19/22
摘要：本发明涉及一种DNA结合蛋白序列信息特征提取与分类方法及装置，该方法首先进行理论论证，对收集的数据分析和整理，获得具有生物学意义和统计意义的可靠数据集，然后从复杂的蛋白三维结构中提取有效的蛋白质序列数据特征参数成为关键环节，也就是如何将序列字符信息转换为数字特征信息，对提取的特征数据，设计合理的分类算法，筛选有助于分类的特征以实现分类目标，最后对分类性能采用合理公正的评价体系，如测试方法、检验手段和评价指标选择等。本发明能满足对高通量的蛋白测序功能注释的需求，能够实现自动化的DNA结合蛋白序列的功能注释，同时提出的这些特征也能帮助生物学家对DNA结合蛋白序列进行实验分析研究。

利用核酸存储信息的方法-201810747946.2
发明人：乔治·M·丘奇 -专利权人：哈佛大学校长及研究员协会
申请日： 2013-07-17 - 公布日： 2018-11-23 - 主分类号： G06F19/22
摘要：本发明涉及利用一个或多个核酸存储数据的方法。

使用纳米孔技术对短DNA片段进行快速测序-201680078675.5
发明人：塞缪尔·威廉姆斯 -专利权人：塞缪尔·威廉姆斯
申请日： 2016-11-14 - 公布日： 2018-11-23 - 主分类号： G06F19/22
摘要：本文所述的披露内容可以用于非常快速地实时获得短DNA读数，这些短DNA读数可以用于产前和IVF护理中的时间敏感性非整倍性检测以及对在现场或临床中的小DNA片段和扩增子的测序。这种能力可以扩大基于纳米孔的测序方法用于临床和研究应用的实用性。

DNA序列中重复区的识别方法和装置-201810305435.5
发明人：李敏;刘莉娟;廖兴宇;王建新 -专利权人：中南大学
申请日： 2018-04-08 - 公布日： 2018-11-06 - 主分类号： G06F19/22
摘要：本发明提供一种DNA序列中重复区的识别方法和识别装置，其中方法包括：对构造的n‑item序列，在DNA序列中识别所述n‑item序列的出现次数；将出现次数大于预设阈值的n‑item序列作为重复区，并构造所有作为重复区的n‑item序列的n‑item序列集合；若所述n‑item序列集合中n‑item序列的个数不唯一，则根据预设规则对所述n‑item序列集合中两两之间的n‑item序列构造(n+1)‑item序列。本发明实施例只需要对构造出的DNA子序列进行识别，识别对象相比现有技术大大降低，其次获得重复区的过程也可以在识别过程中通过统计出现次数获得，识别效率得到了进一步提高，再通过预设规则从重复区中构造更长的DNA子序列，不需要将重复区先与单个碱基组合再逐个遍历整个DNA序列，能够大大提高基因组重复区的识别效率。

一种测序数据高效处理方法-201810378325.1
发明人：常珊;陆旭峰;许磊;张大为 -专利权人：江苏理工学院
申请日： 2018-04-25 - 公布日： 2018-11-06 - 主分类号： G06F19/22
摘要：本发明公开了一种测序数据高效处理方法，属于生物医药技术领域，包括如下步骤：根据高通量测序数据为并行计算做准备；根据高通量测序数据为测序数据准备参考序列；通过并行计算过滤掉数据中质量不合格的数据；通过并行计算完成测序数据与参考序列的比对；通过并行计算提取比对数据中的SNP突变位点信息。本发明对测序数据进行质检，对质检后的数据与参考序列进行比对，根据比对结果提取SNP的突变信息，整套数据处理流程采用了Hadoop架构，使用Hadoop并行运算框架进行高通量测序数据云计算分析系统开发，为医学研究提供了快速、低廉、方便使用的高通量测序数据分析工具，大大的提高了数据处理速度。

一种信息存储设备-201810533629.0
发明人：梁梦迪 -专利权人：永康市翌阳科技有限公司
申请日： 2018-05-29 - 公布日： 2018-11-02 - 主分类号： G06F19/22
摘要：本发明的一种信息存储设备，包括装置主体、设置于所述装置主体内的识别存储装置、设置于所述装置主体内的清理装置以及设置于所述装置主体内的运输装置，所述清理装置包括设置于所述装置主体右端开口向右的工作槽，所述工作槽下侧内壁的左侧设置有开口向上的第一凹槽，所述第一凹槽的下侧内壁内固定设置有第一电机，所述第一电机的上端动力配合连接有延伸入所述第一凹槽内的第一转轴，所述第一凹槽内设置有可上下滑动的第一滑块，所述第一滑块的下端设置有开口向下的第二凹槽；本装置能够自动化进行DNA识别与人员信息对应存储，能够个人的信息更加完善，也减少了人力的运营时间，促进某些需要用到识别人员信息地方的工作效率。

一种免疫组库数据分析方法及终端-201510363037.5
发明人：贺建奎;童寅 -专利权人：南方科技大学
申请日： 2015-06-26 - 公布日： 2018-10-26 - 主分类号： G06F19/22
摘要：本发明实施例公开了一种免疫组库数据分析方法及终端，其中方法包括：接收针对第一样本的第一分析指令，该第一分析指令携带该第一样本的注释文件；响应该第一分析指令，根据该第一样本的注释文件，生成并输出针对该第一样本的整体分析图，该整体分析图包括V基因频率分布图、D基因频率分布图、J基因频率分布图、高克隆CDR3序列的频率分布图、CDR3的长度分布图、免疫多样性分析图、VDJ基因组合分析图、Ig链类型比例分布图和多Ig链类型共同序列分析图中的任意一种或多种分析图。可见，实施本发明实施例有利于对免疫组库的状况进行更全面的评估。

一种DNA检测的方法、装置及终端设备-201810380856.4
发明人：周海鹏;熊峰;韩珂珩 -专利权人：深圳劲宇生物科技有限公司
申请日： 2018-04-25 - 公布日： 2018-10-16 - 主分类号： G06F19/22
摘要：本发明适用于信息处理技术领域，提供了一种DNA检测的方法、装置、终端设备及计算机可读存储介质，所述方法包括：获取目标源文件，所述目标源文件包括生物序列信息；判断所述生物序列信息中是否包含符合预设条件的DNA序列；若所述生物序列信息中包含符合预设条件的DNA序列，提取所述符合预设条件的DNA序列，并将所述DNA序列存储至第一存储文件；复制所述第一存储文件，把复制得到的多个第一存储文件副本与多组预设文件做并行比对，以获得并行比对结果。通过本发明，可以减少检测所需的时间，检测效率较高，有较高的实用性和易用性。

单核苷酸距离多态性比较核酸序列进行物种分类的方法-201510824250.1
发明人：孔登;王晓红 -专利权人：潍坊医学院
申请日： 2015-11-24 - 公布日： 2018-10-16 - 主分类号： G06F19/22
摘要：本发明提出了一种单核苷酸距离多态性比较核酸序列进行物种分类的方法，包括如下步骤：S10：对DNA序列或者RNA序列上的每个核苷酸进行编号；S20：计算DNA序列或者RNA序列上相邻同种核苷酸的距离；S30：统计每种核苷酸的不同距离在每条DNA序列或者RNA序列中出现的次数；S40：根据S30的统计数据，构建距离矩阵，根据距离矩阵计算产生系统发育树，进行物种分类。本方法将序列上核苷酸的差异转变为核苷酸间距离的差异，既兼顾了空位，又无需插入间隔，方法简单，大大简化了计算量。

一种生物物种或组织的全息化鉴定方法及系统-201610517090.0
发明人：窦恺;陈捷;叶伟星;余传金;王猛;高金欣;孙佳楠;王强强 -专利权人：上海交通大学
申请日： 2016-07-04 - 公布日： 2018-10-16 - 主分类号： G06F19/22
摘要：本发明公开了一种生物物种或组织的全息化鉴定方法及系统，该方法包括：在n个特征数据库中选择一个，基于该特征数据库进行检索，根据检索结果中的生物物种或组织名及其对应的n种特征，建立n个虚拟临时数据库，作为下一次检索的数据库；然后选择另一特征数据库，在该特征的虚拟临时数据库中进行检索，依次类推，直到达到期望检索范围。该系统包括：n个特征数据库、特征数据库选择单元、特征输入单元、检索单元、临时特征数据库建立单元、检索结果显示单元以及重置单元。本发明的生物物种或组织的全息化鉴定方法及系统，将多种特征对物种或组织的分辨结合起来，共同贡献达到生物物种或组织的精细鉴定。

一种智能肺癌癌细胞检测仪-201810458507.X
发明人：刘兴高;高信腾;孙元萌;张泽银 -专利权人：浙江大学
申请日： 2018-05-14 - 公布日： 2018-10-09 - 主分类号： G06F19/22
摘要：本发明公开了一种智能肺癌癌细胞检测仪，该系统由基因微阵列读入模块、数据预处理及特征排序模块、参数寻优模块、模型输出模块组成。系统首先将输入的基因微阵列数据预处理，然后对剩余的各个基因进行重要性排序，通过统计分数计算相关性，再利用分类器准则函数计算贡献度，将所有基因重要性进行排序。改进的优化方法加入了寻优算法种群适应度方差监测，能够防止种群多样性散失以及优化过程陷入局部最优。然后将搜寻到的最优参数作为分类器参数完成模型构建并输出结果。系统在小样本条件下精度高、智能性好。

一种对核酸序列信息进行匹配的方法-201510482636.9
发明人：盛司潼 -专利权人：盛司潼
申请日： 2012-07-28 - 公布日： 2018-10-09 - 主分类号： G06F19/22
摘要：本发明涉及信息处理领域，提供了一种对核酸序列信息进行匹配的方法，所述方法包括以下步骤：A、对数据库中的参考序列进行BWT变换，得匹配参考序列，并将匹配参考序列存储在数据库中；B、对数据库中的匹配参考序列进行间隔标记；C、将核酸序列片段依次分别与数据库中的匹配参考序列进行一致性匹配，得匹配核酸序列。本发明的对核酸序列信息进行匹配的方法能实现核酸序列信息与参考序列的快速匹配。

基于CPU+GPU异构系统的序列比对方法-201410522707.9
发明人：朱香元 -专利权人：肇庆学院
申请日： 2014-09-29 - 公布日： 2018-09-28 - 主分类号： G06F19/22
摘要：公开了一种大规模生物序列比对及其基于异构系统的并行处理方法。首先，对序列优化存储，设计异构系统负载平衡方法；然后，设计异构系统内存优化方法，包括满足合并访问条件的序列存储方法、相似矩阵存储和访问方式、得分矩阵压缩存储，解决由于异构系统存储空间的匮乏而导致的实际计算性能低下；最后，基于内存预分配和复用策略，提出粗粒度序列比对并行方法。本发明基于CPU+GPU异构计算平台，充分利用了负载平衡和内存优化技术，从而显著提高大规模生物序列比对的处理效率。

通用RGEN基因编辑靶位点快速筛选系统-201710250569.7
发明人：张涌;陈奇;佟琪 -专利权人：西北农林科技大学
申请日： 2017-04-17 - 公布日： 2018-09-25 - 主分类号： G06F19/22
摘要：本发明公开了一种通用RGEN基因编辑靶位点快速筛选系统。本发明通过“流水‑管道”设计思想，设计了碱基模式匹配模块、GC含量分析模块、连续n个相同碱基识别模块，形成了一个兼容性强、方便快捷并且适用于大规模数据分析的系统。支持任意模式序列在全基因组范围的匹配与查找，有效应对RNA介导核酸内切酶的快速发展。极大改善目前现有核酸内切酶工具仅能以有限模式和低通量筛选靶位点的现状。另外，本系统的模块构架及相关算法也适用于解决从任意长度字符串中抓取特定要求的子字符串这一类问题。

预测蛋白质RNA结合物热点的方法、系统及存储介质-201810299939.0
发明人：邓磊;潘玉亮 -专利权人：中南大学
申请日： 2018-04-04 - 公布日： 2018-09-21 - 主分类号： G06F19/22
摘要：本发明涉及生物信息技术领域，公开了一种预测蛋白质RNA结合物热点的方法、系统及存储介质，以解决生物实验的盲目性和成本高等问题，并提高预测的精度和效果。本实施例方法包括：确定有效数据集，其包括已明确标签的一类数据和待明确标签的二类数据，在该一类数据中，将结合能大于等于1.0的数据作为正样本的热点数据，结合能小于1.0的作为负样本数据；根据该一类数据，采用半监督学习算法中的标签传播算法对该二类数据进行标签值预测，并将预测后的数据归入训练集；以及基于各样本的特征集合，以极度梯度提升算法、神经网络算法和极性随机数算法分别构造分类器以对每个样本的分类进行投票，并对各投票结果进行加权平均得出预测结果。

一种针对基因测序数据的存取方法-201710125326.0
发明人：陈孟龙 -专利权人：上海逐玛信息技术有限公司
申请日： 2017-03-04 - 公布日： 2018-09-14 - 主分类号： G06F19/22
摘要：本发明公开了一种针对基因测序数据的存取方法，包括：基于操作系统用户空间创建文件系统；定义所述文件系统的访问方式；定义所述文件系统的数据存储方式；定义所述文件系统的数据读取方式；通过所述文件系统实现针对基因测序数据的存取；将针对基因数据的各种压缩方法整合到了文件系统当中，使文件系统能够存储更多的基因测序数据,最高可达到原始数据的15％；用户不需要先压缩数据再存储到文件系统，文件系统自动对数据进行压缩，简化了用户的使用；读取数据也不需要事先进行解压缩，文件系统自动会进行解压缩，解压缩操作对用户是透明的。

高通量基因测序大数据分析云平台系统-201810228004.3
发明人：刘辉 -专利权人：常州大学
申请日： 2018-03-20 - 公布日： 2018-09-14 - 主分类号： G06F19/22
摘要：本发明提供一种高通量基因测序大数据分析云平台系统，包括数据文件管理模块、样品与实验管理模块、工作流管理模块、分析任务管理模块、工单管理模块、移动终端服务模块、磁盘配额管理模块、资源分享管理模块、用户与权限控制模块共九个功能模块；系统支持云存储与高性能计算集群，实现对高通量基因测序大数据的存储与分析，并使用WEB终端与移动终端技术对实验、样品与数据进行远程管理，对分析任务进行远程控制与查看，实现了大数据的云存储与高性能计算集群系统的无缝连接。支持对基因测序大数据的在线管理，分析流程自动化，以及分析结果报表推送，实现了从基因测序数据到生成分析报表的一站式解决方案。

分析个体两类状态的免疫差异、辅助确定个体状态的方法-201510142542.7
发明人：吴小雷;韩颖鑫;管彦芳;王玉奇;朱红梅;杨玲;易鑫;尹烨 -专利权人：深圳华大基因科技有限公司
申请日： 2015-03-27 - 公布日： 2018-09-14 - 主分类号： G06F19/22
摘要：本发明公开了一种分析个体两类状态的免疫差异的方法，包括：获取第一和第二测序数据；分别对第一读段和第二读段进行拼接；将第一拼接序列和第二拼接序列分别与多种CDR3参考序列比对；进行(1)～(4)中的至少之二，以及确定所进行的(1)～(4)中差异具有统计意义的因素对第一类和第二类状态的区分效果，(1)比较第一高频CDR3序列比例和第二高频CDR3序列比例的差异，(2)比较第一CDR3序列和第二CDR3序列中的各种V亚型的使用频率的差异，(3)比较第一CDR3序列和第二CDR3序列中的各种V合并亚型的使用频率的差异，(4)比较第一CDR3序列和第二CDR3序列中的各种VJ组合亚型的使用频率的差异。

分析个体两类状态的免疫差异的方法和装置-201510140391.1
发明人：王玉奇;韩颖鑫;李红梅;董燕;杨玲;易鑫;尹烨 -专利权人：深圳华大基因科技有限公司
申请日： 2015-03-27 - 公布日： 2018-09-14 - 主分类号： G06F19/22
摘要：本发明公开了一种分析个体两类状态的免疫差异的方法，包括步骤：获取第一测序数据和第二测序数据；分别对第一测序数据中的第一读段和第二测序数据中的第二读段进行拼接，获得第一拼接序列和第二拼接序列；将第一拼接序列和第二拼接序列分别与多种CDR3参考序列比对，获得第一CDR3序列和第二CDR3序列；比较第一高频CDR3序列比例和第二高频CDR3序列比例的差异，确定差异具有统计意义且能够区分所述第一类状态和所述第二类状态的高频CDR3序列比例的数值范围。本发明还公开一种辅助确定个体状态的方法和/或装置。

分析个体两类状态的免疫差异的方法和装置-201510140864.8
发明人：李红梅;韩颖鑫;管彦芳;吴小雷;侯永刚;张鸣;杨玲;易鑫;尹烨 -专利权人：深圳华大基因科技有限公司
申请日： 2015-03-27 - 公布日： 2018-09-14 - 主分类号： G06F19/22
摘要：本发明公开了一种分析个体两类状态的免疫差异的方法，包括步骤：获取第一测序数据和第二测序数据；分别对第一测序数据中的第一读段和第二测序数据中的第二读段进行拼接，获得第一拼接序列和第二拼接序列；将第一拼接序列和第二拼接序列分别与多种CDR3参考序列比对，获得第一CDR3序列和第二CDR3序列；比较第一高频CDR3序列比例和第二高频CDR3序列比例的差异，确定差异具有统计意义的高频CDR3序列比例对第一类状态和第二类状态的区分效果。本发明还公开一种辅助确定个体状态的方法和/或装置。

分析个体两类状态的免疫差异、辅助确定个体状态的方法-201510140851.0
发明人：韩颖鑫;李红梅;王玉奇;吴小雷;朱红梅;杨玲;易鑫;尹烨 -专利权人：深圳华大基因科技有限公司
申请日： 2015-03-27 - 公布日： 2018-09-14 - 主分类号： G06F19/22
摘要：本发明公开了一种分析个体两类状态的免疫差异的方法，包括步骤：获取第一测序数据和第二测序数据；分别对第一测序数据中的第一读段和第二测序数据中的第二读段进行拼接，获得第一拼接序列和第二拼接序列；将第一拼接序列和第二拼接序列分别与多种CDR3参考序列比对，获得第一CDR3序列和第二CDR3序列；比较第一CDR3序列和第二CDR3序列中的各种VJ组合亚型的使用频率的差异，确定差异具有统计意义的VJ组合亚型对第一类状态和第二类状态的区分效果。本发明还公开一种辅助确定个体状态的方法和/或装置。

确定林木基因组中假基因的方法-201710359550.6
发明人：张德强;李英;谢剑波 -专利权人：北京林业大学
申请日： 2017-05-19 - 公布日： 2018-09-07 - 主分类号： G06F19/22
摘要：本发明公开了一种确定林木基因组中假基因的方法，其包括以下步骤：获得待测林木的基础生物信息，所述基础生物信息包括蛋白质序列、基因组序列和功能基因的染色体位置；利用Pseudopipe法对所述待测林木进行假基因鉴定处理，以便获得原始假基因数据；对所述原始假基因数据进行重复项删除处理，以便获得候选假基因数据；以及根据功能基因和假基因在染色体上的物理位置信息，对所述候选假基因数据进行去除假阳性处理，以便确定所述待测林木基因组中的假基因。利用该方法能够有效地确定林木基因组中的假基因，并且该方法操作简单，易于掌握，需时短，无需额外的配套条件，成本低，且所得结果准确性好，可靠度高，适于推广。

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学，即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真，例如：概率模型或动态模型，遗传基因管理网络，蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的，例如：进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的，例如：结构排序，结构或功能关系，蛋白质折叠，结构域拓扑，用结构数据的药靶，涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的，例如：基因型–表型关联，不均衡连接，种群遗传学，结合位置鉴定，变异发生，基因型或染色体组的注释，蛋白质相互作用或蛋白质核酸的相互作用

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]DNA结合蛋白序列信息特征提取与分类方法及装置在审

专利文献下载