[发明专利]序列数据流的处理在审

专利信息
申请号: 201880032018.6 申请日: 2018-03-23
公开(公告)号: CN110637341A 公开(公告)日: 2019-12-31
发明(设计)人: 马丁·史密斯;詹姆斯·弗格森;丹尼斯·布纳迪 申请(专利权)人: 加尔文医学研究所
主分类号: G16B30/00 分类号: G16B30/00;G16B50/30
代理公司: 31283 上海弼兴律师事务所 代理人: 薛琦
地址: 澳大利亚*** 国省代码: 澳大利亚;AU
权利要求书: 查看更多 说明书: 查看更多
摘要: 本公开涉及用于处理排序数据流的方法和系统。系统从排序器接收序列且将其存储为数据库上的数据记录。序列与表示次数的计数器相关联,关联的序列已经被排序。系统从序列接收进一步的序列作为流数据。在接收进一步序列时,系统匹配流数据与存储的序列以决定匹配分数。在匹配分数超过数据库中的多个序列中的一个的匹配阈值时,根据匹配分数选择数据库中多个序列中的这一个,并且如果与选择的序列相关联的计数器值低于饱和阈值,则在非易失存储器上存储进一步序列。如果计数器值高于饱和阈值,则系统也终止接收。
搜索关键词: 计数器 匹配分数 数据库 存储 流数据 关联 排序 匹配 饱和 非易失存储器 数据流 接收序列 数据记录 序列接收 排序器 阈值时
【主权项】:
1.一种用于处理来自排序器的流数据的方法,该方法包括:/n从该排序器接收多个序列;/n将该多个序列的每一个存储为数据库的数据记录,该多个序列的每一个与表示次数的计数器相关联,该关联的序列已经被排序;/n从该排序器逐步接收进一步的序列作为流数据;/n在接收该进一步的序列时,匹配该流数据与该数据库中该多个序列的每一个,以对该数据库的记录中该多个序列的每一个决定匹配分数;/n在该匹配分数超过该数据库中的该多个序列中的一个的匹配阈值时,根据该匹配分数选择该数据库中该多个序列中的这一个;/n在与选择的序列相关联的计数器值低于饱和阈值的地方,在非易失存储器上存储该进一步序列;及/n在与选择的序列相关联的计数器值在高于饱和阈值的地方,则终止该进一步序列的接收。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于加尔文医学研究所,未经加尔文医学研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201880032018.6/,转载请声明来源钻瓜专利网。

同类专利
  • 染色体外环状DNA识别方法、系统、设备及介质-201911061300.X
  • 刘英娟;孙晓勇;陈士民;付尊元;韩金玉;魏庆功;张圆周;张童 - 山东第一医科大学(山东省医学科学院);山东农业大学
  • 2019-11-01 - 2020-02-14 - G16B30/00
  • 本公开公开了染色体外环状DNA识别方法、系统、设备及介质,包括:训练阶段:构建若干个并列的组合神经网络单元;基于已知类型的DNA进行裁剪,构建不同长度序列的训练集;对训练集进行预处理;将经过预处理后的每一种长度序列的训练集输入到对应的组合神经网络单元中,对组合神经单元进行训练;得到训练好的组合神经网络单元;每一种长度序列的训练集,均训练出对应的组合神经网络单元;最终,得到若干个针对不同长度序列的组合神经网络单元;应用阶段:获取待识别的DNA;对待识别的DNA进行裁剪;对裁剪后的结果进行预处理;将预处理后的裁剪的DNA输入到对应的组合神经网络单元中,输出待识别DNA的识别结果。
  • 通过计算机程序模拟产生简化DNA甲基化测序数据的方法-201710576797.3
  • 陆燕;孙喜伟;刘鹏渊;周莉媛 - 浙江大学
  • 2017-07-14 - 2020-01-24 - G16B30/00
  • 本发明公开了一种通过计算机程序模拟产生简化DNA甲基化测序数据的方法,可以用来评估不同简化基因组甲基化(RRBS)测序数据比对软件的效率以及相应数据分析平台的可靠性,以此来确定最优的比对方法及相应的最优参数。本发明通过计算机程序模拟RRBS文库构建和测序过程,根据CpGs甲基化水平的分布,产生与真实RRBS测序数据非常相近的仿真数据。该仿真数据除了模拟单个碱基水平的甲基化水平外,还模拟了真实数据的插入、缺失、单核苷酸变异和结构变异等其他特性以增加真实性。此外,本发明在模拟RRBS测序过程中,通过引入经验误差模型来模拟测序过程中出现的误差,进一步增加了仿真数据的真实性。
  • 用于预测基因组变异对前mRNA剪接的影响的系统和方法-201910612239.7
  • R·斯里尼瓦桑;A·然;P·乔杜里 - 塔塔咨询服务公司
  • 2019-07-08 - 2020-01-14 - G16B30/00
  • 本公开一般性地涉及用于预测基因组变异对前mRNA剪接的影响的方法和系统。该方法包括接收基因转录物的至少一种候选变体的基因组位置信息和基因转录物的坐标信息;基于基因转录物的坐标信息和至少一种候选变体的基因组位置信息将至少一种候选变体分类为剪接受体位点区域和分支位点区域之一;基于来自至少一种候选变体的分类的分类区域评估至少一种候选变体对前mRNA剪接的影响;基于评估的至少一种候选变体对前mRNA剪接的影响来预测至少一种候选变体的致病性。
  • 一种基于CPU+MIC异构平台的SIFT并行处理方法-201611081510.1
  • 董昊;龚湛;张清 - 苏州浪潮智能科技有限公司
  • 2016-11-30 - 2020-01-03 - G16B30/00
  • 本发明公开了一种基于CPU+MIC异构平台的SIFT并行处理方法,对SIFT算法中核心模块进行MIC上的加速,利用消息传递机制系统,对当前多序列进行分割,形成多条单蛋白质序列,对每条蛋白质序列进行并行加速处理、在数据库中进行序列比对,挖掘其并行度。本发明实现整个算法效率大幅提升,并解决传统CPU计算方法以及系统应用的性能低下、生产效率低等问题。
  • 序列数据流的处理-201880032018.6
  • 马丁·史密斯;詹姆斯·弗格森;丹尼斯·布纳迪 - 加尔文医学研究所
  • 2018-03-23 - 2019-12-31 - G16B30/00
  • 本公开涉及用于处理排序数据流的方法和系统。系统从排序器接收序列且将其存储为数据库上的数据记录。序列与表示次数的计数器相关联,关联的序列已经被排序。系统从序列接收进一步的序列作为流数据。在接收进一步序列时,系统匹配流数据与存储的序列以决定匹配分数。在匹配分数超过数据库中的多个序列中的一个的匹配阈值时,根据匹配分数选择数据库中多个序列中的这一个,并且如果与选择的序列相关联的计数器值低于饱和阈值,则在非易失存储器上存储进一步序列。如果计数器值高于饱和阈值,则系统也终止接收。
  • 一种智能采样的少分子数遗传序列检测装置-201920042460.9
  • 邓玉姗;邓宏晟;赵欣;邓贞宙;刘志涛;段志文;韩春雷 - 南昌大学
  • 2019-01-10 - 2019-12-20 - G16B30/00
  • 本实用新型公开一种智能采样的少分子数遗传序列检测装置,属于遗传信息载体脱氧核糖核酸检测领域,一种智能采样的少分子数遗传序列检测装置,包括微晶颗粒双层结构模块、遗传信息载体脱氧核糖核酸分子动力模块、单电子读出模块、系统响应矩阵模块、以及遗传信息载体脱氧核糖核酸序列估计模块。本实用新型的智能采样的少分子数遗传序列检测装置具有更好的应用适应性和输入灵敏度、降低系统成本,并且具有良好的模块化特征。
  • 胎儿游离DNA浓度获取方法和装置-201811162012.9
  • 关永涛;党明浩;徐寒黎;张静波;方楠;白灵;王建伟;刘倩;唐宇 - 北京优迅医疗器械有限公司
  • 2018-09-30 - 2019-12-17 - G16B30/00
  • 本发明公开了一种胎儿游离DNA浓度获取方法及装置。该方法包括:获取待测样本的测序数据,其中,待测样本取自怀有胎儿的母亲;建立母亲和胎儿基因型的联合概率分布模型,其中,联合概率分布模型中包括影响杂合度的一个或多个因素,杂合度为测序数据中SNP杂合位点数占总位点数的比例;将一个或多个因素的值以及获取到的杂合度的值代入联合概率分布模型,并对联合概率分布模型进行求解,得到胎儿游离DNA浓度。该方法解决了现有技术中胎儿浓度检测成本高的问题。
  • 一种单细胞ATAC-seq数据分析方法-201910768671.5
  • 夏昊强;高川;周煌凯;张羽;陶勇;罗玥;陈飞钦;曾川川 - 广州基迪奥生物科技有限公司
  • 2019-08-20 - 2019-12-06 - G16B30/00
  • 本发明提供一种单细胞ATAC‑seq数据分析方法,包括以下步骤:步骤S1,对测序原始数据进行数据分析与质控;步骤S2,比对分析;步骤S3,插入片段分析;步骤S4,富集区域Peak分析;步骤S5,单细胞亚群分类;步骤S6,对Peak相关基因进行注释和富集;步骤S7,TF‑motif分析;步骤S8,亚群可及性差异分析;步骤S9,差异可及性位点相关基因分析,对鉴定出的差异TF‑motif所在peak区域最邻近的转录起始位点所对应的基因注释等步骤。本发明构建了一个全面、分析内容丰富的单细胞ATAC‑seq数据分析流程,分析结果揭示了大量的生物信息,方便人们深入挖掘蕴藏在单细胞水平内的生物学现象和特征,分析流程及结果以html的形式进行可视化展示,分析内容层次明了,结果展现形式多样,增加了报告的可读性。
  • 一种个性化肿瘤疫苗制备方法-201811448493.X
  • 丁平 - 丁平
  • 2018-11-30 - 2019-11-22 - G16B30/00
  • 本发明提出了一种个性化肿瘤疫苗制备方法,其特征在于:a)对肿瘤患者的MHC进行亲和力预测,获得能够和MHC高效结合的有效突变肽;b)基于步骤a)的预测结果,合成有效新生抗原RNA和CD40LRNA;c)DC细胞的诱导及成熟,获得成熟的DC细胞;d)将所述新生抗原RNA和所述CD40L RNA导入所述成熟的DC细胞;e)经过步骤d)后,体外检测DC细胞表型以及刺激T细胞的效力。
  • 一种识别和消除核酸变异检测中假阳性的方法和装置-201811592826.6
  • 周衍庆;汪周阳;方文;张实唯 - 深圳市海普洛斯生物科技有限公司
  • 2018-12-20 - 2019-11-19 - G16B30/00
  • 本申请公开了一种识别和消除核酸变异检测中假阳性的方法和装置。本申请的方法包括,读取待测样品的变异检测软件结果文件;读取去除PCR重复后测序read的比对文件,获得每一个变异位点覆盖的read pair比对结果;判断变异位点是否位于DNA分子read pair overlap区域,对每个突变覆盖的read pair进行分析和统计;对每一个支持突变的分子和read进行统计,标注出可以用于突变过滤的特征;基于以上特征值对变异位点进行过滤。本申请的方法,根据核酸变异假阳性位点和真阳性位点的分布特征,对核酸变异检测结果进行过滤,不仅能够有效的去除假阳性位点,而且提高了核酸变异检测结果的准确性。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top