[发明专利]序列数据流的处理在审
申请号: | 201880032018.6 | 申请日: | 2018-03-23 |
公开(公告)号: | CN110637341A | 公开(公告)日: | 2019-12-31 |
发明(设计)人: | 马丁·史密斯;詹姆斯·弗格森;丹尼斯·布纳迪 | 申请(专利权)人: | 加尔文医学研究所 |
主分类号: | G16B30/00 | 分类号: | G16B30/00;G16B50/30 |
代理公司: | 31283 上海弼兴律师事务所 | 代理人: | 薛琦 |
地址: | 澳大利亚*** | 国省代码: | 澳大利亚;AU |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本公开涉及用于处理排序数据流的方法和系统。系统从排序器接收序列且将其存储为数据库上的数据记录。序列与表示次数的计数器相关联,关联的序列已经被排序。系统从序列接收进一步的序列作为流数据。在接收进一步序列时,系统匹配流数据与存储的序列以决定匹配分数。在匹配分数超过数据库中的多个序列中的一个的匹配阈值时,根据匹配分数选择数据库中多个序列中的这一个,并且如果与选择的序列相关联的计数器值低于饱和阈值,则在非易失存储器上存储进一步序列。如果计数器值高于饱和阈值,则系统也终止接收。 | ||
搜索关键词: | 计数器 匹配分数 数据库 存储 流数据 关联 排序 匹配 饱和 非易失存储器 数据流 接收序列 数据记录 序列接收 排序器 阈值时 | ||
【主权项】:
1.一种用于处理来自排序器的流数据的方法,该方法包括:/n从该排序器接收多个序列;/n将该多个序列的每一个存储为数据库的数据记录,该多个序列的每一个与表示次数的计数器相关联,该关联的序列已经被排序;/n从该排序器逐步接收进一步的序列作为流数据;/n在接收该进一步的序列时,匹配该流数据与该数据库中该多个序列的每一个,以对该数据库的记录中该多个序列的每一个决定匹配分数;/n在该匹配分数超过该数据库中的该多个序列中的一个的匹配阈值时,根据该匹配分数选择该数据库中该多个序列中的这一个;/n在与选择的序列相关联的计数器值低于饱和阈值的地方,在非易失存储器上存储该进一步序列;及/n在与选择的序列相关联的计数器值在高于饱和阈值的地方,则终止该进一步序列的接收。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于加尔文医学研究所,未经加尔文医学研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201880032018.6/,转载请声明来源钻瓜专利网。
- 同类专利
- 染色体外环状DNA识别方法、系统、设备及介质-201911061300.X
- 刘英娟;孙晓勇;陈士民;付尊元;韩金玉;魏庆功;张圆周;张童 - 山东第一医科大学(山东省医学科学院);山东农业大学
- 2019-11-01 - 2020-02-14 - G16B30/00
- 本公开公开了染色体外环状DNA识别方法、系统、设备及介质,包括:训练阶段:构建若干个并列的组合神经网络单元;基于已知类型的DNA进行裁剪,构建不同长度序列的训练集;对训练集进行预处理;将经过预处理后的每一种长度序列的训练集输入到对应的组合神经网络单元中,对组合神经单元进行训练;得到训练好的组合神经网络单元;每一种长度序列的训练集,均训练出对应的组合神经网络单元;最终,得到若干个针对不同长度序列的组合神经网络单元;应用阶段:获取待识别的DNA;对待识别的DNA进行裁剪;对裁剪后的结果进行预处理;将预处理后的裁剪的DNA输入到对应的组合神经网络单元中,输出待识别DNA的识别结果。
- 具有多路生物样本聚合的测序系统-201880041432.3
- E·史密斯;J·比尔勒;S·金;T·阿拉贡;P·克鲁兹;R·康斯坦德斯 - 伊鲁米那股份有限公司
- 2018-07-25 - 2020-02-11 - G16B30/00
- 对于测序产量的每生物样本聚集,支持各种各样的方案。测序系统可以对多个生物样本进行并行测序。当获得测序产量结果时,它们可以与生物样本匹配,并且可以监视针对生物样本的测序进展。可以指定目标产量,使得当聚合的产量达到目标时自动启动测序产量分析应用。与质量控制和进展中的产量相关的其他功能可以带来更有效的测序活动并减少浪费。
- 用于对来自已知或未知基因型的多个贡献者的DNA混合物分解和定量的方法和系统-201880041577.3
- 李勇;J·布鲁恩;R·凯利;C·李;K·舍夫勒 - 伊鲁米那股份有限公司
- 2018-06-19 - 2020-02-07 - G16B30/00
- 提供了用于对核酸混合物样品进行定量和解卷积的方法和系统,该核酸混合物样品包括具有已知或未知基因组的一个或多个贡献者的核酸。在此提供的方法和系统实施使用贝叶斯概率建模技术确定嵌合样品中遗传上不同的贡献者的丰度和置信区间的过程,从而提高了特异性、准确性和敏感性,并极大扩展了优于常规方法的应用范围。
- 通过计算机程序模拟产生简化DNA甲基化测序数据的方法-201710576797.3
- 陆燕;孙喜伟;刘鹏渊;周莉媛 - 浙江大学
- 2017-07-14 - 2020-01-24 - G16B30/00
- 本发明公开了一种通过计算机程序模拟产生简化DNA甲基化测序数据的方法,可以用来评估不同简化基因组甲基化(RRBS)测序数据比对软件的效率以及相应数据分析平台的可靠性,以此来确定最优的比对方法及相应的最优参数。本发明通过计算机程序模拟RRBS文库构建和测序过程,根据CpGs甲基化水平的分布,产生与真实RRBS测序数据非常相近的仿真数据。该仿真数据除了模拟单个碱基水平的甲基化水平外,还模拟了真实数据的插入、缺失、单核苷酸变异和结构变异等其他特性以增加真实性。此外,本发明在模拟RRBS测序过程中,通过引入经验误差模型来模拟测序过程中出现的误差,进一步增加了仿真数据的真实性。
- 一种拷贝数变异的分析方法、分析装置、设备及存储介质-201810481363.X
- 孙明明;唐小艳;邓俊豪;向丽娜;赵薇薇;于世辉 - 广州金域医学检验中心有限公司;广州金域医学检验集团股份有限公司
- 2018-05-18 - 2020-01-17 - G16B30/00
- 本发明涉及一种拷贝数变异的分析方法、分析装置、设备及存储介质。本发明提供的上述拷贝数变异的分析方法通过调用相应的应用程序对二代测序的DNA测序数据依次进行抽提、比对、标记区分、统计分析,最终得到CNV区域的read的占比和/或拷贝数,最终结果准确性高,分辨率好,尤其是在抽提过程中,根据靶标区域的碱基数目、测序读长以及预设的平均深度来确定待抽取的read数目,这样可以有针对性的对不同的测序结果进行分析,分析结果的可靠性大大提高。
- 用于预测基因组变异对前mRNA剪接的影响的系统和方法-201910612239.7
- R·斯里尼瓦桑;A·然;P·乔杜里 - 塔塔咨询服务公司
- 2019-07-08 - 2020-01-14 - G16B30/00
- 本公开一般性地涉及用于预测基因组变异对前mRNA剪接的影响的方法和系统。该方法包括接收基因转录物的至少一种候选变体的基因组位置信息和基因转录物的坐标信息;基于基因转录物的坐标信息和至少一种候选变体的基因组位置信息将至少一种候选变体分类为剪接受体位点区域和分支位点区域之一;基于来自至少一种候选变体的分类的分类区域评估至少一种候选变体对前mRNA剪接的影响;基于评估的至少一种候选变体对前mRNA剪接的影响来预测至少一种候选变体的致病性。
- 用于高效压缩基因组序列读段的方法和系统-201780086770.4
- 克劳迪奥·阿尔贝蒂;穆罕默德·霍索·巴鲁克 - 耶诺姆希斯股份公司
- 2017-12-15 - 2020-01-10 - G16B30/00
- 提供了一种用于压缩由基因组测序仪产生的基因组序列数据的方法和设备。通过将序列读段与预先存在或构建的参考序列比对来编码序列读段,编码过程包括将读段分类为数据类,然后根据多个基因组描述符对每个类进行编码。相同类型的基因组描述符被组织成块,这些块通过应用连续的转换阶段、二值化和熵编码来压缩。特定的源模型和熵编码器用于每个数据类和每个相关描述符。
- 一种基于CPU+MIC异构平台的SIFT并行处理方法-201611081510.1
- 董昊;龚湛;张清 - 苏州浪潮智能科技有限公司
- 2016-11-30 - 2020-01-03 - G16B30/00
- 本发明公开了一种基于CPU+MIC异构平台的SIFT并行处理方法,对SIFT算法中核心模块进行MIC上的加速,利用消息传递机制系统,对当前多序列进行分割,形成多条单蛋白质序列,对每条蛋白质序列进行并行加速处理、在数据库中进行序列比对,挖掘其并行度。本发明实现整个算法效率大幅提升,并解决传统CPU计算方法以及系统应用的性能低下、生产效率低等问题。
- 序列数据流的处理-201880032018.6
- 马丁·史密斯;詹姆斯·弗格森;丹尼斯·布纳迪 - 加尔文医学研究所
- 2018-03-23 - 2019-12-31 - G16B30/00
- 本公开涉及用于处理排序数据流的方法和系统。系统从排序器接收序列且将其存储为数据库上的数据记录。序列与表示次数的计数器相关联,关联的序列已经被排序。系统从序列接收进一步的序列作为流数据。在接收进一步序列时,系统匹配流数据与存储的序列以决定匹配分数。在匹配分数超过数据库中的多个序列中的一个的匹配阈值时,根据匹配分数选择数据库中多个序列中的这一个,并且如果与选择的序列相关联的计数器值低于饱和阈值,则在非易失存储器上存储进一步序列。如果计数器值高于饱和阈值,则系统也终止接收。
- 用于检测插入和缺失的方法和系统-201880031749.9
- 马尔辛·西科拉;穆罕默德·R·穆赫塔里;达里娅·丘多瓦 - 夸登特健康公司
- 2018-05-18 - 2019-12-27 - G16B30/00
- 用于通过以下步骤来改进插入和/或缺失的判定的方法和系统:在来自核酸测序仪的序列读段中识别具有相同分子条形码和序列的遗传序列读段,将遗传读段分组到族(family)中,以及处理包括分裂读段(split read)的族以检测多核苷酸分子样品中的插入和/或缺失。
- 一种智能采样的少分子数遗传序列检测装置-201920042460.9
- 邓玉姗;邓宏晟;赵欣;邓贞宙;刘志涛;段志文;韩春雷 - 南昌大学
- 2019-01-10 - 2019-12-20 - G16B30/00
- 本实用新型公开一种智能采样的少分子数遗传序列检测装置,属于遗传信息载体脱氧核糖核酸检测领域,一种智能采样的少分子数遗传序列检测装置,包括微晶颗粒双层结构模块、遗传信息载体脱氧核糖核酸分子动力模块、单电子读出模块、系统响应矩阵模块、以及遗传信息载体脱氧核糖核酸序列估计模块。本实用新型的智能采样的少分子数遗传序列检测装置具有更好的应用适应性和输入灵敏度、降低系统成本,并且具有良好的模块化特征。
- 胎儿游离DNA浓度获取方法和装置-201811162012.9
- 关永涛;党明浩;徐寒黎;张静波;方楠;白灵;王建伟;刘倩;唐宇 - 北京优迅医疗器械有限公司
- 2018-09-30 - 2019-12-17 - G16B30/00
- 本发明公开了一种胎儿游离DNA浓度获取方法及装置。该方法包括:获取待测样本的测序数据,其中,待测样本取自怀有胎儿的母亲;建立母亲和胎儿基因型的联合概率分布模型,其中,联合概率分布模型中包括影响杂合度的一个或多个因素,杂合度为测序数据中SNP杂合位点数占总位点数的比例;将一个或多个因素的值以及获取到的杂合度的值代入联合概率分布模型,并对联合概率分布模型进行求解,得到胎儿游离DNA浓度。该方法解决了现有技术中胎儿浓度检测成本高的问题。
- 用于传送并且预处理测序数据的系统和方法-201910873177.5
- S·C·本茨;J·Z·萨伯恩;C·J·瓦斯凯 - 凡弗3基因组有限公司
- 2014-11-13 - 2019-12-13 - G16B30/00
- 本公开涉及用于传送并且预处理测序数据的系统和方法。公开了“组学”数字数据传输系统和方法。公开的系统和方法采用传输服务器,该传输服务器基于来自一个或多个测序装置的机器专用注释和与组学输出文件的一种或多种属性相关的用户输入来聚集较大量的组学输出文件的传输组。
- 一种单细胞ATAC-seq数据分析方法-201910768671.5
- 夏昊强;高川;周煌凯;张羽;陶勇;罗玥;陈飞钦;曾川川 - 广州基迪奥生物科技有限公司
- 2019-08-20 - 2019-12-06 - G16B30/00
- 本发明提供一种单细胞ATAC‑seq数据分析方法,包括以下步骤:步骤S1,对测序原始数据进行数据分析与质控;步骤S2,比对分析;步骤S3,插入片段分析;步骤S4,富集区域Peak分析;步骤S5,单细胞亚群分类;步骤S6,对Peak相关基因进行注释和富集;步骤S7,TF‑motif分析;步骤S8,亚群可及性差异分析;步骤S9,差异可及性位点相关基因分析,对鉴定出的差异TF‑motif所在peak区域最邻近的转录起始位点所对应的基因注释等步骤。本发明构建了一个全面、分析内容丰富的单细胞ATAC‑seq数据分析流程,分析结果揭示了大量的生物信息,方便人们深入挖掘蕴藏在单细胞水平内的生物学现象和特征,分析流程及结果以html的形式进行可视化展示,分析内容层次明了,结果展现形式多样,增加了报告的可读性。
- 一种个性化肿瘤疫苗制备方法-201811448493.X
- 丁平 - 丁平
- 2018-11-30 - 2019-11-22 - G16B30/00
- 本发明提出了一种个性化肿瘤疫苗制备方法,其特征在于:a)对肿瘤患者的MHC进行亲和力预测,获得能够和MHC高效结合的有效突变肽;b)基于步骤a)的预测结果,合成有效新生抗原RNA和CD40LRNA;c)DC细胞的诱导及成熟,获得成熟的DC细胞;d)将所述新生抗原RNA和所述CD40L RNA导入所述成熟的DC细胞;e)经过步骤d)后,体外检测DC细胞表型以及刺激T细胞的效力。
- 一种识别和消除核酸变异检测中假阳性的方法和装置-201811592826.6
- 周衍庆;汪周阳;方文;张实唯 - 深圳市海普洛斯生物科技有限公司
- 2018-12-20 - 2019-11-19 - G16B30/00
- 本申请公开了一种识别和消除核酸变异检测中假阳性的方法和装置。本申请的方法包括,读取待测样品的变异检测软件结果文件;读取去除PCR重复后测序read的比对文件,获得每一个变异位点覆盖的read pair比对结果;判断变异位点是否位于DNA分子read pair overlap区域,对每个突变覆盖的read pair进行分析和统计;对每一个支持突变的分子和read进行统计,标注出可以用于突变过滤的特征;基于以上特征值对变异位点进行过滤。本申请的方法,根据核酸变异假阳性位点和真阳性位点的分布特征,对核酸变异检测结果进行过滤,不仅能够有效的去除假阳性位点,而且提高了核酸变异检测结果的准确性。
- 专利分类