[发明专利]质量分数压缩在审
申请号: | 202180039438.9 | 申请日: | 2021-11-05 |
公开(公告)号: | CN115668384A | 公开(公告)日: | 2023-01-31 |
发明(设计)人: | G·A·P·里兹克 | 申请(专利权)人: | 因美纳有限公司 |
主分类号: | G16B50/50 | 分类号: | G16B50/50;H03M7/30 |
代理公司: | 北京泛华伟业知识产权代理有限公司 11280 | 代理人: | 王勇 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了用于压缩核酸序列数据的方法、系统和计算机程序。该方法可包括:获得核酸序列数据,该核酸序列数据表示:(i)读段序列,和(ii)多个质量分数;确定该读段序列是否包括至少一个N碱基;基于确定该读段序列不包括至少一个N碱基,通过使用第一编码过程来生成第一经编码数据集,该第一编码过程使用以(x‑1)为底数的数对该读段序列的该质量分数中的每个质量分数进行编码,其中x是表示由核酸测序设备使用的不同质量分数的数量的整数;以及使用第二编码过程对该第一经编码数据集进行编码,从而压缩待压缩的数据。 | ||
搜索关键词: | 质量 分数 压缩 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于因美纳有限公司,未经因美纳有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202180039438.9/,转载请声明来源钻瓜专利网。
- 上一篇:被配置为服务多个单页应用的服务工作器
- 下一篇:机电设备的优化开发
- 同类专利
- 通过基于可配置机器学习的算术编码进行的基因组信息压缩-202180056542.9
- S·尚达科;张贻谦 - 皇家飞利浦有限公司
- 2021-06-30 - 2023-04-25 - G16B50/50
- 一种用于对基因组信息的MPEG‑G编码数据进行解码的方法和系统,包括:接收MPEG‑G编码数据;提取编码参数;基于所提取的编码参数来选择算术解码类型;基于所提取的编码参数来选择预测器类型,所述预测器类型指定用于获得用于对所述数据进行算术编码的符号的概率的方法;基于所提取的编码参数来选择算术编码上下文;并且使用所选择的预测器和所选择的算术编码上下文对所述编码数据进行解码。
- 用于个性化医学的自定义数据文件-202180043263.9
- 伊根·杰克逊·洛曼;克里斯托弗·卡尔·埃德兰德;德怀特·托马斯·贝克;杰里米·约瑟夫·沃德 - ILLUMINA公司
- 2021-09-10 - 2023-04-04 - G16B50/50
- 公开了方法和系统,这些方法和系统可以从核酸测序技术和装置收集大型数据集,从各种格式的文件中过滤生物样品的相关基因组信息和序列变体信息,以标准化格式生成仅具有相关信息的自定义数据文件,并且向下游分析提供所生成的信息以用于个性化医学用途。
- 用于存储和传输多样的基因组数据的系统和方法-202180027479.6
- 张贻谦 - 皇家飞利浦有限公司
- 2021-03-31 - 2023-02-03 - G16B50/50
- 一种用于将基因组数据打包在文件结构内的方法(100),所述方法包括:(i)接收(110)包括基因组数据的基因组数据集;(ii)从所述基因组数据集中提取(120)多个属性,其中,所述多个属性中的每个属性是在所述数据结构的属性信息表内定义的;(iii)将每个属性分解(130)成多个预定大小的区块;(iv)将所述多个区块中的每个区块索引(140)在所述数据结构的主索引中;(v)单独压缩(150)所述多个区块中的每个区块;并且(vi)将每个经压缩的区块打包(160)在由所述主索引定义的分配位置内;其中,所述数据结构被配置为使得所述多个区块中的每个区块能够被单独解压缩。
- 质量分数压缩-202180039438.9
- G·A·P·里兹克 - 因美纳有限公司
- 2021-11-05 - 2023-01-31 - G16B50/50
- 本发明公开了用于压缩核酸序列数据的方法、系统和计算机程序。该方法可包括:获得核酸序列数据,该核酸序列数据表示:(i)读段序列,和(ii)多个质量分数;确定该读段序列是否包括至少一个N碱基;基于确定该读段序列不包括至少一个N碱基,通过使用第一编码过程来生成第一经编码数据集,该第一编码过程使用以(x‑1)为底数的数对该读段序列的该质量分数中的每个质量分数进行编码,其中x是表示由核酸测序设备使用的不同质量分数的数量的整数;以及使用第二编码过程对该第一经编码数据集进行编码,从而压缩待压缩的数据。
- 在MPEG-G中进行有效数据压缩的方法和系统-202180034395.5
- C·艾伯蒂;马西莫·拉瓦西;保洛·里贝卡 - 基因组系统公司
- 2021-03-17 - 2022-12-30 - G16B50/50
- 一种计算机实施的方法,其用于存储或传输包括与基因组测序数据相关联的注释数据的基因组文件格式的所述基因组测序数据的表示,所述基因组测序数据包括核苷酸序列的读段,所述方法包括以下步骤:将所述读段比对(10)到一个或多个参考序列,借此创建经比对读段,基于所述经比对读段在所述一个或多个参考序列上的映射根据分类规则对所述经比对读段进行分类(14),借此创建经比对读段的类(18),将所述经分类的经比对读段熵编码为大量的描述符块,以标头信息使所述描述符块结构化,借此创建含有基因组测序数据的第一分类的存取单元(119),所述方法进一步包括将注释数据(12)编码到第二分类的不同存取单元(122)中且将索引数据编码到主注释索引(MAI、123、211)中,其中所述索引数据表示通过对注释串数据(212)采用至少一个压缩串索引算法(28)而获得的所述注释串数据的经编码形式,且其中所述MAI使经编码注释串与第二分类的所述存取单元相关联,所述方法进一步包括对第一分类的所述存取单元、第二分类的所述存取单元和所述MAI进行联合编码。
- 专利分类