[发明专利]用于检测基因组中拷贝数变异的方法和装置在审
申请号: | 201980071086.8 | 申请日: | 2019-09-13 |
公开(公告)号: | CN112955959A | 公开(公告)日: | 2021-06-11 |
发明(设计)人: | 李婉萍;张呈生;朱其慧;C·李 | 申请(专利权)人: | 杰克逊实验室 |
主分类号: | G16B20/10 | 分类号: | G16B20/10;G16B40/00;C12Q1/6869 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 陈文平 |
地址: | 美国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 检测 基因组 拷贝 变异 方法 装置 | ||
1.一种用于检测遗传序列中的拷贝数变异(CNV)的方法,所述方法包括:
使用处理器执行以下步骤:
扫描所述遗传序列以识别至少一个常染色体内的至少一个独特遗传区域;
将所述遗传序列分成多个位元,所述多个位元中的每个位元包含所述遗传序列的多个碱基对;
计算所述多个位元中的每个位元的CNV状态;和
过滤所述CNV状态以识别所述遗传序列中的至少一个CNV。
2.根据权利要求1所述的方法,其中所述遗传序列是部分基因组序列。
3.根据权利要求1所述的方法,其中所述遗传序列是全基因组序列(WGS)。
4.根据权利要求1-3中任一项所述的方法,其进一步包括将所述遗传序列与参照基因组进行比对。
5.根据权利要求1-4中任一项所述的方法,其中识别所述至少一个常染色体内的至少一个独特遗传区域包括:
确定所述至少一个独特遗传区域的每个25k-mer在所述遗传序列内仅出现一次;和
确定所述至少一个独特遗传区域包含大于20,000个碱基对。
6.根据权利要求1-5中任一项所述的方法,其进一步包括计算所述遗传序列的读取深度。
7.根据权利要求1-6中任一项所述的方法,其进一步包括:
基于所述至少一个独特遗传区域的读取深度来计算所述至少一个常染色体的读取深度;
将所述至少一个常染色体的所述读取深度与所述遗传序列的所述读取深度进行比较;和
基于比较的读取深度来确定所述遗传序列是否包含非整倍性。
8.根据权利要求1-7中任一项所述的方法,其中计算所述多个位元中的每个位元的CNV状态包括:
计算所述多个位元中的每个位元的读取深度;
将所述多个位元中的每个位元的所述读取深度转换成百分位数;和
将所述百分位数转换成CNV状态。
9.根据权利要求1-8中任一项所述的方法,其中将所述读取深度转换成百分位数包括:
用所述多个位元中的每个位元的所述读取深度除以所述多个碱基对中的碱基对数量并乘以所述遗传序列的所述读取深度。
10.根据权利要求1-9中任一项所述的方法,其中将每个位元的所述百分位数转换成CNV状态包括应用具有所述遗传序列的读取深度的泊松分布的隐马尔可夫模型(HMM)。
11.根据权利要求1-10中任一项所述的方法,其中所述多个位元中的每个位元包含50个碱基对。
12.根据权利要求1-11中任一项所述的方法,其进一步包括将所述多个位元中的一个或多个位元合并。
13.根据权利要求1-12中任一项所述的方法,其中过滤所述CNV状态包括:
将合并的位元划分成多个区域,每个区域包含相等数量的碱基对;
为每个区域分配唯一性值;和
滤除唯一性值低于阈值的区域。
14.根据权利要求13所述的方法,其中通过确定所述区域中的唯一k-mer的数量来计算所述唯一性值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杰克逊实验室,未经杰克逊实验室许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980071086.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:起重电动机的过载判定方法以及卷扬机的制造方法
- 下一篇:化妆料
- 同类专利
- 一种胎儿染色体异常的检测方法与系统-202080107528.2
- 白勇;黄树嘉;高雅;金鑫 - 深圳华大生命科学研究院
- 2020-11-27 - 2023-08-25 - G16B20/10
- 一种胎儿染色体异常的检测方法与系统,方法包括:(1)获得待测孕妇的游离核酸片段的测序数据和临床表型特征数据,其中测序数据包括若干读段,待测孕妇的临床表型特征数据形成孕妇表型特征向量;(2)对参考基因组染色体的至少一部分进行窗口划分,获得若干滑动窗口,统计落入滑动窗口内的读段,生成所述染色体序列的序列特征矩阵;(3)将序列特征矩阵输入训练的机器学习模型以提取染色体序列的序列特征向量;(4)将序列特征向量和孕妇表型特征向量组合形成组合特征向量,将组合特征向量输入分类检测模型,获得待测孕妇的胎儿染色体异常情况。
- 使用非错误传播定相技术和等位基因平衡的组合改进CNV检测-202180084302.X
- A·库马尔;M·拉比诺维茨 - 迈欧米公司
- 2021-10-29 - 2023-08-15 - G16B20/10
- 本文公开了如下方法,其使用非错误传播定相技术与通过更常规的错误传播方法获得的测序数据的组合以改进基因组的定相和校正等位基因平衡信号,从而能够允许改进对染色体区段的倍性状态的确定。本文进一步公开了组合使用等位基因平衡和读取深度来改进倍性状态确定的方法。本文描述的技术能够以微创方式用于确定胚胎或胎儿的倍性状态以及鉴定肿瘤DNA中的染色体不稳定性。
- 用于检测遗传改变的系统和方法-202180044375.6
- 萨拉·L·金宁斯;科斯明·德丘;迈克尔·梅恩 - 伊鲁米纳软件公司
- 2021-11-30 - 2023-05-23 - G16B20/10
- 所公开的技术涉及用于重新分析样品以实现信息更丰富的测试结果的自动流体处理系统和自动测序方法。在一个实施方案中,处理样品核酸以识别靶突变的方法包括执行第一测序反应以确定样品特定的特性。该方法还包括确定统计量度以确定由该第一测序反应得出的该靶突变的第一读段覆盖度是高于还是低于阈值。如果所确定的第一读段覆盖度未超过该阈值,则该方法还包括确定是否有足量的样品核酸可用于执行第二测序反应以将该读段覆盖度增加到高于该阈值。如果有足量的样品核酸可供使用,则该方法继续执行该样品核酸的重新测序以实现超过该阈值的第二读段覆盖度。
- 用于表征无细胞核酸片段的方法-202180047341.2
- 戴安娜·阿布杜伊瓦 - 阿克图尔公司
- 2021-05-20 - 2023-04-25 - G16B20/10
- 本公开内容提供了用于无细胞核酸(cfNA)的各种用途的方法和系统。cfNA片段化模式的功能性分型可以用于疾病的非侵入性检测、诊断和监测。一个实施方案可以确定对象中癌症的阶段、对象中癌症的进展或对象中对癌症的治疗的应答性。本文公开的另一个实施方案可以包括无测序诊断方法。
- 试剂盒和使用试剂盒的方法-202080079913.0
- N.伦奇;S.德鲁里;Y.帕特尔;T.瑞尼 - 康捷尼科有限公司
- 2020-09-18 - 2022-07-08 - G16B20/10
- 一种用于在设备中使用的用于遗传筛查的试剂盒,其中所述试剂盒在操作时执行湿实验室测定。所述测定包含处理来源于一个或多个细胞外显子组的遗传物质以及检测来自遗传物质的遗传DNA读数中的单核苷酸变体(SNV)、插入缺失和拷贝数变异(CNV)。所述试剂盒可作为处理所述遗传物质的单一测定来执行。所述试剂盒包含软件产品,所述软件产品可在计算硬件上执行以使所述计算硬件调用算法以通过将所述遗传DNA读数的部分与DNA序列转录物进行比较来处理所述遗传DNA读数,以便确定所述DNA读数数据中所述DNA序列转录物出现的概率。所述算法用于同时检测来自所述遗传物质的所述遗传DNA读数中的SNV和CNV两者,并且对临床相关的CNV进行注释。
- 识别胚胎中染色体异常的系统和方法-201980079901.5
- 约翰·布鲁克;迈克尔·J·拉奇;乔舒亚·布拉热克 - 合作基因组公司
- 2019-10-07 - 2021-08-06 - G16B20/10
- 本发明公开了一种识别胚胎中染色体异常的方法。接收从胚胎获得的样本基因组序列信息,其中所述样本基因组序列信息由多个基因组序列读数组成。将样本基因组序列信息与参考基因组比对。将样本基因组序列信息相对于基线基因组序列信息进行归一化,以针对位点效应校正样本基因组序列信息,并生成归一化的样本基因组序列信息数据集。将来自误差因子的回归分析的一个或多个校正因子应用于归一化的样本基因组序列信息数据集,以校正技术效果并生成去噪的样本基因组序列信息数据集。当与参考基因组上的染色体位置比对的基因组序列读数的频率偏离频率阈值时,可以识别去噪后的样本基因组序列信息数据集中的拷贝数变异。
- 用于检测基因组中拷贝数变异的方法和装置-201980071086.8
- 李婉萍;张呈生;朱其慧;C·李 - 杰克逊实验室
- 2019-09-13 - 2021-06-11 - G16B20/10
- 提出了用于检测遗传序列中的拷贝数变异(CNV)、诊断由CNV引起的病症和治疗由CNV引起的病症的技术。所述技术包括使用处理器来执行以下步骤:扫描所述遗传序列以识别对应于至少一个常染色体的遗传区域,将所述遗传序列划分成位元(bin),计算多个位元中的每个位元的CNV状态,和过滤所述CNV状态以识别所述遗传序列中的至少一个CNV。
- 使用神经网络调用倍性状态的方法和系统-201980047284.0
- 阿古斯特·埃吉尔松;乔治·格梅洛斯;斯蒂米尔·西于尔永松 - 纳特拉公司
- 2019-07-16 - 2021-04-09 - G16B20/10
- 一种使用神经网络来调用倍性状态的方法包括:针对训练样本确定多个基因位置的基因测序数据或基因阵列数据;基于基因测序数据或基因阵列数据,确定多个基因片段的相应真实性倍性状态值,每个基因片段各自包含多个基因位置中的至少一些;以及确定包含用于调用相应倍性状态值的一个或多个层的神经网络,该神经网络至少部分地由多个权重定义。该方法进一步包括使用特定过程来迭代地修改权重。该方法进一步包括:针对测试样本,通过经由修改过的神经网络传播测试样本的基因测序数据或测试样本的基因阵列数据来调用目标基因区域的倍性状态。
- 检测染色体非整倍性的方法、装置及系统-201880091839.7
- 曾立董;吴增丁;金欢;徐伟彬;李林森;赵陆洋;张萌;颜钦 - 深圳市真迈生物科技有限公司
- 2018-05-07 - 2020-11-10 - G16B20/10
- 一种检测染色体非整倍性的方法、装置及系统。方法包括:对待测样本中的至少一部分核酸进行测序,获得包括读段的测序结果;将读段比对到参考序列,获得比对结果,比对结果包括读段定位于具体染色体的信息;对比对结果进行过滤,包括过滤掉比对结果中定位于参考序列上比对能力非为1的区域的读段,定义参考序列中定位到参考序列唯一位置的区域的比对能力为1;对于第一染色体,基于比对结果,确定定位到该第一染色体的读段的量;比较定位到该第一染色体的读段的量与阴性样本中的定位到相应第一染色体的读段的量,以判定该第一染色体的数目。
- 识别拷贝数异常的方法-201980018816.8
- 厄尔·哈贝尔 - 格里尔公司
- 2019-03-13 - 2020-10-30 - G16B20/10
- 本发明公开了一种系统,可以基于一样本与一第二样本的多个特性的一比较来识别所述样本中的一拷贝数变化的一来源。被分类在一基因组的多个箱中的多个序列读数从一第一样本以及一第二样本获得。基于例如所述箱的一箱序列读取计数、一预期序列读取计数以及一方差估计,来确定由所述多个序列读数分类的每一个箱是否为统计显着的。同样,基于一区段序列读取计数以及一区段方差估计,来确定对于所述第一样本以及所述第二样本,所述基因组的每一个区段是否为统计显着的。将所述第一样本的统计显着的多个箱以及多个区段与所述第二样本的统计显着的多个箱以及多个区段进行比较,并基于所述比较来识别一拷贝数变化的来源。
- 专利分类