[发明专利]基于RNA-seq数据的肿瘤基因突变检测方法及系统在审
申请号: | 201810632056.7 | 申请日: | 2018-06-19 |
公开(公告)号: | CN110021348A | 公开(公告)日: | 2019-07-16 |
发明(设计)人: | 黄金艳;李剑峰 | 申请(专利权)人: | 上海交通大学医学院附属瑞金医院 |
主分类号: | G16B20/50 | 分类号: | G16B20/50 |
代理公司: | 上海愉腾专利代理事务所(普通合伙) 31306 | 代理人: | 唐海波 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 突变检测 基因突变 肿瘤基因 基因突变检测 基因突变位点 多个数据库 基因数据库 注释数据库 测序数据 分析流程 化疗药物 基因序列 检测分析 突变位点 肿瘤发生 作用位点 质量控制 靶向 比对 整合 算法 数据库 肿瘤 基因 疾病 | ||
1.基于RNA-seq数据的肿瘤基因突变检测方法,其特征在于,所述基于RNA-seq数据的肿瘤基因突变检测方法包括以下步骤:
收集并分别整理出不同肿瘤、疾病高发的基因突变,建立一个高优先级突变检测的基因列表及突变位点数据库;
收集并整理出目前已经具有明确的靶向或化疗药物作用位点的基因突变及基因数据库;
建立基于RNA-seq的基因突变注释数据库;
收集整理出用于RNA-seq突变检测的质量控制、基因序列比对、基因突变检测算法;
建立一套完整的从原始RNA-seq测序数据到最后突变检测结果的分析流程。
2.根据权利要求1所述的基于RNA-seq数据的肿瘤基因突变检测方法,其特征在于,所述从原始RNA-seq测序数据到最后突变检测结果的分析流程包括以下步骤:
输入文件为FASTQ格式的RNA-seq测序数据;
将RNA-seq测序数据比对到人类参考基因组上并生成相应的BAM文件;
使用Picard和GATK完成一系列预处理步骤;
调用多种突变检测算法对BAM文件进行突变检测;
使用ANNOVAR和构建的annovarR注释工具来对检测出的突变进行注释;
挑选出与肿瘤发生、发展具有潜在相关性的基因突变位点。
3.根据权利要求2所述的基于RNA-seq数据的肿瘤基因突变检测方法,其特征在于,所述分析流程包括:通过可视化函数将最终突变检测结果转化为可以直接使用ProteinPaint工具进行基因突变数据可视化工作的格式。
4.根据权利要求2所述的基于RNA-seq数据的肿瘤基因突变检测方法,其特征在于,所述预处理步骤包括:去重、分割含有N的CIGAR reads、插入缺失序列的重排以及碱基质量矫正。
5.根据权利要求2所述的基于RNA-seq数据的肿瘤基因突变检测方法,其特征在于,所述分析流程包括:进行低敏感度的2pass检测来防止由于过滤条件严格导致的假阴性。
6.根据权利要求2所述的基于RNA-seq数据的肿瘤基因突变检测方法,其特征在于,所述分析流程包括:使用SAMtools或IGV对最终的突变位点进行人工检查,去掉一些潜在的假阳性位点。
7.根据权利要求2所述的基于RNA-seq数据的肿瘤基因突变检测方法,其特征在于,所述将RNA-seq测序数据比对到人类参考基因组上并生成相应的BAM文件包括:使用STAR2pass模式将RNA-seq测序数据比对到人类参考基因组上并生成相应的BAM文件。
8.根据权利要求2至7之一所述的基于RNA-seq数据的肿瘤基因突变检测方法,其特征在于,所述annovarR注释工具是通过以ANNOVAR注释工具整合的50种与基因变异相关的数据库为基础进行相关开发和扩展形成的。
9.基于RNA-seq数据的肿瘤基因突变检测系统,其特征在于,所述基于RNA-seq数据的肿瘤基因突变检测系统包括:
基因列表及突变位点数据库模块,用于收集并分别整理出不同肿瘤、疾病高发的基因突变,建立一个高优先级突变检测的基因列表及突变位点数据库;
基因突变及基因数据库模块,用于收集并整理出目前已经具有明确的靶向或化疗药物作用位点的基因突变及基因数据库;
基因突变注释数据库模块,用于建立基于RNA-seq的基因突变注释数据库;
检测模块,用于收集整理出用于RNA-seq突变检测的质量控制、基因序列比对、基因突变检测算法;
分析模块,用于建立一套完整的从原始RNA-seq测序数据到最后突变检测结果的分析流程。
10.根据权利要求9所述的基于RNA-seq数据的肿瘤基因突变检测系统,其特征在于,所述分析模块包括:
输入模块,用于输入文件为FASTQ格式的RNA-seq测序数据;
比对模块,用于将RNA-seq测序数据比对到人类参考基因组上并生成相应的BAM文件;
预处理模块,用于使用Picard和GATK完成一系列预处理步骤;
突变检测模块,用于调用多种突变检测算法对BAM文件进行突变检测;
注释模块,用于使用ANNOVAR和构建的annovarR注释工具来对检测出的突变进行注释;
结果选择模块,用于挑选出与肿瘤发生、发展具有潜在相关性的基因突变位点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学医学院附属瑞金医院,未经上海交通大学医学院附属瑞金医院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810632056.7/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 一种预测突变对RNA二级结构影响程度的方法和相关设备-201910705654.7
- 苏志熙;何馥男 - 复旦大学
- 2019-08-01 - 2019-11-05 - G16B20/50
- 本发明提供了一种预测突变对RNA二级结构影响程度的方法和相关设备。本发明还提供了预测癌症基因组中富含或缺失riboSNitch元件的方法。本发明也提供了名为SNIPER的软件,能够用于预测riboSNitch并识别肿瘤中富含或缺失riboSNitch的非编码元件。
- 基于EucDiff值预测突变对RNA二级结构影响程度的方法和相关设备-201910484577.7
- 苏志熙;何馥男 - 复旦大学
- 2019-06-05 - 2019-10-08 - G16B20/50
- 本发明涉及检测突变对RNA二级结构影响技术领域,尤其涉及基于EucDiff值预测突变对RNA二级结构影响程度的方法和相关设备。本发明还提供了预测癌症基因组中富含或缺失riboSNitch元件的方法。本发明也提供了名为SNIPER的软件,能够用于预测riboSNitch并识别肿瘤中富含或缺失riboSNitch的非编码元件。
- 一种定量评估烟草引起分子突变程度的方法-201910280783.6
- 宋凯;仇哲炜;何奇恩 - 天津大学
- 2019-04-09 - 2019-08-13 - G16B20/50
- 本发明公开了一种定量评估烟草引起分子突变程度的方法,综合考虑了TMB和TTR两个变量,训练得出的F‑score模型可以更加客观、准确地评估肺癌中曾吸烟患者和不吸烟患者出现的与烟雾相关的分子损伤的存在和程度。通过检测肺癌患者的分子突变情况反推患者所得肺癌是否有吸烟引起。结果表明,本发明F‑score方法更能使得预测结果与样本烟雾暴露历史相吻合。
- 基于RNA-seq数据的肿瘤基因突变检测方法及系统-201810632056.7
- 黄金艳;李剑峰 - 上海交通大学医学院附属瑞金医院
- 2018-06-19 - 2019-07-16 - G16B20/50
- 本发明公开了一种基于RNA‑seq数据的肿瘤基因突变检测方法,包括以下步骤:收集并分别整理出不同肿瘤、疾病高发的基因突变,建立一个高优先级突变检测的基因列表及突变位点数据库;收集并整理出目前已经具有明确的靶向或化疗药物作用位点的基因突变及基因数据库;建立基于RNA‑seq的基因突变注释数据库;收集整理出用于RNA‑seq突变检测的质量控制、基因序列比对、基因突变检测算法;建立一套完整的从原始RNA‑seq测序数据到最后突变检测结果的分析流程;还公开了基于RNA‑seq数据的肿瘤基因突变检测系统。通过使用整合的多个数据库,通过检测分析流程人们可以更加快速的找到已知的与肿瘤发生相关的基因突变位点。
- 用于基于规则的基因组设计的方法-201780049973.6
- G·库兹耐特索夫;M·J·拉乔伊;M·M·兰登;M·G·纳波利塔诺;D·B·古德曼;C·J·格雷格;G·M·丘奇;N·奥斯特罗夫 - 哈佛学院董事及会员团体
- 2017-06-15 - 2019-07-09 - G16B20/50
- 本文描述了用于设计、测试和验证基因组设计的方法和系统。计算机实施的方法包括,接收已知基因组和等位基因列表的数据,鉴定和去除已知基因组中各等位基因的出现,确定用于替换已知基因组中出现的多个等位基因选择,基于已知基因组产生基因组设计的多个替代性基因序列,通过为各替代性基因序列中各规则或约束或条件或参数或特征分配评分,将多个规则或约束或条件或参数或特征应用于各替代性基因序列,产生评分,基于评分的加权组合,对各替代性基因序列进行评分,并基于评分选择至少一个替代性基因序列作为基因组设计。
- 结构体变异检测的方法及装置-201610830359.0
- 石子夜;何珊;徐东泽;张发恩;吴李知 - 北京百度网讯科技有限公司
- 2016-09-18 - 2019-04-30 - G16B20/50
- 本发明提供一种结构体变异检测的方法及装置。所述方法包括:将测试序列按照染色体的位点划分,得到至少两个染色体分段;同时启动至少两个染色体分段中每一分段的结构体变异检测的进程,以进行结构体变异检测;检测至少两个染色体分段的进程,确定未完成进程数是否减少到总进程数的预设比例阈值;当未完成进程数减少到总进程数的预设比例阈值时,杀掉未完成的进程;将未完成的进程按照染色体的位点进一步划分,并启动划分后的染色体分段的结构体变异检测的进程,以进行结构体变异检测。通过采用本发明的技术方案,可以充分利用计算机资源,加快整个测试序列的结构体变异的检测进程,缩短整个测试序列的结构体变异的检测时间,提高检测效率。
- 前列腺相关癌基因信息收集及分析系统和方法-201510752792.2
- 吴志宏 - 吴志宏
- 2015-11-06 - 2019-04-19 - G16B20/50
- 本发明涉及前列腺相关癌基因信息收集及分析方法。发明提供一种前列腺相关癌基因信息收集及分析系统,通过对现有数据库中所有涉及前列腺癌的数据进行收集,利用生物信息学方法对收集的前列腺癌的mRNA和miRNA高通量转录组数据进行整合分析,基于大样本大数据处理得到适用于临床应用的前列腺癌诊断标志物。
- 根据基因突变信息对样本分类的方法、装置、设备及介质-201910061006.2
- 高军晖;王丽君;袁卫兰;张英霞;龚建兵;赵伟;林灵 - 上海宝藤生物医药科技股份有限公司;上海宝藤医学检验所有限公司
- 2019-01-23 - 2019-03-01 - G16B20/50
- 本发明实施例公开了一种根据基因突变信息对样本分类的方法、装置、设备及介质,所述方法包括:获取与至少两个待分类的样本分别对应的突变基因集合,并根据基因间关系图对各所述突变基因集合进行关联基因的扩充;将扩充后的各所述突变基因集合进行合并,并将合并结果划分为与至少两个样本类别分别对应的突变基因分类集合;采用所述突变基因分类集合,对各所述样本进行分类。本发明实施例的技术方案能够优化现有的基于突变基因的样本分类方式,从而提高分类准确性。
- 专利分类