[发明专利]基因组注释方法、装置、可视化平台和存储介质有效

专利信息
申请号: 202110209957.7 申请日: 2021-02-25
公开(公告)号: CN112885412B 公开(公告)日: 2023-03-28
发明(设计)人: 董玥;贺增泉;徐则洋;李悦;郑大鹏 申请(专利权)人: 深圳华大基因科技服务有限公司
主分类号: G16B50/10 分类号: G16B50/10;G16B50/00
代理公司: 北京集佳知识产权代理有限公司 11227 代理人: 郭帅
地址: 518000 广东省深圳市盐田区*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要: 本申请提供了一种基因组注释方法、装置、可视化平台和存储介质,包括获取待注释的测序数据,将测序数据根据基因染色体字段进行拆分,得到多个子测序数据;然后将每一个子测序数据映射到对应的子单元基因数据库中进行查找分析,从而得到注释结果,其中子单元基因数据库是对已知的基因数据库根据基因染色体字段进行拆分得到的;该基因组注释方法将百亿级数据的基因数据库拆分成数据量较少的子单元基因数据库,然后将待注释的测序数据拆分成与子单元基因数据库大小其类型相同的子测序数据,在进行注释时只需要将子测序数据与其对应的子单元基因数据库进行比较即可,从而大大减少了缩小了查询范围,节约了计算的时间和计算量。
搜索关键词: 基因组 注释 方法 装置 可视化 平台 存储 介质
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳华大基因科技服务有限公司,未经深圳华大基因科技服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/202110209957.7/,转载请声明来源钻瓜专利网。

同类专利
  • 基于单细胞转录组数据的细胞类型注释方法-202310849793.3
  • 高琳;李超;胡宇轩;许晗 - 西安电子科技大学
  • 2023-07-12 - 2023-10-20 - G16B50/10
  • 本发明公开了一种基于单细胞转录组数据的细胞类型注释方法,主要解决现有技术不能正确表示细胞类型层次关系的问题,以及在层次关系复杂的数据集上分类精度低的问题。本发明构建细胞类型层次关系图,然后对细胞类型进行层次分类。由于构建的细胞类型层次关系图为有向无环图,本发明能表示复杂的细胞类型层次关系。本发明使用双曲蕴含锥网络,能在不同粒度上精确分配细胞类型标签。利用细胞类型层次关系图构建和采样标签,降低了训练网络的复杂度,进一步提升了分类性能。
  • 基于域泛化的可拓展测序数据中的细胞恶性状态注释方法-202310863572.1
  • 杨朝勇;宋佳;姚智显;程蕊 - 上海交通大学医学院附属仁济医院
  • 2023-07-13 - 2023-10-03 - G16B50/10
  • 本发明公开了一种基于域泛化的可拓展测序数据中的细胞恶性状态注释方法,将来自不同组织的数据划分为不同的域进行特征提取,应用于单细胞或空间数据中细胞恶性状态的注释,训练基于多域的泛化模型来预测来自不同域(包括未知域)的测试数据的标签;在分类层由两个神经元输出恶性和非恶性分数;在领域泛化训练过程中,采用基于经验风险和方差的损失函数优化方法进行领域泛化,提高模型的泛化性能;达到循环停止条件后,输出训练完成的神经网络模型。本发明提供的方法能够精确地给目标样本分配准确的标签,用于注释细胞或空间恶性状态。
  • 基因组注释方法和电子装置-202311023993.X
  • 王龙;康玲;彭珍;马策;刘臣;李萍;刘孟 - 北京诺禾致源科技股份有限公司
  • 2023-08-15 - 2023-09-15 - G16B50/10
  • 本发明提供了一种基因组注释方法和电子装置。其中,上述基因组注释方法包括:a)将测序产生的基因片段进行基因组组装,获得组装基因组序列;b)采用多种方式预测组装基因组序列,获得多种预测开放阅读框;c)利用EVM工具对多种预测开放阅读框进行基因整合,获得整合基因结构;d)基于整合基因结构进行基因注释。能够解决现有技术中对于基因组注释结果基因集中BUSCO指标低的问题,适用于基因注释领域。
  • 一种基于三代测序技术的植物叶绿体基因组完成图的构建及高质量注释的方法-202310521662.2
  • 张杰伟 - 北京市农林科学院
  • 2023-05-10 - 2023-09-05 - G16B50/10
  • 本发明涉及生物信息技术领域,尤其涉及一种基于三代测序技术的植物叶绿体基因组完成图的构建及高质量注释的方法。本发明采用了三代测序技术结合二代测序技术构建植物叶绿体基因组完成图,利用RNA‑seq技术对植物不同生长发育阶段和不同组织部位进行转录分析,经生物信息学分析,获得植物叶绿体基因组完成图及其高质量基因注释,为基于叶绿体基因组学和转录组学的物种鉴定提供特异性分子标记开发和功能基因生物学功能的解析提供必要基础。
  • 快速进行全基因组注释区间比较的方法及系统-202110524893.X
  • 李志刚;缪卫国;纪晓贝 - 海南大学
  • 2021-05-14 - 2023-09-01 - G16B50/10
  • 本发明提供一种快速进行全基因组注释区间比较的方法及系统,该方法包括:S1、分别获取基因注释区间A片段坐标集合以及基因注释区间B片段坐标集合;S2、将A片段集合坐标和B片段集合坐标进行合并,获得合并片段集合;S3、对合并片段集合进行去冗余操作和排序操作;S4、调用预设区间交集函数在单次循环中计算合并片段集合中所有注释区间之间的交集;S5、输出预设区间交集函数的计算结果。本发明能够快速计算不同类型基因注释区间的交集,与传统比较方法相比,实现逻辑简单,计算量小且判断准确,有助于提高比较效率。
  • 一种鉴定SL序列反式剪切所形成的基因编码框的方法-202211456038.0
  • 李午佼;孟青;朱纯青;陈运生 - 深圳市儿童医院
  • 2022-11-21 - 2023-08-08 - G16B50/10
  • 本发明提供了鉴定SL序列反式剪切所形成的基因编码框的方法,包括:获得基因组所有转录本和已知编码框序列;获取基因组比对文件;基于转录组测序数据,根据比对文件筛选局部比对序列,提取未成功比对上的部分序列;对未成功比对上的序列与指定的SL序列进行比较,若所提取的序列为指定SL序列的末端至少8个碱基序列,确定该序列为SL剪切位点产生的序列;根据比对文件中记录的位置信息推算SL序列的剪切位点,将剪切位点转换成转录组坐标;根据转录组坐标和转录本得到完整的mRNA序列;根据完整的mRNA序列,利用核糖体印迹测序数据,获得完整的mRNA对应的编码框。本发明解决了现有技术中SL序列的添加引入新的翻译起始位点,使原始基因组注释信息失效的问题。
  • 一种宏基因组磷元素循环注释绘图方法-202211498205.8
  • 何灵江;雷鸣;王梦琪 - 苏州元华生物科技有限公司
  • 2022-11-29 - 2023-07-28 - G16B50/10
  • 本发明涉及宏基因组技术领域。一种宏基因组磷元素循环注释绘图方法,本发明为解决宏基因组缺乏专门用于磷元素循环功能的数据库,且输出图谱及确定代谢途径复杂、数据量大等问题,本发明利用软件对以宏基因组测序方式获得的高质量微生物基因组进行磷代谢基因注释,通过绘制循环模式图,确定磷代谢过程所涉及的功能基因及其丰度,对微生物群落磷元素循环能力进行分析及比较,并通过对识别到的相关功能基因所属物种进行分类学注释,识别样本中参与磷循环的主要功能微生物种属,实现对宏基因组数据进行深入挖掘,通过多元化的方式分析结果的同时,还可以绘制清晰简洁的磷元素循环途径示意图,能快速准确的定位目标基因。
  • 一种构建抗生素抗性基因数据库的方法-201810195831.7
  • 邓晔;魏子艳 - 中国科学院生态环境研究中心;中国科学院大学
  • 2018-03-09 - 2023-07-21 - G16B50/10
  • 本发明公开了生物技术领域的一种构建抗生素抗性基因数据库的生物信息学方法,该方法包括在基因数据库(GenBank)搜索抗性基因的蛋白序列;选择高度精确的序列作为初始序列;采用ClustalW方法比对;构建隐马尔可夫模型并搜索GenBank蛋白数据库,得到全部包含蛋白保守位点的序列;根据序列的E值和GenBank数据库中序列的注释信息,去除高度同源和不符合要求的序列;删除重复序列后添加物种注释信息;整合所有蛋白序列,完成数据库的构建。该方法能够综合衡量序列的注释信息和比对相似性,提高序列收集的速度和准确性。利用本发明提供的方法,可以完成抗生素抗性基因数据库的构建,为研究抗性基因的引物设计、数据分析和序列注释提供基础数据。
  • 一种海洋样品中海洋微生物的功能信息解析方法-202111483431.4
  • 张丽华;王松朵;刘健慧;杨开广;梁振;张玉奎 - 中国科学院大连化学物理研究所
  • 2021-12-07 - 2023-06-23 - G16B50/10
  • 本发明涉及一种海洋样品中海洋微生物的功能信息解析方法,基于液质联用获得质谱RAW文件,利用宏基因组测序获得的肽段序列、自定义配置获得的数据库或公共已发表的数据库等多来源数据库结合,作为宏蛋白质组数据搜索数据库。按照物种分类等级将数据库拆分,通过迭代搜索等方法削减分数据库,然后将分数据库合并,利用蛋白质组搜索分析软件进行宏蛋白质组的定性和定量分析,利用功能注释软件基于公共数据库进行功能注释。蛋白质组定量分析软件筛选不同环境差异蛋白,深入挖掘不同环境微生物的群落组成及代谢活动差异。
  • 一种毒力因子数据库构建方法、装置、设备及介质-202310105444.0
  • 张智;周晴;霍彩琴 - 博奥生物集团有限公司
  • 2023-02-13 - 2023-04-25 - G16B50/10
  • 一种毒力因子数据库构建方法、装置、设备及介质,涉及生信分析技术领域。该方法包括:获取初始序列;对初始序列添加物种注释信息;确定初始序列的基因名称;对初始序列添加毒力基因类型注释信息;基于初始序列、物种注释信息、基因名称、毒力基因类型注释信息构建毒力因子数据库。由此,可以构建一个序列全面、信息准确完整、注释程序和术语标准规范化的微生物毒力基因数据库。进而,该毒力因子数据库还可以为临床致病菌毒力检测和毒力基因研究提供基础数据。
  • 一种基于图神经网络和特征融合的scRNA-seq细胞类型注释方法-202211605957.X
  • 王树林;李铮 - 湖南大学
  • 2022-12-12 - 2023-03-31 - G16B50/10
  • 本发明涉及生物信息学中的数据挖掘,特别是涉及对scRNA‑seq数据的挖掘。具体涉及一种基于图神经网络和特征融合的scRNA‑seq细胞类型注释方法。其特点是融合基因互作网络的局部特征和scRNA‑seq数据的全局特征进行细胞类型注释,通过GCN提取基因与基因间的局部特征,基于ZINB自动编码器进行基因表达全局特征提取,最后融合两部分特征输入分类器,进而对细胞类型注释。相比于现有的细胞类型注释模型,本发明提出的模型有效的利用了基因互作网络的先验知识,在准确率上有明显提升。
  • 基因组注释方法、装置、可视化平台和存储介质-202110209957.7
  • 董玥;贺增泉;徐则洋;李悦;郑大鹏 - 深圳华大基因科技服务有限公司
  • 2021-02-25 - 2023-03-28 - G16B50/10
  • 本申请提供了一种基因组注释方法、装置、可视化平台和存储介质,包括获取待注释的测序数据,将测序数据根据基因染色体字段进行拆分,得到多个子测序数据;然后将每一个子测序数据映射到对应的子单元基因数据库中进行查找分析,从而得到注释结果,其中子单元基因数据库是对已知的基因数据库根据基因染色体字段进行拆分得到的;该基因组注释方法将百亿级数据的基因数据库拆分成数据量较少的子单元基因数据库,然后将待注释的测序数据拆分成与子单元基因数据库大小其类型相同的子测序数据,在进行注释时只需要将子测序数据与其对应的子单元基因数据库进行比较即可,从而大大减少了缩小了查询范围,节约了计算的时间和计算量。
  • 一种基于划窗映射的基因组测序数据快速注释方法和系统-202211165110.4
  • 方超;郎秋蕾;陈志锋 - 杭州联川生物技术股份有限公司
  • 2022-09-23 - 2023-01-20 - G16B50/10
  • 本发明公开了一种基于划窗映射的基因组测序数据快速注释方法和系统,属于生物信息技术领域。本发明首先将所有功能组件的起始位点和终止位点及位于功能组件中的划窗起点和终点构建映射值,并利用该映射值建立索引文件,针对待注释位点,同样获得映射值,进一步在索引文件中搜索映射值,若落在某一功能组件的对应的起点划窗映射值和终点划窗映射值中间,进一步判断所有待注释位点是否落在该功能组件的起始位点和终止位点之间,从而进行注释。利用本发明,可以大大提高搜索注释的效率,降低注释的时间成本和计算成本。
  • 细胞数据注释方法、装置、设备及介质-202210442634.7
  • 吴子涵;姚建华 - 腾讯科技(深圳)有限公司
  • 2022-04-25 - 2022-09-27 - G16B50/10
  • 本申请公开了一种细胞数据注释方法、装置、设备及存储介质,该方法包括:获取待预测转录组的细胞数据;细胞数据包括待预测转录组中多个测序点的基因表达信息以及多个测序点的空间信息;确定与待预测转录组对应的已注释细胞对象,根据细胞对象以及基因表达信息确定待预测转录组的初始细胞注释结果;将细胞数据输入第一预测模型,根据第一预测模型的输出与初始细胞注释结果之间的损失对初始细胞注释结果进行修正,获得待预测转录组的细胞注释结果。该技术方案能够基于特征较为全面的细胞数据获得待预测转录组的细胞注释结果,从而提高了空间转录组的细胞注释结果的准确性。
  • 一种用于筛选参与生物学过程调控新基因的方法-201811428144.1
  • 赵磊;何欣叶;尚钰轩;姚婷婷;宓东;孙野青 - 大连海事大学
  • 2018-11-27 - 2022-09-23 - G16B50/10
  • 本发明公开了一种用于筛选参与生物学过程调控新基因的方法,通过使用生物信息学方法在基因本体论搜索工具,筛选特定生物学过程的语义关系;在不同物种的基因组注释数据库中,筛选被注释到上述语义的不同物种中的基因集合信息;对特定物种的基因集合信息进行同源性分析,筛选其在待研究物种中的直系同源基因;将上述基因与待研究物种中参与该生物学过程的参考基因进行比较分析,筛选特定物种中参与生物学过程调控新基因。本发明基于特定生物学过程在不同的物种之间具有高度保守性的特征,建立了一种用于筛选参与生物学过程调控新基因的方法,为进一步重构系统的基因调控网络提供支撑作用,这对于疾病早期诊断、个性化治疗、药物研发具有重要意义。
  • 一种基于深度迁移学习的循环肿瘤细胞的快速注释方法-202210582319.4
  • 杨朝勇;郭晓旭;林芳禾 - 厦门大学
  • 2022-05-26 - 2022-08-30 - G16B50/10
  • 本发明提供了一种基于深度迁移学习的循环肿瘤细胞的快速注释方法,将源域肿瘤细胞集的表达矩阵和目标域肿瘤细胞集的表达矩阵输入神经网络模型的特征提取器进行特征提取;将源域肿瘤细胞集特征和目标域肿瘤细胞集特征进行无监督聚类,采用循环一致匹配关联源域肿瘤细胞集和目标域肿瘤细胞集的共识分类,并通过计算领域共识分数,得到目标肿瘤细胞集分类数,为目标域肿瘤细胞集分配伪标签;输入神经网络模型的分类器,采用目标函数来更新神经网络模型的参数;循环执行至停止条件,输出目标域肿瘤细胞集的原型标签以及训练完成的神经网络模型,本发明提供的方法能够精确地给目标样本分配准确的标签,并为源域和目标域构建一个共同的表示空间。
  • 基因本体项名称生成方法、装置及存储介质-202011135040.9
  • 魏忠钰;张言健;陈琴 - 复旦大学
  • 2020-10-22 - 2022-08-19 - G16B50/10
  • 本发明的目的是提供一种基因本体项名称生成方法方法、装置及存储介质,所述基因本体项名称生成方法,所述方法包括:获取基因文本信息,所述基因文本信息至少包括目标基因本体项关联的至少一组基因信息,每组所述基因信息至少包括基因简称、基因别名、基因描述;至少根据所述基因信息中的单词、所述基因别名和描述、所述目标基因本体项的关联特性,确定所述目标基因本体项名称,避免人为命名造成的低效和不一致问题。
  • 一种用于内源性逆转录病毒的鉴定注释方法-202210019782.8
  • 葛行义;周秩建;叶生宝;邱烨 - 湖南大学
  • 2022-01-10 - 2022-08-16 - G16B50/10
  • 本发明提供一种用于内源性逆转录病毒的鉴定注释方法,包括:选取病毒蛋白作为探针,识别与探针相似的命中片段,输出命中区域,向命中区域的两侧各延伸侧翼序列,得到内源性逆转录病毒候选序列;使用LTR harvest对内源性逆转录病毒候选序列鉴定成对的LTR序列,进而提取出潜在完整内源性逆转录病毒序列和不含有成对LTR序列的内源性逆转录病毒获选序列;基于逆转录病毒的典型蛋白结构域序列使用隐式马尔科夫模型鉴定病毒蛋白结构域,去除假阳性结果;对内源性逆转录病毒进行注释和蛋白结构域序列提取。本发明的方法可以实现快速、高效地对宿主基因组进行内源性逆转录病毒及元件的挖掘、鉴定和注释,极大减少假阳性率。
  • 蛋白质超图的构建方法、构建装置及设备-202210289120.2
  • 张吉应;李扶阳;卞亚涛;徐挺洋;荣钰 - 腾讯科技(深圳)有限公司
  • 2022-03-22 - 2022-07-08 - G16B50/10
  • 本申请公开了一种蛋白质超图的构建方法、一种蛋白质超图的构建装置、介质、设备及程序产品。可应用于蛋白质表示学习领域。该方法包括:根据蛋白质包含的所有氨基酸之间的空间关系构建多条结构超边,以得到蛋白质的第一超边集,结构超边包含多个氨基酸;获取每个氨基酸的氨基酸特征,并根据氨基酸特征构建每个氨基酸的顶点特征向量,以得到蛋白质的顶点特征集;根据第一超边集和顶点特征集确定蛋白质超图。本申请的方法可使得生成的蛋白质超图可以较好地表示蛋白质中的高阶信息。
  • 细胞功能注释方法、装置、设备及介质-202210094184.7
  • 沈荣波;姚建华 - 腾讯科技(深圳)有限公司
  • 2022-01-26 - 2022-05-13 - G16B50/10
  • 本申请公开了一种细胞功能注释方法、装置、设备及介质,涉及人工智能领域。方法包括:获取组织样本的测序数据,所述测序数据中包含各个测序点的基因表达数据以及空间位置数据,所述测序点对应至少一个细胞;基于所述测序数据生成所述组织样本的基因测序矩阵,所述基因测序矩阵用于表征所述组织样本中不同空间位置处的基因分布情况;基于所述基因测序矩阵,通过深度学习方式进行细胞功能注释,得到细胞功能注释结果。采用本申请实施例提供的方案能够提高细胞功能注释的准确性。
  • 一种基于异质PPI网络的蛋白质复合物识别方法-202111341485.7
  • 张益嘉;周佩轩;王晓旭 - 大连海事大学
  • 2021-11-12 - 2022-01-14 - G16B50/10
  • 本发明提供了一种基于异质PPI网络的蛋白质复合物识别方法,涉及生物信息学的技术领域。本发明使用的异质信息网络表示识别方法可以融入更多的语义信息,从而提升对蛋白质节点特征的表达效果。首先,结合基因本体属性信息和PPI数据构建异构PPI网络。其次,基于构建的网络,采用异构表示学习方法获得蛋白质节点的向量表示,加入了双重注意力机制,可以更好地学习不同种类的每个节点的重要性。最后,本发明提出了一种基于异质网络的复合物识别方法来识别蛋白质复合物。本发明解决了现有的方法只构成了生物信息和蛋白质节点的同质网络,大多忽略了不同类型的节点具有不同的重要性这些问题。
  • 一种基于二代测序宏基因组数据分析装置及方法-202111091095.9
  • 郑明权;侯晓帆;刘裕 - 艾德范思(北京)医学检验实验室有限公司
  • 2021-09-17 - 2021-12-14 - G16B50/10
  • 本发明公开了一种基于二代测序宏基因组数据分析装置及方法。本发明所保护的宏基因组数据分析装置包括如下模块:数据质控模块、物种注释模块、基因组装模块、基因注释模块和功能分析模块。本发明基于宏基因组软件镜像开发的宏基因组数据分析装置,方便非生物信息编程背景用户进行标准化数据分析;支持实现灵活统一更换参数、更新软件、结果比较和多次运行,速度快、精准度高,可解决目前不同分析沟通时间长,分析速度慢,数据利用率低的问题。
  • 一种基于辐射响应生物学通路筛选辐射生物标志物及预测辐射剂量的方法-201910631911.7
  • 赵磊;汪燕;李安琪;陈鑫鹏;宓东;孙野青 - 大连海事大学
  • 2019-07-12 - 2021-03-16 - G16B50/10
  • 本发明公开了一种基于辐射响应生物学通路筛选辐射生物标志物及预测辐射剂量的方法,属于生物信息技术领域。给定辐射响应生物学通路并检索基因本体论语义,获取在特定物种中的注释基因集合,联合辐射暴露同一物种后的表达谱数据,提取表达谱数据;经过单因素方差分析和蛋白互作网络分析,获取差异表达特征及矩阵;利用生物统计学方法或机器学习算法,建立多元回归模型,通过对模型预测性能的比较分析,确定显著的表达特征集合和最优的统计模型类型,即为基于辐射响应生物学通路筛选到的辐射生物标志物及预测辐射剂量的方法。本发明的方法具有很好的预测效果,可为应急条件下核辐射生物剂量监测、核辐射损伤诊断、以及风险预警提供新的技术方法。
  • 基因数据查询方法及装置、非易失性存储介质-202011407630.2
  • 曹银川;李雷;成岗;李瑞强;吴俊 - 北京诺禾致源科技股份有限公司
  • 2020-12-04 - 2021-03-12 - G16B50/10
  • 本发明公开了一种基因数据查询方法及装置、非易失性存储介质。其中,该方法包括:接收用户界面上输入的查询条件;基于查询条件获取与查询对象基因上的目标区域对应的分区标识;获取目标区域中每一个位点的等位基因数之和,以及样本基因中目标区域中每一个位点参与计算的样本数目;基于等位基因数之和,以及样本数目,计算得到目标区域中每一个位点的突变频率;基于突变频率以及每一个位点在大数据平台中进行查询得到每一个位点的注释信息;在用户界面上展示任意一个位点,以及对应的突变频率和注释信息。本发明解决了现有技术中无法有效对多个跨产品的海量变异检测结果进行存储,导致无法根据用户设置的复杂查询条件进行查询的技术问题。
  • 基于KEGG数据库的注释方法、装置、设备和介质-202011210906.8
  • 黄龙;韩继臣;李丽翠 - 上海美吉生物医药科技有限公司
  • 2020-11-03 - 2021-02-26 - G16B50/10
  • 本申请提供的一种基于KEGG数据库的注释方法、装置、设备和介质,通过按一定频率从KEGG官方数据库下载或更新数据文件,并针对不同物种、及层级构建子数据库;分别提取不同物种的关键信息并进行数据整理以得到对应各子数据库的统一格式的信息文件;利用核酸序列同源性比对寻找同源ID,并根据所述信息文件进行数据注释;其中,针对不同物种对应的不同层级分别进行数据注释。本申请能确保数据文件下载完整和更新及时,数据提取准确和全面,比对结果准确和读取方便,以及确保项目注释效率高,耗资少。
  • 菌株基因组测序信息查询方法、装置、电子设备及介质-202010968611.0
  • 史文聿;范国梅;孙清岚;吴林寰;马俊才 - 中国科学院微生物研究所
  • 2020-09-15 - 2020-12-04 - G16B50/10
  • 本公开提供了菌株基因组测序信息查询方法、装置、电子设备及介质。该方法的一具体实施方式包括:响应于接收到管理员终端发送的文件存储请求,将文件存储请求中的注册用户标识、项目标识、菌株原始测序文件以及菌株基因组注释文件对应存储,响应于接收到用户终端发送的文件查询请求,确定文件查询请求中的注册用户标识和测序项目标识是否满足预设对应关系,响应于确定是,查询与测序项目标识对应的菌株原始测序文件以及菌株基因组注释文件并发送至用户终端,以供用户终端呈现或存储所收到的菌株原始测序文件以及菌株基因组注释文件。该实施方式实现了管理员终端与用户终端之间菌株原始测序文件以及菌株基因组注释文件的安全传输。
  • 一种从PubMed文献筛选基因关键词的方法-201910571336.6
  • 汪佳宏;章建平;黄仲曦;潘星华 - 南方医科大学;广州序科码生物技术有限责任公司
  • 2019-06-28 - 2020-06-16 - G16B50/10
  • 一种从PubMed文献筛选基因关键词的方法。本发明提供了一种从文献数据库筛选基因关键词的方法,包括以下步骤:从文献数据库的摘要中识别基因相关摘要或/和基因相关句子,建立基因相关文献的全文索引,从术语库中筛选关键词,通过基因‑关键词关联评分计算公式获得基因和关键词的关联概率评分,筛选出与基因密切相关的关键词。本发明构建的方法一方面扩宽了事先定义的术语词汇库,除了GO术语外,整合其他权威数据库的术语;另一方面引入新的关键词筛选方法,对基因与术语存在关联的概率进行评分,综合基因和关键词共发生于摘要和句子的次数,筛选更牢固的基因‑关键词关联。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top