[发明专利]软件标识库的建立方法在审
申请号: | 201711400264.6 | 申请日: | 2017-12-22 |
公开(公告)号: | CN109960931A | 公开(公告)日: | 2019-07-02 |
发明(设计)人: | 汪梅花 | 申请(专利权)人: | 镇江市志捷软件开发有限公司 |
主分类号: | G06F21/56 | 分类号: | G06F21/56 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 212000 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 应用软件 特征向量 软件标识 应用程序编程接口 贝叶斯分类算法 标识信息 当前软件 分类检测 类别信息 标识库 调用 申请 | ||
本申请公开了一种软件标识库的建立方法,包括:对于当前待提取标识的应用软件,根据本软件对各应用程序编程接口API的调用次数,确定该应用软件的API特征向量;根据所述应用软件的所述API特征向量以及当前软件标识库中的各类应用软件的API特征向量和类别信息,按照朴素贝叶斯分类算法,确定所述应用软件所属类别;将所述应用软件的所述API特征向量和所述类别,作为所述应用软件的标识信息添加到所述软件标识库中。采用本发明,可以对软件进行客观性标识且效率高、能满足大量应用软件的分类检测需求。
技术领域
本发明涉及计算机软件分类技术,特别是涉及一种软件标识库的建立方法。
背景技术
随着移动互联网和智能终端的飞速发展,移动应用数量呈指数性增长。在智能终端应用软件领域中,作为连接应用软件与用户的渠道-国内第三方应用市场已大量涌现,并呈现井喷式增长的局面。国内第三方应用商店应用软件呈现繁多、混杂、虚假信息、同质化甚至是剽窃的局面,移动应用的标识,分类,安全检测和反剽窃已成为迫切的需求。庞大的移动应用软件量面临着标识分类管理的问题。
目前,对应用软件进行标识的方法可分为:基于描述信息的标识方法,基于消息摘要第五版算法(Message-DigestAlgorithm5,MD5)的标识方法,基于AST的标识方法等。
其中,基于描述信息的标识方法,是根据应用开发者提供的应用名称、版本信息以及应用描述信息,结合相应的人工审核机制,如运行应用、查看应用信息等手段,得到确认及修正后的描述信息,作为应用的标识信息。此方法是目前使用最为广泛的软件标识方法,几乎各大应用商城应用软件都是以此方法对应用进行类别及其他方面的标识。
基于MD5摘要的标识方法,是对文件进行摘要运算,取摘要值作为文件的标识信息,这是从文件唯一性角度标识文件的常用方法,目前最常用的摘要算法就是MD5算法。对应用软件做MD5值运算,取其MD5值作为应用软件标识信息的方法,在很多应用商店中使用。其作为应用软件的唯一标识,在一定程度上解决了应用商店应用去重复、查找、存储等方面的问题。
发明内容
有鉴于此,本发明的主要目的在于提供一种软件标识库的建立方法,该方法可以对软件进行客观性标识且效率高、能满足大量应用软件的分类检测需求。
为了达到上述目的,本发明提出的技术方案为:
一种软件标识库的建立方法,包括:
对于当前待提取标识的应用软件,根据本软件对各应用程序编程接口API的调用次数,确定该应用软件的API特征向量;
根据所述应用软件的所述API特征向量以及当前软件标识库中的各类应用软件的API特征向量和类别信息,按照朴素贝叶斯分类算法,确定所述应用软件所属类别;
将所述应用软件的所述API特征向量和所述类别,作为所述应用软件的标识信息添加到所述软件标识库中。
综上所述,本发明提出的软件标识库的建立方法,基于能客户反应软件语义信息的API调用信息,按照朴素贝叶斯分类算法,对软件进行标识、分类、管理。如此,可以实现对软件的客观性标识,并且效率高,从而能满足大量应用软件的分类检测需求。
附图说明
图1为本发明实施例一的流程示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图及具体实施例对本发明作进一步地详细描述。
本发明的核心思想是:基于软件对API的调用信息,生成相应的API特征向量,根据该API特征向量,按照朴素贝叶斯分类算法,确定软件所属类别,如此,基于API信息对应用软件进行标识和分类,一方面可以确保标识的客观性,另一方面,API特征向量的构建和分析易于实现,效率高,因此,能满足大量应用软件的分类检测需求。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于镇江市志捷软件开发有限公司,未经镇江市志捷软件开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711400264.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:终端可信软件的度量和认证
- 下一篇:文件检测方法、装置和终端设备