[发明专利]基于无监督聚类的代码分块方法、存储介质和装置在审
申请号: | 202310892391.1 | 申请日: | 2023-07-20 |
公开(公告)号: | CN116933106A | 公开(公告)日: | 2023-10-24 |
发明(设计)人: | 杨永全;管佩琪;魏志强 | 申请(专利权)人: | 中国海洋大学 |
主分类号: | G06F18/23 | 分类号: | G06F18/23;G06F18/24;G06N3/04;G06N3/088 |
代理公司: | 长沙准星专利代理事务所(普通合伙) 43241 | 代理人: | 袁崇建 |
地址: | 266101 山*** | 国省代码: | 山东;37 |
权利要求书: | 暂无信息 | 说明书: | 暂无信息 |
摘要: | 本发明涉及一种基于无监督聚类的代码分块方法、存储介质和装置,属于代码分块领域,所述方法首先将源代码抽象为抽象语法树,再将抽象语法树平铺得到的文本,使用文本训练词向量模型,得到抽象语法树中每个节点的词向量,接下来以词向量作为输入进行DBSCAN聚类,最后将DBSCAN聚类获得的聚类中心作为SOM算法竞争层神经元、聚类中心个数作为聚类个数即分块个数,由此实现代码分块。本发明还提供运行所述方法的装置和计算机可读存储介质,本发明方法能够实现小样本无监督聚类进而实现代码分块任务,其分块结果的稳定性和精确度也明显高于传统代码分块方法。 | ||
搜索关键词: | 基于 监督 代码 分块 方法 存储 介质 装置 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国海洋大学,未经中国海洋大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202310892391.1/,转载请声明来源钻瓜专利网。