[发明专利]一种基于混合特征KDE条件熵的特征选择方法有效

专利信息
申请号: 201710526050.7 申请日: 2017-06-30
公开(公告)号: CN107391433B 公开(公告)日: 2021-04-13
发明(设计)人: 代建华;徐思琪;高帅超 申请(专利权)人: 天津大学
主分类号: G06F17/10 分类号: G06F17/10
代理公司: 天津市北洋有限责任专利代理事务所 12201 代理人: 刘玥
地址: 300072*** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提供一种新的基于混合特征KDE条件熵的特征选择方法,该方法提出了混合特征KDE概率和混合特征KDE熵,在不将连续数据离散的情况下将离散特征和连续特征有效统一于KDE熵中,拓展了信息理论并提出了基于混合特征KDE条件熵的贪心特征选择方法。
搜索关键词: 一种 基于 混合 特征 kde 条件 选择 方法
【主权项】:
一种基于混合特征KDE条件熵的特征选择方法,其特征在于,包括如下步骤:步骤一,输入包括决策特征D的数据集U,其中,数据集U有n个样本,决策特征D={1,2,...,N},离散特征向量Α={A1,A2,...,Am},连续特征向量X={X1,X2,...,Xt},窗宽参数h,停止阈值T;步骤二,设已选择的特征集为B,未选择的特征集为E,初始值设为E=A∪X,每选择一个特征前后的条件熵之差步骤三,通过特征集E中的每一属性S和特征集B中的所有属性建立临时特征集B′,执行以下步骤;步骤四,对于B′中连续特征集X′的每一种取值x,和决策属性集D中的每一种取值d以及B′中离散特征集A′的每一种取值a,计算KDE概率和步骤五,通过步骤四中获得KDE概率计算基于混合特征KDE条件熵和以及基于混合特征KDE联合熵其中记为离散属性集A′的值域,为连续属性集X′的值域,为决策集D的值域;步骤六,选择条件熵最小的属性加入到特征集B中,获得已选属性B=B∪{S*},并从未选择的特征集中删除E=E‑{S*};步骤七,通过步骤六中B=B∪{S*}获得加入新属性前后的条件熵之差,即步骤八,判断步骤七中条件熵之差是否大于阈值T并且特征集B中的特征个数小于数据集总的特征数,即如果满足条件,返回步骤三;否则输出特征集B。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201710526050.7/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top