[发明专利]一种特征选择方法及装置在审

专利信息
申请号: 202310068572.2 申请日: 2023-02-06
公开(公告)号: CN116089808A 公开(公告)日: 2023-05-09
发明(设计)人: 梁铮;杜渂;石健文;何之栋;侯俊丞;王聚全;杨博;刘琦;鲁神恩;夏禹鹏;杨中文;郑佳;穆青;周倡弘;程铭翰;王衍海;符承鹏;赵福旺;陈浩 申请(专利权)人: 迪爱斯信息技术股份有限公司
主分类号: G06F18/2111 分类号: G06F18/2111;G06F18/214;G06N5/01;G06N3/006;G06N3/126
代理公司: 上海硕力知识产权代理事务所(普通合伙) 31251 代理人: 杨华廷
地址: 200233 上海*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种特征选择方法及装置,方法包括:获取多个输入数据,统计分析各个输入数据中包含的离散型文本特征以及每个离散型文本特征对应的多个数值型特征;将每个离散型文本特征对应的数值型特征划分成若干个数值子区间;根据每个数值型特征所在的数值子区间对应的标签数值,得到每个离散型文本特征对应的文本标签数值和数值标签数值;利用文本标签数值和数值标签数值进行特征选择,并根据特征选择的结果对预测模型进行训练。本发明同时考虑了其中一个是数值型、另一个是离散型的两个相关特征,对这两个相关特征分别重新分箱,根据分箱结果进行特征选择,得到一个更优的特征。
搜索关键词: 一种 特征 选择 方法 装置
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于迪爱斯信息技术股份有限公司,未经迪爱斯信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/202310068572.2/,转载请声明来源钻瓜专利网。

同类专利
  • 基于动态特征聚类和粒子群优化的在线流特征选择方法-202310765773.8
  • 宋贤芳;张勇;马昊;彭超;孙晓燕;张振 - 中国矿业大学
  • 2023-06-27 - 2023-10-17 - G06F18/2111
  • 本发明公开了基于动态特征聚类和粒子群优化的在线流特征选择方法,属于数据处理领域,包括以下步骤:S1、输入一个新的特征组GT;S2、在线相关性分析;S3、增量式特征聚类:将经步骤S2处理后的特征划分到已有特征簇中或创建新簇;S4、判断是否满足启动条件,若满足则执行步骤S5,否则从每个特征簇中选取最重要的特征并作为输出特征子集ST;S5、历史信息驱动的整型粒子群算法:在聚类的基础上,采用历史信息驱动的粒子群算法搜索最优特征子集,并输出特征子集ST;S6、判断有无新的特征组到来,若有则返回步骤S1,否则结束。本发明采用上述基于动态特征聚类和粒子群优化的在线流特征选择方法,可在多数数据集中获得最佳的分类精度。
  • 基于特征筛选与权值分配的江河水质预测方法及系统-202310683059.4
  • 谢建立;许宏辉;杨斌;周明;项新建;马巧凤;魏道军 - 凯铭科技(杭州)有限公司
  • 2023-06-09 - 2023-09-08 - G06F18/2111
  • 本发明属于水体检测技术领域,具体涉及基于特征筛选与权值分配的江河水质预测方法及系统。方法包括:S1,获取水质因子数据;S2,对水质因子数据进行预处理;S3,对预处理后的水质因子数据进行筛选,筛选出对预测水质指标权重排名靠前的特征,进行数据降维重构;S4,将重构后的数据输入XGBOOST模型与GRU模型中进行预测,获得预测序列;S5,将得到的预测序列,进行重构,得到重构后的预测结果;S6,利用重构后的预测结果与实际数据构建误差序列,再将所述误差序列作为误差修正模型ARIMA的输入,完成预测误差修正。本发明具有能够实现数据降维的同时极大减少噪音的干扰,以及实现对水质精准预测的特点。
  • 基于精英花授粉算法和ReliefF的有效混合特征选择方法-201910266518.2
  • 阎朝坤;罗慧敏;张戈;马敬敬;王建林 - 河南大学
  • 2019-04-03 - 2023-08-25 - G06F18/2111
  • 本发明提供一种基于精英花授粉算法和ReliefF的有效混合特征选择方法。该方法包括:步骤1、采用基于ReliefF特征排序和随机化的双初始种群策略对由M个个体组成的种群进行初始化;步骤2、采用二元精英花授粉算法更新种群,并计算种群中每个个体的适应度值,得到种群中的全局最优解;步骤3、采用禁忌搜索算法搜索全局最优解的邻域确定候选解,并根据候选解的适应度值更新禁忌表;步骤4、在禁忌表中选取适应度值最大的个体作为精英个体,将精英个体替换种群中适应度值最小的个体,形成新的种群;步骤5、以步骤2至步骤4作为一次迭代,重复进行步骤2至步骤4,直至当前迭代次数达到设定的迭代次数。本发明与其他特征选择方法相比可获得高分类精确度。
  • 基于mRMR-IAGA的国民体质监测指标混合式特征选择方法-202110968948.6
  • 李志明;李婷婷;阎晨光;欧阳飞帆 - 燕山大学
  • 2021-08-23 - 2023-08-11 - G06F18/2111
  • 本发明提供一种基于mRMR‑IAGA的混合式特征选择方法,其包括:S1、建立数据集并对数据进行预处理;S2、使用最大相关最小冗余算法(Max‑Relevance and Min‑Redundancy,mRMR)对数据进行过滤式特征选择,形成特征子集Ω;S3、对特征子集Ω中的特征进行二进制编码,完成种群初始化;S4、为提升自适应遗传算法(Adaptive Genetic Algorithm,AGA)的收敛速度和收敛精度、简化特征子集,在交叉算子与变异算子中加入约束项,在适应度函数中加入特征缩减因子,形成改进的自适应遗传算法(Improved Adaptive Genetic Algorithm,IAGA),适应度函数中的预测模型选用XGBoost﹔在特征子集Ω的基础上,使用基于IAGA的封装式特征选择算法进行特征选择;S5、输出最优特征子集Ω’。本发明以最优特征子集Ω’中的特征作为输入所构建的预测模型,有很好的预测准确率。
  • 无人机遥控图传信号的参数盲估计方法-202310416626.X
  • 王徐华;王徐明;张子宁;张琰;孙乐 - 西安雷擎电子科技有限公司
  • 2023-04-18 - 2023-07-25 - G06F18/2111
  • 本发明提供了一种无人机遥控图传信号的参数盲估计方法,通过计算接收信号的短时傅里叶变换得到时频矩阵;对时频矩阵进行去噪处理,基于驻留时时长的k‑means算法或基于时频方差的k‑means聚类算法对去噪之后的时频矩阵进行聚类以去除定频干扰,并重构得到重构时频矩阵;提取重构时频矩阵的时频脊线;对时频脊线作Haar小波变换,并取Haar小波变换后的模值;用逐差法求模值各峰之间的时间间隔以及模值各峰对应的时间;根据时间间隔以及模值各峰对应的时间,估计遥控信号的起跳时间;基于起跳时间,估计遥控信号的实际频率。相比于现有技术,本发明可以去除掉定频干扰,并实现对遥控信号的参数进行估计。
  • 基于代理辅助进化神经网络结构搜索的风电功率预测方法-202310397284.1
  • 金怀平;张克豪;金怀康;王彬;杨彪;钱斌 - 昆明理工大学
  • 2023-04-14 - 2023-07-18 - G06F18/2111
  • 本发明公开了一种基于代理辅助进化神经网络结构搜索的风电功率预测方法。本发明针对深度神经网络的结构和延迟变量选择困难、现有进化神经网络结构搜索计算效率低等问题,通过代理辅助模型去间接评价适应度,以提高搜索效率。具体步骤为:首先,使用深度神经网络去捕捉高维非线性时空特征,同时将延迟变量纳入进化神经网络结构搜索;其次,将深度神经网络结构与延迟变量进行联合编码;然后使用代理模型提升进化神经网络结构搜索的搜索效率,得到最优神经网络结构;最后,对最优神经网络结构进行重训练调优,得到其网络权重。本发明将代理模型引入到进化神经网络结构搜索中,与传统的进化神经网络搜索方法相比具有较高的预测性能和较低的时间消耗。
  • 基于肌电信号模式识别和粒子群优化的仿生机械手交互控制方法-201910542988.7
  • 介婧;刘凯瑞;郑慧;周乐;武晓莉;张淼;李津蓉 - 浙江科技学院
  • 2019-06-21 - 2023-04-25 - G06F18/2111
  • 本发明公开了一种基于肌电信号模式识别和粒子群优化的仿生机械手交互控制方法,首先建立基于表面肌电信号的模式识别系统进行预学习,通过多通道肌电仪获取表面肌电信号,经过巴特沃斯滤波以及梳状滤波器的软件滤波之后,进行多种特征的特征数据提取工作,并基于全通道离线特征数据进行模式识别,采用粒子群优化算法进行最优特征组合和最佳通道组合的优化搜索;然后基于最优特征组合与最优通道组合采集实时表面肌电信号,经滤波处理与特征提取后使用KNN算法进行实时手势识别,并利用识别出来的手势结果对各自由度的仿生机械手进行实时鲁棒控制。
  • 轴承声发射信号微弱故障特征增强诊断方法-202211472853.6
  • 冯炫;王聪;张昕宇;赵宇飞 - 陕西智引科技有限公司;陕西建材科技集团股份有限公司
  • 2022-11-21 - 2023-04-21 - G06F18/2111
  • 本发明属于声发射信号处理应用技术领域,尤其涉及一种轴承声发射信号微弱故障特征增强诊断方法。与现有技术相比,本发明的优点和积极效果在于,本发明解决了声发射信号由于数据量大对硬件要求高的问题。同时,由时域小波包分解矩阵推导出压缩域小波包分解的变换矩阵,用其对压缩信号进行小波包分解。提取不同频段信号的压缩域故障特征。另外,采用PSO算法对故障特征加权系数进行优化。该方法实现了微弱故障特征增强,同时也避免了主观、片面选择不同频段特征信息所引起的诊断结果的不确定。最后,通过实验验证表明所提方法在低速条件下对轴承的故障诊断具有较为满意的诊断性能。
  • 一种基于历史数据的癌症疾病基因特征选择方法-201910355711.3
  • 邱剑锋;郭能;张兴义;苏延森 - 安徽大学
  • 2019-04-29 - 2023-04-18 - G06F18/2111
  • 本发明公开了一种基于历史数据的癌症疾病基因特征选择方法,包括以下步骤:A:将癌症疾病基因数据分为训练集和测试集;B:计算训练集上所有特征都被选择后的总平均错误率;C:生成初始种群,构造适应度函数;D:将所有特征选择方案记录到特征树中,调整特征选择方案的分布,以适应度值最小的特征选择方案作为最优特征选择方案,将结果返回给遗传算子和导向搜索算子;E:引导特征种群的进化方向;F:判断终止条件,若未达到终止条件,重复步骤D~F,若达到终止条件,输出最优解。本发明的优点在于:能够有效降低数据维度,提高预测准确性,通过特征树,结合遗传算法为癌症等疾病的相关基因进行筛选,为诊断和治疗提供辅助。
  • 一种基于蛇群优化算法的大数据特征选择方法-202211585491.1
  • 康辉;包新雨;孙庚;李洪娟;王渤雄 - 吉林大学
  • 2022-12-09 - 2023-04-07 - G06F18/2111
  • 本发明公开了一种基于蛇群优化算法的大数据特征选择方法,包括:对蛇群优化算法的参数以及适应度计算函数初始化,并将蛇群分为雄性蛇群和雌性蛇群;分别对雄性蛇群、雌性蛇群的最优解和最优适应度值进行初始化;定义第一温度、第一食物质量、温度阈值以及食物质量阈值;分别基于第一食物质量与食物质量阈值的大小关系,第一温度与温度阈值的大小关系,迭代计算,更新雄蛇和雌蛇的最优解、最优适应度值;直到迭代结束,获取最终全局最优解;基于最终全局最优解训练分类器,基于分类器进行大数据特征选择。本申请有效地提高群体智能优化算法的全局搜索能力,跳出局部最优的能力,避免了过早收敛和陷入局部最优,进而获得比已有发明更优质的解。
  • 基于mRMR-免疫克隆的网络态势特征选择方法与装置-202211323496.7
  • 任威霖;刘俊涛;王元斌;张剑 - 中国船舶集团有限公司第七〇九研究所
  • 2022-10-27 - 2023-03-31 - G06F18/2111
  • 本发明公开了一种基于mRMR‑免疫克隆的网络态势特征选择方法,使用克隆免疫算法对传统mRMR算法进行优化,依靠其基因整体变异,并通过克隆手段放大高亲和基因优势的特性,发掘了多特征组合对于分类任务的积极作用,解决了现有特征选择技术忽视了特征之间的关联性对分类的影响的问题。本发明能更加全面的考虑特征之间的关联与分类之间的关系,对大规模复杂网络态势的适应性更好。本发明使用混沌序列对克隆免疫算法的变异算子进行改造,生成适用于改进免疫克隆算法的变异算子,促使低亲和度抗体产生更多良性突变,进一步提高了种群的整体活性和基因的突变范围,提高了算法的泛化能力。本发明还公开了相应的基于mRMR‑免疫克隆的网络态势特征选择装置。
  • 一种基于遗传模糊聚类的系统数据异常检测方法-202010402204.3
  • 田园;原野;马文;黄祖源;付谱平 - 云南电网有限责任公司信息中心
  • 2020-05-13 - 2023-03-31 - G06F18/2111
  • 本发明涉及一种基于遗传模糊聚类的系统数据异常检测方法,属于数据异常检测技术领域。本发明首先对系统平台采集到的数据集进行离散标准化处理,将离散标准化处理后的数据集随机化并划分成训练样本集和测试样本集。对测试样本集进行模糊聚类处理,对模糊处理后的得到的聚类中心进行遗传运算。然后得到一个最佳分类数目和对应的聚类结果集。然后对聚类结果集进行标类,获得正常数据集的各个聚类中心和异常数据集的各个聚类中心。再然后计算测试样本集中的每个样本与标类后的各个数据集聚类中心的距离,可以认为与测试样本集中的每个样本具有最小距离测度的子类即为其所属聚类,从而可以测试出测试样本集中的异常数据。
  • 策略管理方法、设备及计算机可读存储介质-202110969832.4
  • 林志远;林伟;刘向凤;芮华;黄河 - 中兴通讯股份有限公司
  • 2021-08-23 - 2023-02-28 - G06F18/2111
  • 本发明提供了一种策略管理方法、设备及计算机可读存储介质。策略管理方法包括:获取条件信息;从历史策略集合中选取与当前周期对应的候选策略集合;基于条件信息和候选策略集合得到最优策略;采集执行最优策略而得到的运行性能参数;根据运行性能参数更新候选策略集合。根据本发明实施例的方案,能够有效选取最优策略,并且还可以对当前周期的策略进行更新,便于后续最优策略选取。
  • 一种故障特征选择方法及应用-202211220468.2
  • 蒋世奇;严嘉嘉;王林;肖地波;张林帅;张雪原;姚玉琴;龚柯梦;曾子寒;田珂宇;蔡忠原 - 成都信息工程大学
  • 2022-10-08 - 2023-01-31 - G06F18/2111
  • 本发明涉及故障诊断技术领域,公开了一种故障特征选择方法及应用,基于非线性的二进制蝗虫优化算法的故障特征选择方法通过引入非线性递减参数c,在算法开始阶段以较快的速率下降,使故障特征种群中的蝗虫个体能够迅速向目标靠近,从而提高算法全局搜索的能力,提升算法的收敛速度;而在算法的后期,c的递减速度减缓,这使得种群中的蝗虫个体能对周围的空间进行仔细的搜索,从而提高算法局部开发的能力,避免算法陷入局部最优。因此,利用非线性递减参数c,可以更好的平衡算法在不同时期的全局探索和局部开发的能力。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top