本申请提供一种基于状态空间域电池能量均衡的Q学习再生制动控制策略,所述策略包括以下步骤:S1:基于电池能量时域‑空间域转换,确定再生制动参考平均回收能量;S2:构建修正函数,修正所述参考平均回收能量;S3:根据修正后的参考平均回收能量和Q学习算法,确定电机再生转矩最优分配策略,即电机再生转矩分配MAP图;S4:采集在线工况数据,确定所述在线工况数据确定平均车速V、电池荷电状态SOC和需求功率P
1.一种基于状态空间域电池能量均衡的Q学习再生制动控制策略,其特征在于:所述策略包括以下步骤:S1:基于电池能量时域-空间域转换,确定再生制动参考平均回收能量;S2:构建修正函数,修正所述参考平均回收能量;S3:根据修正后的参考平均回收能量和Q学习算法,确定电机再生转矩最优分配策略,即电机再生转矩分配MAP图;S4:采集在线工况数据,确定所述在线工况数据确定平均车速V、电池荷电状态SOC和需求功率Preq,根据所述需求功率Preq和电池荷电状态SOC在步骤S3的MAP图中确定与所述在线工况数据的对应的电机再生转矩分配值,即获得在线工况电机再生转矩序列;所述再生制动参考平均回收能量采用如下方法确定:S11:选择离线工况的平均车速为状态,将平均车速离散得到状态集S:其中,S表示状态集合,表示离散后的第一个状态,表示离散后的第k个状态,表示离散后的第n个状态;S12:将电池时域能量转换到空间域能量,从空间维度计算第k个状态的电池能量变化值△ebk:△ebk=∫traction△ebk-outdτ+∫braking△ebk-indτ (2)其中,△ebk表示第k个状态电池能量变化值,△ebk-out表示第k个状态驱动过程电池变化的能量,△ebk-in表示第k个状态制动过程电池变化的能量,τ表示第k个状态在时域上发生电池能量变化的时间;S13:由第k个状态的电池能量变化值△ebk,计算第k个状态的制动过程参考平均回收能量其中,表示第k个状态再生制动参考平均回收能量的等效油耗,λ表示等效因子,表示第k个状态再生制动参考平均回收能量;所述等效因子λ采用如下方法确定:其中,表示电机的平均效率,表示发动机的平均效率,表示电池平均放电效率,表示电池平均充电效率;所述第k个状态再生制动参考平均回收能量采用如下方法确定:其中,表示第k个状态再生制动参考平均回收能量,△ebk-tra表示第k个状态驱动过程电池能量变化值,Tbk,bra表示第k个状态发生制动的时间;所述第k个状态驱动部分电池能量变化值△ebk-tra采用如下方法确定;△ebk,tra=∫traction△ebk-outdt (6)其中,△ebk-tra表示第k个状态驱动过程电池能量变化值,△ebk-out表示第k个状态电池驱动过程变化的能量,t表示时间。
本文链接:http://www.vipzhuanli.com/tech/sell/s_2311358.html,转载请声明来源钻瓜专利网。