会员体验
专利管家(专利管理)
工作空间(专利管理)
风险监控(情报监控)
数据分析(专利分析)
侵权分析(诉讼无效)
联系我们
交流群
官方交流:
QQ群: 891211   
微信请扫码    >>>
现在联系顾问~
首页 / 专利分类库 / 输送;包装;贮存;搬运薄的或细丝状材料 / 一种基于人工智能的收卷方法和系统

一种基于人工智能的收卷方法和系统

申请号 CN202411118045.9 申请日 2024-08-15 公开(公告)号 CN118618978A 公开(公告)日 2024-09-10
申请人 湖南凯德隆晟科技有限公司; 发明人 陈奇志;
摘要 本 发明 公开一种基于 人工智能 的收卷方法及系统,包括:S1:收集 薄膜 密度 数据、薄膜厚度数据及卷径数据、薄膜张 力 数据,对薄膜 张力 数据进行预处理,得到预处理后的薄膜张力数据;S2:构建张力 预测模型 ,进行薄膜张力数据缺失值填补,生成卷径‑张力曲线;S3:计算PID系统每一次调整张力产生的超调幅度和 波动 时间,计算出超调惩罚项;S4:构建张力等级划分模型,根据最大卷径,输出张力等级数量和对应张力;S5:根据张力等级数量和对应张力,通过PID系统控制收卷过程中的薄膜张力。本发明考虑到PID系统进行张力调整带来的误差累积,解决了传统收卷方法未充分考虑薄膜特性、卷径与PID系统的能力,导致的收卷效果不佳的问题。
权利要求

1.一种基于人工智能的收卷方法,其特征在于,包括以下步骤:
S1:收集薄膜密度数据、薄膜厚度数据,以及薄膜收卷过程中薄膜卷的卷径数据、收卷过程中的薄膜张数据,并对薄膜张力数据进行预处理,得到预处理后的薄膜张力数据;
S2:将薄膜密度数据、薄膜厚度数据与卷径数据进行融合,同时构建张力预测模型,进行薄膜张力数据缺失值填补,生成卷径-张力曲线;
所述张力预测模型首先提出位置缺失编码、缺失距离编码,分别对缺失值的位置以及缺失值与真值的距离进行标识,再将位置缺失编码、缺失距离编码与薄膜张力数据进行融合,输入控循环单元,对薄膜张力数据进行预测并填补;
S3:计算PID系统每一次调整薄膜张力产生的超调幅度和波动时间,进而计算出超调惩罚项;
S4:构建张力等级划分模型,根据最大卷径,输出张力等级数量和对应张力;
所述张力等级划分模型的奖励函数采用定积分的方式计算卷径-张力曲线拟合度,张力等级划分模型的值函数采用Q-learning的方式进行计算,并采用ε-greedy策略,对张力等级划分模型进行更新;
S5:根据张力等级数量和对应张力,通过PID系统控制收卷过程中的薄膜张力。
2.根据权利要求1所述的基于人工智能的收卷方法,其特征在于,所述步骤S1中,所述卷径数据为离散时序数据,薄膜张力数据与卷径数据一一对应;
所述对薄膜张力数据进行预处理包括以下步骤:采用样条插值法,对不同卷径下的薄膜张力数据进行单次插值,得到插值后的薄膜张力数据,计算方式为:
其中,
3.根据权利要求2所述的基于人工智能的收卷方法,其特征在于,所述步骤S2包括:
S21:将薄膜密度数据、薄膜厚度数据与卷径数据进行融合,计算方式为:
其中,
S22:构建张力预测模型,预测薄膜张力数据的缺失值,并进行薄膜张力数据缺失值填补,计算方式为:
其中,
S23:根据预测结果,统计各个时刻的卷径数据、薄膜张力数据,生成卷径-张力曲线。
4.根据权利要求3所述的基于人工智能的收卷方法,其特征在于,所述步骤S3包括:
S31:记录PID系统每一次调整薄膜张力的过程中产生的超调幅度;
S32:当PID系统输出产生振荡时,记录振荡开始时间;
S33:当振荡幅度回到稳定范围内时,记录振荡停止时间,并与振荡开始时间作差,得到该次调整的波动时间;
S34:计算超调惩罚项,计算方式为:
其中,P为超调惩罚项,
5.根据权利要求4所述的基于人工智能的收卷方法,其特征在于,所述步骤S4包括:
S41:设计张力等级划分模型的状态空间为:卷径-张力曲线分段后的张力值序列;动作空间为:对当前张力等级进行合并、在当前张力等级添加新的分段点;所述张力值序列以0为序列中的第一个数值,以最大卷径为序列中的最后一个数值;
S42:设计张力等级划分模型的奖励函数,计算方式为:
其中,
S43:设计张力等级划分模型的值函数,计算方式为:
其中,
S44:采用ε-greedy策略,对张力等级划分模型进行更新,并输出张力等级数量和各张力等级的对应张力。
6.根据权利要求5所述的基于人工智能的收卷方法,其特征在于,所述步骤S5包括:
S51:初始化PID系统的比例、积分和微分参数;
S52:实时监测收卷过程中的薄膜张力和卷径;
S53:根据张力等级数量和各张力等级的对应张力,通过PID系统调整收卷过程中的薄膜张力。
7.一种基于人工智能的收卷系统,其特征在于,包括:
数据采集与预处理模:收集薄膜密度数据、薄膜厚度数据,以及薄膜收卷过程中薄膜卷的卷径数据、收卷过程中的薄膜张力数据,并对薄膜张力数据进行预处理,得到预处理后的薄膜张力数据;
张力预测模型构建模块:将薄膜密度数据、薄膜厚度数据与卷径数据进行融合,同时构建张力预测模型,进行薄膜张力数据缺失值填补,生成卷径-张力曲线;
超调惩罚项计算模块:计算PID系统每一次调整薄膜张力产生的超调幅度和波动时间,进而计算出超调惩罚项;
张力等级划分模型构建模块:构建张力等级划分模型,根据最大卷径,输出张力等级数量和对应张力;
PID控制模块:根据张力等级数量和对应张力,通过PID系统控制收卷过程中的薄膜张力;
以实现如权利要求1-6任意一项所述的基于人工智能的收卷方法。

说明书全文

一种基于人工智能的收卷方法和系统

技术领域

[0001] 本发明涉及电池隔膜制备领域,具体涉及一种基于人工智能的收卷方法和系统。

背景技术

[0002] 收卷机是一种用于将电池薄膜等卷状产品进行收卷的设备,其主要功能是通过卷取薄膜或片材来形成紧凑的卷筒结构,以便于后续的加工和应用。
[0003] 传统收卷方法通常没有充分考虑到薄膜特性和卷径等因素,导致了张设置不合理,进而导致薄膜在收卷过程中出现皱纹、暴筋、褶皱、滑膜等各种问题,影响电池隔膜的性能和品质。
[0004] 另外,一些方案虽然尝试实时调整张力,但使用的PID(比例-积分-微分)系统难以精确地控制张力输出。设定过于精细的目标张力可能导致PID系统实时输出的张力难以准确跟随目标张力的变化,导致超调和波动的情况,进而影响收卷的稳定性和品质。

发明内容

[0005] 有鉴于此,本发明旨在提供一种基于人工智能的收卷方法和系统,旨在解决传统收卷方法未充分考虑薄膜特性、卷径与PID系统的能力,导致的收卷效果不佳的问题。
[0006] 一种基于人工智能的收卷方法,包括以下步骤:S1:收集薄膜密度数据、薄膜厚度数据,以及薄膜收卷过程中薄膜卷的卷径数据、收卷过程中的薄膜张力数据,并对薄膜张力数据进行预处理,得到预处理后的薄膜张力数据;
S2:将薄膜密度数据、薄膜厚度数据与卷径数据进行融合,同时构建张力预测模型,进行薄膜张力数据缺失值填补,生成卷径-张力曲线;
所述张力预测模型首先提出位置缺失编码、缺失距离编码,分别对缺失值的位置以及缺失值与真值的距离进行标识,再将位置缺失编码、缺失距离编码与薄膜张力数据进行融合,输入控循环单元,对薄膜张力数据进行预测并填补;
S3:计算PID系统每一次调整薄膜张力产生的超调幅度和波动时间,进而计算出超调惩罚项;
S4:构建张力等级划分模型,根据最大卷径,输出张力等级数量和对应张力;
所述张力等级划分模型的奖励函数采用定积分的方式计算卷径-张力曲线拟合度,张力等级划分模型的值函数采用Q-learning的方式进行计算,并采用ε-greedy策略,对张力等级划分模型进行更新;
S5:根据张力等级数量和对应张力,通过PID系统控制收卷过程中的薄膜张力。
[0007] 进一步地,所述步骤S1中,所述卷径数据为离散时序数据,薄膜张力数据与卷径数据一一对应;薄膜数据中的密度和厚度是锂电池隔膜的基本属性,直接影响张力大小;
所述对薄膜张力数据进行预处理包括以下步骤:采用样条插值法,对不同卷径下的薄膜张力数据进行单次插值,得到插值后的薄膜张力数据,计算方式为:




其中,为三次样条函数输出的插值后的薄膜张力数据,为三次样条函数的输入,i为区间索引,为求解系数,为第i个区间左端点的卷径,为第i个区间左端点的对应的薄膜张力数据;为三次样条函数在第i个区间左端点的一阶导数,为三次样条函数在第i个区间左端点的二阶导数,为三次样条函数在第i+1个区间左端点的一阶导数,为三次样条函数在第i+1个区间左端点的二阶导数。
[0008] 薄膜张力数据通常是离散的,且数据点较少,无法充分反映出张力与卷径之间的细微变化;因此,采用样条插值法对离散的薄膜张力数据进行插值,能够得到更多的数据点,提高数据密度,有助于后续得到更加连续和平滑的张力-卷径曲线,也为后续的张力预测模型提供足够的数据点用于模型训练。
[0009] 进一步地,所述S2步骤包括:S21:将薄膜密度数据、薄膜厚度数据与卷径数据进行融合,计算方式为:


其中,为融合后的数据,为拼接操作,分别为薄膜密度数据与薄膜厚度数据,为融合后的特征,为全连接层操作;
传统方法往往将张力设定为固定值,或只考虑卷径变化对张力的影响;相比之下,步骤S21结合了薄膜密度与薄膜厚度,在特征扩展之后再进行融合,考虑了更多的参数,能够更全面地捕捉张力的变化规律,使得收卷机在调整张力时能够更加精确地控制张力的变化,避免在收卷过程中出现的皱纹、暴筋等问题,提高锂电池隔膜的收卷效果;尤其是在面对不同厚度或密度的薄膜时,这种设计更能够适应不同的工艺要求,保证收卷效果的稳定性和品质;
S22:构建张力预测模型,预测薄膜张力数据的缺失值,并进行薄膜张力数据缺失值填补,计算方式为:





其中,为张力预测模型的输入,为第i个区间索引左端点的缺失编码,为第i-1个区间索引左端点的缺失编码,为第i个区间索引左端点的缺失距离编码,为第i-1个区间索引左端点的缺失距离编码,为衰减编码,为第i个区间索引左端点处的薄膜张力数据缺失值的预测结果,为第i-1个区间索引左端点处的薄膜张力数据缺失值的预测结果,为取自然常数的指数操作,为取最大值操作,为衰减参数权重,为衰减偏置向量,为循环神经网络操作;
与传统的循环神经网络对比,传统循环神经网络只考虑了数据之间的时序关系,而本发明通过显式编码为循环神经网络提供了一个信号,让循环神经网络注意到数据的缺失位置,同时注意到缺失值与最邻近非缺失值之间的时间步长,使得模型能更容易地利用薄膜张力数据的时序信息,从而提高了模型的预测精度和鲁棒性,进而提高收卷机的收卷效果;
S23:根据预测结果,统计各个时刻的卷径数据、薄膜张力数据,生成卷径-张力曲线。
[0010] 进一步地,所述S3步骤包括:S31:记录PID系统每一次调整薄膜张力的过程中产生的超调幅度;
S32:当PID系统输出产生振荡时,记录振荡开始时间;
S33:当振荡幅度回到稳定范围内时,记录振荡停止时间,并与振荡开始时间作差,得到该次调整的波动时间;
S34:计算超调惩罚项,计算方式为:

其中,P为超调惩罚项,为超调幅度,为波动时间,为该次调整的总时间,为超调幅度权重,为时间权重。
[0011] 设定过于精细的目标张力会导致PID系统在实时调整过程中,难以准确跟随目标张力的变化,经常出现超调和波动的情况,这些误差会随着调整次数的增加而累积,最终影响到收卷效果的稳定性;此步骤引入了超调惩罚项,通过量化超调幅度和波动时间,对超调行为进行惩罚;对于S4步骤的基于强化学习的张力等级划分模型来说,这一惩罚机制能够有效降低频繁调整张力所带来的系统误差,使得张力等级划分模型更倾向于稳定的张力调整策略,而不是追求过度精细的目标张力,进而减少张力调整过程中的波动,提高了收卷过程的稳定性和品质。
[0012] 进一步地,所述S4步骤包括:S41:设计张力等级划分模型的状态空间为:卷径-张力曲线分段后的张力值序列;动作空间为:对当前张力等级进行合并、在当前张力等级添加新的分段点;所述张力值序列以0为序列中的第一个数值,以最大卷径为序列中的最后一个数值;
S42:设计张力等级划分模型的奖励函数,计算方式为:


其中,为张力等级划分模型的奖励值,为超调惩罚项的影响权重,为卷径-张力曲线拟合度,为卷径-张力曲线拟合度的影响权重,为取绝对值,为张力在卷径从变化到时的定积分;
S43:设计张力等级划分模型的值函数,计算方式为:

其中,为当前状态s和当前动作
a下的值函数,为学习率,为下一个状态,为下一个动作,为使得下一步Q值最大时对应的下一步动作,为折扣因子,为更新符号;
S44:采用ε-greedy策略,对张力等级划分模型进行更新,并输出张力等级数量和各张力等级的对应张力。
[0013] S4步骤通过强化学习的方式,在给定最大卷径的情况下,计算分段点数量和分段后的张力值序列;以曲线拟合度中的面积的绝对值之差,来表示调整后的曲线与原卷径-张力曲线的拟合程度,但一味地追求拟合程度,会导致分段点数量过多,而每一次分段在将来PID系统进行控制时,都会产生超调和波动的误差;因此,奖励函数中还设计了超调惩罚项,这会使得模型在选择更多的分段次数时,得到较大的惩罚;超调惩罚项可以约束系统的调整过程,避免频繁调整和误差累积,而曲线拟合度则能够评估张力曲线与卷径变化的匹配程度,进一步优化了奖励函数的设计,两者协同运行,共同提高了张力等级划分模型的性能,从而实现更加智能化、实用化的张力控制方式。
[0014] 进一步地,所述S5步骤包括:S51:初始化PID系统的比例、积分和微分参数;
S52:实时监测收卷过程中的薄膜张力和卷径;
S53:根据张力等级数量和各张力等级的对应张力,通过PID系统调整收卷过程中的薄膜张力。
[0015] 为实现上述基于人工智能的收卷方法,本发明还提供了一种基于人工智能的收卷系统, 包括:数据采集与预处理模:收集薄膜密度数据、薄膜厚度数据,以及薄膜收卷过程中薄膜卷的卷径数据、收卷过程中的薄膜张力数据,并对薄膜张力数据进行预处理,得到预处理后的薄膜张力数据;
张力预测模型构建模块:将薄膜密度数据、薄膜厚度数据与卷径数据进行融合,同时构建张力预测模型,进行薄膜张力数据缺失值填补,生成卷径-张力曲线;
超调惩罚项计算模块:计算PID系统每一次调整薄膜张力产生的超调幅度和波动时间,进而计算出超调惩罚项;
张力等级划分模型构建模块:构建张力等级划分模型,根据最大卷径,输出张力等级数量和对应张力;
PID控制模块:根据张力等级数量和对应张力,通过PID系统控制收卷过程中的薄膜张力。
[0016] 与现有技术相比,本发明的优点在于:(1)在整体方案上,本发明构建张力预测模型,结合薄膜厚度数据、薄膜密度数据,对薄膜张力数据进行缺失值补全,计算出卷径-张力曲线;其次,通过强化学习的方式,构建张力等级划分模型,计算得到合适的张力等级数量和各等级的对应张力,然后据此进行实际张力调整,实现张力调整次数和效果的平衡,根据不同卷径计算出合理的张力调整次数对收卷机进行控制,提高了锂电池收卷效果,减少收卷过程中的皱纹、暴筋等问题。
[0017] (2)在算法改进上,本发明首先对薄膜厚度数据、薄膜密度数据以及薄膜张力数据进行特征扩展,增强向量的表示能力;其次,在循环神经网络的基础上,对缺失位置、缺失值与临近非缺失值的时间步长以及衰减方式进行显式建模,提高了薄膜张力数据缺失值填补的效果,得到卷径-张力曲线。
[0018] (3)本发明考虑到实际情况中PID系统每次进行张力调整带来的误差累积,引入强化学习思想,根据最大卷径计算出合理的张力分段数量和对应目标张力,使得张力分段控制方案更合理,降低了频繁调整张力所带来的系统误差,进而减少张力调整过程中的波动,提高了收卷过程的稳定性和品质。附图说明
[0019] 图1为本发明提供的基于人工智能的收卷方法的流程示意图。
[0020] 图2为本发明提供的张力预测模型的算法结构示意图。

具体实施方式

[0021] 下面结合附图对本发明作进一步的说明,但不以任何方式对本发明加以限制,基于本发明教导所作的任何变换或替换,均属于本发明的保护范围。
[0022] 实施例1:一种基于人工智能的收卷方法,如图1所示,包括以下步骤:
S1:收集薄膜密度数据、薄膜厚度数据,以及薄膜收卷过程中薄膜卷的卷径数据、收卷过程中的薄膜张力数据,并对薄膜张力数据进行预处理,得到预处理后的薄膜张力数据;
所述卷径数据为离散时序数据,薄膜张力数据与卷径数据一一对应;薄膜数据中的密度和厚度是锂电池隔膜的基本属性,直接影响张力大小;
所述对薄膜张力数据进行预处理包括以下步骤:采用样条插值法,对不同卷径下的薄膜张力数据进行单次插值,得到插值后的薄膜张力数据,计算方式为:




其中,为三次样条函数输出的插值后的薄膜张力数据,为三次样条函数的输入,i为区间索引,为求解系数,为第i个区间左端点的卷径,为第i个区间左端点的对应的薄膜张力数据;为三次样条函数在第i个区间左端点的一阶导数,为三次样条函数在第i个区间左端点的二阶导数,为三次样条函数在第i+1个区间左端点的一阶导数,为三次样条函数在第i+1个区间左端点的二阶导数。
[0023] 薄膜张力数据通常是离散的,且数据点较少,无法充分反映出张力与卷径之间的细微变化;因此,采用样条插值法对离散的薄膜张力数据进行插值,能够得到更多的数据点,提高数据密度,有助于后续得到更加连续和平滑的张力-卷径曲线,也为后续的张力预测模型提供足够的数据点用于模型训练。
[0024] 例如,插值前:

[0025] 插值后:
[0026] 插值并非要填补所有数据,而是通过三次样条函数的拟合能力,将已知数据点之间的趋势进行初步处理,为后续的张力预测模型提供更多数据点,从而增强模型的预测性能和稳健性;在实时性和易用性方面,采用插值的方法相对于其他缺失值填补方法具有明显优势。
[0027] S2:将薄膜密度数据、薄膜厚度数据与卷径数据进行融合,同时构建张力预测模型,进行薄膜张力数据缺失值填补,生成卷径-张力曲线,如图2所示;张力预测模型首先提出位置缺失编码、缺失距离编码,分别对缺失值的位置以及缺失值与真值的距离进行标识,再将位置缺失编码、缺失距离编码与薄膜张力数据进行融合,输入门控循环单元,对薄膜张力数据进行预测并填补;
步骤S2包括:
S21:将薄膜密度数据、薄膜厚度数据与卷径数据进行融合,计算方式为:


其中,为融合后的数据,为拼接操作,分别为薄膜密度数据与薄膜厚度数据,为融合后的特征,为全连接层操作;
传统方法往往将张力设定为固定值,或只考虑卷径变化对张力的影响;相比之下,步骤S21结合了薄膜密度与薄膜厚度,在特征扩展之后再进行融合,考虑了更多的参数,能够更全面地捕捉张力的变化规律,使得收卷机在调整张力时能够更加精确地控制张力的变化,避免在收卷过程中出现的皱纹、暴筋等问题,提高锂电池隔膜的收卷效果;尤其是在面对不同厚度或密度的薄膜时,这种设计更能够适应不同的工艺要求,保证收卷效果的稳定性和品质;
S22:构建张力预测模型,预测薄膜张力数据的缺失值,并进行薄膜张力数据缺失值填补,计算方式为:





其中,为张力预测模型的输入,为第i个区间索引左端点的缺失编码,为第i-1个区间索引左端点的缺失编码,为第i个区间索引左端点的缺失距离编码,为第i-1个区间索引左端点的缺失距离编码,为衰减编码,为第i个区间索引左端点处的薄膜张力数据缺失值的预测结果,为第i-1个区间索引左端点处的薄膜张力数据缺失值的预测结果,为取自然常数的指数操作,为取最大值操作,为衰减参数权重,为衰减偏置向量,为循环神经网络操作;
与传统的循环神经网络对比,传统循环神经网络只考虑了数据之间的时序关系,而本发明通过显式编码为循环神经网络提供了一个信号,让循环神经网络注意到数据的缺失位置,同时注意到缺失值与最邻近非缺失值之间的时间步长,使得模型能更容易地利用薄膜张力数据的时序信息,从而提高了模型的预测精度和鲁棒性,进而提高收卷机的收卷效果;
例如,
传统循环神经网络的输入为单层的向量:
[13.5N, 14.755N, _, 15.525N, 16.290N, _, _, 16.875N]
经过显式编码后的输入为三层的矩阵:
[13.5N, 14.755N, _, 15.525N, 16.290N, _, _, 16.875N]
[1, 1, 0, 1, 1, 0, 0, 1]
[0, 0, 1, 0, 0, 1, 2, 0]
第二层与第三层分别对缺失值位置和缺失值距离上一个非缺失值的距离进行显式编码,使得循环神经网络更加明确应当重点关注哪些位置的信息,进而提高了薄膜张力数据缺失值填补的效果;
S23:根据预测结果,统计各个时刻的卷径数据、薄膜张力数据,生成卷径-张力曲线。
[0028] S3:计算PID系统每一次调整张力产生的超调幅度和波动时间,进而计算出超调惩罚项;S31:记录PID系统每一次调整薄膜张力的过程中产生的超调幅度;
S32:当PID系统输出产生振荡时,记录振荡开始时间;
S33:当振荡幅度回到稳定范围内时,记录振荡停止时间,并与振荡开始时间作差,得到该次调整的波动时间;
S34:计算超调惩罚项,计算方式为:

其中,P为超调惩罚项,为超调幅度,为波动时间,为该次调整的总时间,为超调幅度权重,为时间权重。
[0029] 设定过于精细的目标张力会导致PID系统在实时调整过程中,难以准确跟随目标张力的变化,经常出现超调和波动的情况,这些误差会随着调整次数的增加而累积,最终影响到收卷效果的稳定性;此步骤引入了超调惩罚项,通过量化超调幅度和波动时间,对超调行为进行惩罚;对于S4步骤的基于强化学习的张力等级划分模型来说,这一惩罚机制能够有效降低频繁调整张力所带来的系统误差,使得张力等级划分模型更倾向于稳定的张力调整策略,而不是追求过度精细的目标张力,进而减少张力调整过程中的波动,提高了收卷过程的稳定性和品质。
[0030] S4:构建张力等级划分模型,根据最大卷径,输出张力等级数量和对应张力;张力等级划分模型的奖励函数采用定积分的方式计算卷径-张力曲线拟合度,张力等级划分模型的值函数采用Q-learning的方式进行计算,并采用ε-greedy策略,对张力等级划分模型进行更新;
步骤S4包括:
S41:设计张力等级划分模型的状态空间为:卷径-张力曲线分段后的张力值序列;动作空间为:对当前张力等级进行合并、在当前张力等级添加新的分段点;所述张力值序列以0为序列中的第一个数值,以最大卷径为序列中的最后一个数值;
S42:设计张力等级划分模型的奖励函数,计算方式为:


其中,为张力等级划分模型的奖励值,为超调惩罚项的影响权重,为卷径-张力曲线拟合度,为卷径-张力曲线拟合度的影响权重,为取绝对值,为张力在卷径从变化到时的定积分;例如,若最大卷径为60厘米,模型在训练开始阶段,将分段点数量设定为100,即卷径每变化0.6厘米,PID系统就要调整一次目标张力,频次过高,因此根据超调惩罚项,模型会受到更大的惩罚,减少分段点数量;
在训练中期,模型将分段点数量设定为6,即卷径每变化10厘米,PID系统进行一次目标张力的调整,频次过低,与卷径-张力曲线的面积的绝对值较大,拟合程度较差,因此根据曲线拟合度,模型仍然会受到惩罚,提高分段点数量;
在训练后期,模型经过双向的惩罚后,计算出较为合适的分段点数量为20,即卷径每变化3厘米,PID系统进行一次目标张力的调整,频次适中,保证了在不产生过多的超调和波动的前提下,对卷径-张力曲线的拟合程度;
S43:设计张力等级划分模型的值函数,计算方式为:

其中,为当前状态s和当前动作
a下的值函数,为学习率,为下一个状态,为下一个动作,为使得下一步Q值最大时对应的下一步动作,为折扣因子,为更新符号;
S44:采用ε-greedy策略,对张力等级划分模型进行更新,并输出张力等级数量和各张力等级的对应张力。
[0031] S4步骤通过强化学习的方式,在给定最大卷径的情况下,计算分段点数量和分段后的张力值序列;以曲线拟合度中的面积的绝对值之差,来表示调整后的曲线与原卷径-张力曲线的拟合程度,但一味地追求拟合程度,会导致分段点数量过多,而每一次分段在将来PID系统进行控制时,都会产生超调和波动的误差;因此,奖励函数中还设计了超调惩罚项,这会使得模型在选择更多的分段次数时,得到较大的惩罚;超调惩罚项可以约束系统的调整过程,避免频繁调整和误差累积,而曲线拟合度则能够评估张力曲线与卷径变化的匹配程度,进一步优化了奖励函数的设计,两者协同运行,共同提高了张力等级划分模型的性能,从而实现更加智能化、实用化的张力控制方式。
[0032] S5:根据张力等级数量和对应张力,通过PID系统控制收卷过程中的薄膜张力;S51:初始化PID系统的比例、积分和微分参数;
S52:实时监测收卷过程中的薄膜张力和卷径;
S53:根据张力等级数量和各张力等级的对应张力,通过PID系统调整收卷过程中的薄膜张力。
[0033] 本发明尤其适用于对收卷效果要求较高的生产场景,特别是在需要频繁调整张力的情况下;本发明能够充分考虑薄膜特性、卷径与PID系统的能力,解决传统收卷方法在调整张力过程中出现的误差累积、超调和波动等问题,改善收卷效果。
[0034] 实施例2
[0035] 一种基于人工智能的收卷系统,用于实现上述基于人工智能的收卷方法,包括:数据采集与预处理模块:收集薄膜密度数据、薄膜厚度数据,以及薄膜收卷过程中薄膜卷的卷径数据、收卷过程中的薄膜张力数据,并对薄膜张力数据进行预处理,得到预处理后的薄膜张力数据;
张力预测模型构建模块:将薄膜密度数据、薄膜厚度数据与卷径数据进行融合,同时构建张力预测模型,进行薄膜张力数据缺失值填补,生成卷径-张力曲线;
超调惩罚项计算模块:计算PID系统每一次调整薄膜张力产生的超调幅度和波动时间,进而计算出超调惩罚项;
张力等级划分模型构建模块:构建张力等级划分模型,根据最大卷径,输出张力等级数量和对应张力;
PID控制模块:根据张力等级数量和对应张力,通过PID系统,控制收卷过程中的薄膜张力。
[0036] 需要说明的是,上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。并且本文中的术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
[0037] 通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
[0038] 以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。