石油学报(石油加工) ›› 2020, Vol. 36 ›› Issue (1): 179-187.doi: 10.3969/j.issn.1001-8719.2020.01.0.22
王伟1, 汪坤1,杨帆2,戴超男2,金继民2,金宝宝2
WANG Wei1, WANG Kun1, YANG Fan2, DAI Chaonan2, JIN Jimin2, JIN Baobao2
摘要: 催化裂化装置是一个高度非线性和相互强关联的多变量系统,基于数据挖掘技术的分析方法是优化该工艺过程的一类有力工具。笔者利用某石油化工企业集散控制系统(Distributed control system, DCS)和实验室信息管理系统(Laboratory information management system, LIMS)的工业生产实时数据,分别从指标与汽油收率的正负相关性、工业经验以及模型重要性筛选等方面选取了182个关键影响参数,利用梯度提升决策树(GBDT)算法构建催化裂化汽油收率的预测模型,预测相应的汽油收率。基于GBDT集成学习框架构建了P-GBDT模型,引入了特征扰动和特征权重,增大经验可控参数的权重,解决了普通GBDT模型对特征缺乏偏好、经验可控参数特征的权重较小的问题。结果显示,由P-GBDT算法构建的汽油收率预测模型预测结果的准确率、R2、均方根误差等指标相比由GBDT算法构建的基准模型的预测结果明显更好,对真实收率的拟合效果更为接近,对优化改进实际可控装置操作条件具有更好的指导意义。
中图分类号: