浙江大学控制科学与工程学院本科生课程“人工智能与机器学习”大作业——机房温度遥测
机房温湿度在一定程度上决定了机房设备运行的可靠性。
利用当前的温湿度状态预测未来一段时间内的温度变化,以提前采取应对措施将机房温度调整至最佳状态可以保证机房设备的可靠运行。
我们采集了 2019 年某段时间某机房遥测的数据信息,其中数据特征包括:
- 机房周边室外温度(outdoor_temperature)
- 室外湿度(outdoor_humidity)
- 室内湿度(indoor_humidity)
- 新风风机开关状态(fan_status)
- 机房总用电量(power_consumption)
- 室内温度(indoor_temperature)
需要预测的量为:
- 未来某一时刻的室内温度(indoor_temperature)
数据集包含约一个月内的机房遥测数据,采样间隔为 1 分钟。
本实验需要利用的机房遥测信息数据集,实现一个由前一段时间内的遥测数据信息,对未来一段时间内的室内温度进行预测的算法。
具体要求为:
- 根据过去 360 分钟内的机房遥测数据,预测未来第 60 分钟的机房温度信息。
- 建立深度神经网络模型,并尽可能将其调到最佳状态。
- 绘制深度神经网络模型图、绘制并分析学习曲线。
- 用 RMSE、MAE 等指标对模型进行评估。
将整个监督学习问题包装到强化学习的框架下,状态为经过处理后的特征,动作为预测的值,采用双延迟深度确定性策略梯度算法(TD3)实现。
rl_train.py
:训练所用主函数rl_test.py
:对results
中存储的模型进行评估rl_predict.py
:Mo平台测试接口./results/rl
:存放各种结果evaluations.npy
:学习过程中的奖励曲线models
:模型pics
:在训练集和测试集上评估的结果
./utils
:数据处理以及强化学习用的各种工具env.py
:环境接口process.py
:数据处理replayer.py
:经验回放池TD3
:TD3算法
不太理想,平滑性较差,振荡过多。