利用几个邻近城市的移动通信设备用户数历史变动情况,各区县之间的用户转移情况,以及各个区县内移动通信设备的用户占比(决赛阶段提供)等模拟数据,合理建立预测模型,对上述城市各个区县未来15天的总人口变化情况进行动态预测。
有这么几点需要注意的地方:
- 原始数据log,降低数据的波动。
- 日期的选择上,通过画图前两个月的数据和后面很多都是不一致的,可以视为脏数据丢掉。此技巧让我在开赛前一周稳居前10.
- 对峰值数据的缩放在mean+a * std 与 mean - a * std。a需要通过线下来选取。
- 所有城市的流入和流出整体是相等的,所以对于模型预测后流入、流出进行平衡化处理