交通情况与经济、疫情传播的交互分析
本研究的分析对象是共计一亿余条的交通出行记录数据,包含了**各省的交通数据,时间跨度由2019年到2021年,其中有班次代码、发车日期、发车时间、乘车站名称、到达站名称、座位类型六个变量。
本研究对**各省的交通出行记录数据进行了综合分析,使用PySpark对共计一亿余条的乘客出行记录进行了数据清洗、特征提取等流程,并通过可视化和数学建模方法挖掘了数据中隐藏的规律,如不同地区乘客的出行特征、各车站的交通重要性、省份交通状况与经济状况的关联等,得出了高可信度的结论。