姓名:冯传恒
学号:717030210003
- 数据描述
这份数据是一个csv
文件,一共有204条数据,数据规模不大,因此不必采用特数的方法进行处理,每条数据有9个属性,分别是:
其中前8个属性的字段较短,履历的字段较长.数据虽然给出了很多信息,但是给出的信息格式不一致,导致数据解析和处理非常复杂.比如日期中就有好几种类型:
只有年份的,
1982—1984,上海材料研究所九室科研人员
有年份和月份的,
2005.08—2006.11,财政部教科文司司长;
或者起始日期只有年份终止日期年份和月份都有的,
1996—2003.10,空军司令部军训部部长、云南航空兵训练基地司令员、成都军区空军副参谋长、空军武汉基地司令员、空军武汉指挥所主任
还有起始日期和终止日期一样的
2007—2007,上海市委书记,上海警备区党委第一书记
- 可能展开的的分析点
可以分析某个委员的职业生涯,升迁记录与其职业,毕业院校,民族等属性的关系,也可以分析各种属性在委员中数量的占比的影响
- 为什么没有加入地图可视化
如1)中所说,给出的数据特殊情况过多,需要在数据的统一化和解析下很多功夫.人员履历信息的地图可视化应该是非常有吸引力的,但是需要花费大量时间,很难在短时间内完成,遇到的主要问题只要在于履历信息中给出的地点不明确,导致和具体地理信息匹配的难度很大,比如
1994—1997,国家国有资产管理局办公室主任兼人事教育司司长;
在没有其他信息的情况下,很难靠知道国家国有资产管理局办公室
的具体地理位置在哪里,虽然实际上我们是可以知道的,但是这样的数据太多,如果一条一条去处理显示是不切实际的,所以这一种情况行不通
-
设计**
为了解(tao)决(bi)以上问题,我采用了一种更直接的可视化方式,通过列表和直方图的方式来显示人员信息,而由于履历的信息过多,所以不在列表里直接呈现,需要
click
或者onmouseover
事件来触发显示.此外,我采用饼状图显示男女比例,采用直方图显示各个院校,地方,民族,年龄段相关联的人员信息,可以通过点击关联的直方图来进行数据筛选
-
界面框架
界面框架分为六个部分:
- 性别框架
- 毕业院校框架
- 民族框架
- 出生日期框架
- 籍贯框架
- 主视图框架
- 交互
该可视化网页采用了较多的交互手段,大致有一下几种;
- 发现