A visualization platform of Weibo data.
1.Github基本命令: https://www.liaoxuefeng.com/wiki/896043488029600
2.flask的基础知识: https://www.bilibili.com/video/av19817183
3.echarts模板: https://echarts.apache.org/zh/index.html
4.layui前端框架: https://www.layui.com/doc/
先按照老师发的链接http://180.76.173.156/index.html 做一个类似的平台,后面再往平台上添加内容,前期主要任务如下:
1.收集微博数据,可以是论文里面给的数据集,也可以在微博上爬取(需要带有用户关注关系以及转发结构的微博数据)
2.做一个微博数据统计的页面,如数据量、数据来源、用户的地理位置分布等等(使用echarts或者layui里面的模板)
3.对每一条的微博转发结构进行可视化,同时展示该微博在社交网络中从发布者开始随着时间的传播过程和转发量随时间的变化曲线
4.对每一条微博进行情感分析,可进行微博词云、情感极性统计以及情感色轮的可视化(可在echarts官网上寻找相关模板)
已经爬取到微博数据,同时做了一个微博来源统计的demo,大家先学会用GitHub拉代码和提交代码,特别是要学会学习资料中的“多人合作”部分。
三个模块每个模块分配两位同学,任务分配如下:
1、微博数据分析(胡文娅、倪琳)
(1)对爬取到的微博数据(weibo.csv)进行数据处理,包括删除重复微博(微博id相同)和信息不完整的微博、将微博的时间信息改为年月日格式。(爬取微博的时间算作10月23)
(2)学习echarts,完成“微博统计”页面,包括微博数量-时间分布、转发微博占比、微博评论点赞转发量分布。
(3)对爬取到的用户信息数据(userInfo.csv)进行数据处理,包括删除重复用户(用户id相同)和信息不完整的用户。(大部分用户的粉丝列表和关注列表没有完整爬到,不用删)
(4)参照“微博统计”页面添加一个“用户统计”页面,内容包括用户性别分布、用户认证占比、用户所在地分布(用地图模板)、用户关注量粉丝量微博数量分布。
2、微博转发结构分析(张财、胡莎莎)
(1)爬取部分微博的转发微博数据,用于微博转发结构可视化。
(2)先把页面中除转发结构外其它内容做好,页面中需要从输入微博id,然后展示该条微博的转发结构,并展示其转发量随时间的变化曲线。
(3)完成一个微博在社交网络中传播的页面,从页面中输入微博id,然后展示该条微博在网络中的传播情况。
3、微博情感分析(李亚琼、朱嘉洁)
(1)做一个展示每条微博的主题分布、情感分布的页面。(如果爬取到的微博数据不可用,可以用论文提供的数据)
(2)对每不同区域用户的微博进行情感分析,在页面中做一个地图,从地图中选择一个区域,然后展示该区域用户微博的词云、情感分布等。
其它有自己认为好的内容也可以提出来,共同完成。
大家把代码都提交到dev分支,我来整合到main分支。