GithubHelp home page GithubHelp logo

homework_1's Introduction

一、 收集及可视化过程操作、感想

其实最开始想到的选题是每天听了哪些歌(网易云音乐有“最近播放”列表,但我总是会忘记当天听的第一首歌是什么),跟哪些人聊了天、聊了什么,每天在微博上浏览了哪些话题,但最后我考虑了很多天,因为觉得我一旦想要搜集,而且还属于比较隐私的数据,我的行为必定会受到影响,比如我肯定会为了表现自己坚定好学而少点击娱乐消息,会为了让自己看起来有点音乐品味而少听旋律洗脑的“口水歌”,以及为了表现出彬彬有礼、说话得体而克制发最常用的“哈哈哈哈哈哈哈”。

综合考虑,在初步定下的选定中,可行性最高的是搜集“在看”列表中的好友姓名和阅读的文章。但考虑到这样搜集最后呈现出来的效果可能会涉及好友的隐私,这个思路便作罢。

回到我自己身上,我想或许我可以综合一下各类指标平衡来对自己的日常生活做一个评估,看看自己把时间都花在了哪里,也顺便挖掘一下自己的兴趣爱好和性格特点的内在联系。

抱着这样的想法我初步决定把自己的生活分为四个维度:学习(读书、写作业、背单词等)、娱乐(听音乐、刷微博、看综艺等)、日常环节(吃饭、洗漱)以及社交(聊天、朋友圈点赞、评论等)。

随着条目的逐渐细化,我发现我试图建立的评价体系并没有越来越清晰,反而更繁复、更说不清了。于是我决定在三级指标的基础上捏合一些指标为二级指标。也随着自己第一步没有掌握好绘图的尺寸,导致圆盘不能过度细分,因此将错就错,做出了上课、吃饭、看书、睡觉、参加国庆爱国活动这样几个大类,其中特殊标出的是给我留下深刻印象的事件。

在我自己的第一张手绘作业中,我选择用变体时间轴的形式展示9月21日0:00至9月25日24:00五天的日常,之所以选这几天以及作业交迟的原因是因为我个人遇到一件我自认为20年人生经历的至暗时刻,也就是我在手稿中完全涂黑的时段。

为了让自己尽可能多的运用图形思维,也尽可能少地使用汉字,我选择用色彩表示情绪和分类。首先是蓝色,既代表我的日常活动——溜达,又代表睡眠。前者通常与音乐相伴随,虽然我没有做最后的定量统计,但根据我个人的回忆,在情绪低落期间我通常听“李荣浩”的歌曲,情绪高亢的阶段,我通常听比较“甜”的韩文歌曲;而后者,在区域较大的地方,我画了最常用的“晚安”表情包,区域较小的位置则用三个Z或“Hulu”的拟声词来指代。绿色代表日常起居:洗漱、在路上行走以及餐食非常不同的三餐。紫色代表读书,这段期间我主要读了《飘》,因此用此书的英文名、缩写或作者名字指代。棕色、黄色代表上课时间,为了简便处理不把时间切的过碎,我将课间时间等分到课堂和前一个活动上。

此外,我用颜色的深浅和圆形的位置来代表我的情绪状态。圆形与时钟形状类似,因此24等分可以代表一天24小时,我将纸张对折,折痕代表我毫无情绪波动的状态,折痕以下的区域代表我心情低落的状态,我用圆的位置逐渐上升至折痕以上表达我的心情逐渐有所好转。折痕以下的部分颜色比较深,而以上的部分颜色更为明亮。我认为这样表示情绪更为直观。

视觉呈现部分我最想阐释的一个是Sunday耳机的部分,这是我与同学通话过程中的一个小插曲,他的耳机坏了,所以其中一个耳机的部分音量采用了静音的图表;再一个是爬虫课,我试图用乱序排列的#、*、Python图表、换行符等来表示;还有一个是Monday的小喇叭代表我跟妈妈的争吵,梗出自我的爸爸,他会说妈妈是“小喇叭开始广播啦”。

add image

第二张手绘作品是我在没有统计“在看”、每天听的音乐、看的话题等操作后曲线救国的路线。这个灵感来自于QQ空间的“周报”,其内容是分析用户这一周访客的性别占比、年龄占比和第一个访客及访问次数最多的访客。这是基于数据抓取给出的一个相对巨细的用户访客画像,但实际上再细一步,根据我们自己对好友的了解,我们可以将信息进一步细化,我统计了跟第一张手绘图同期的QQ说说和微信朋友圈内容,用两个平台特有的图标代表点赞和评论,因为与我互动的只有高中和大学同学,且女生居多,大学男同学和高中男同学未在同一动态的点赞和评论中同时出现,所以我将每一条动态的互动好友分为三类:男生、大学女同学和高中女同学,并用同一色系的不同颜色表示,其中比较特殊的是9月23号的微信朋友圈混入了我的表哥,我用橙色标注了出来。脱敏的处理就非常拙劣了,看起来像是一些不可名状的内容,但其实是我个人比较负面或者幼稚的言论,我觉得不好意思放在作业里上交。

add image

这次作业是我第一次尝试不将数据认为是纯数字的基础上所做的呈现。我对“数据新闻”中的“数据”第一次改观发生在阅读《数据新闻概论》之后,按照我初始的理解,也是我报考这个专业的原因,数据新闻较传统新闻的区别在于引入数据使报道在纯文字的基础上更为客观,加之对数理知识的热爱,我对数据的认知就更局限于数字处理的技巧决定了数据新闻水平的高低。后来通过学习,我意识到这是一种较技术决定更为局限的认知,数据不仅是数字,更为广义的层面它代表一种处理资料的方式。

确实,当数据被理解为资料的时候有一种打开新世界大门的感觉。但在实操过程中我还意识到很多不足,首先我第一份手绘作业的数据收集方式是回忆,虽然这使得我对情绪的评价较为客观,但也是我所罗列的时间基本上都是正点的原因,我没有办法回忆起更巨细的东西,但如果我真的即时记下的话,就像我想立社交媒体人设一样,我的行为一定会受到影响,所以我甚至想是不是真的只有大数据才公正呢?可是我做第二张手绘作业的时候我又发现,大数据的结果看似有针对性性实际不然,我的空间访客女同学居多不假,但我的历个阶段女同学多于男同学也是事实。非常希望老师在课堂上能给出解答、指点:究竟什么样的数据收集方式更合理一些?即时收集还是“出其不备”?

二、 你认为日常生活中哪些数据是被搜集的?被谁搜集了?

我认为被搜集的数据大致分为两种:一种是被主动透露出去的,另一种是被被动搜集走的。主动的方式可以举这样一个例子:我们想要领取某种福利,比如领取取暖补助,为满足要求就要事先说清楚自己的住房面积、家庭人口数,地方办事处接收到的数据就是被有特定需求的人主动透露出去的。被动被搜集的数据也分自愿和非自愿两类,自愿的,比如说学校每年的信息采集,作为个人而言我们是很难自己主动去找个机器输入自己认为的基本信息,但学校在搜集的时候我们也不会拒绝,因为我们也知道这是为了我们自己日后更好的享受校园生活而做的前期准备;非自愿被搜集比如很多APP,我们为了正常使用不得不开一些权限,但很多时候可以发现,针对性内容的推送其实跟开了权限有很大关系,这不仅会造成内卷化,甚至可能窃取不必要的隐私;再如社会上流通的贩卖信息的行为,我们不定期街道的推销电话就是很好的例证。

被谁搜集了?在我看来是被有利可图者搜集了,APP搜集了用户喜好,针对性推送产品,一定程度上就提高了电商市场的活力;电话推销也是如此,容易上当受骗的老年群体就是正中下划的典型;而被主动透露的数据看起来提供方需求更强烈,但接收方也是或为了更顺利的工作、或为了日后存档等目的而搜集,只是对比之下表现不算突出罢了。

总体来看,我认为善用数据能获得的利好是很多的,但前提是善用,也希望自己能够掌握在不侵犯别人权利的前提下搜集有用数据的能力。

homework_1's People

Contributors

biugbang avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.