GithubHelp home page GithubHelp logo

关于twitter数据集 about casflow HOT 5 CLOSED

xovee avatar xovee commented on June 24, 2024 1
关于twitter数据集

from casflow.

Comments (5)

Xovee avatar Xovee commented on June 24, 2024 1

谢谢夸奖!

首先说明一下数据集这方面的问题。因为社交网络平台的隐私等各种问题,所以数据集非常难找,带有转发路径的高质量数据集就更少了。之前很多公开的Twitter数据集好像都因为Twitter平台的政策陆续删除了(包括本文使用的Twitter数据集,它的公开下载地址已经无法访问了)。

然后本文的Twitter Cascade属于是Hashtag cascade。也就是说,我们建模的Information Item是#Hashtag#。-1/u1代表u1的tweet使用了该Hashtag,-1/u1/u2表示u2转发了u1的tweet。所以一个information cascade里包含多个子cascade。该cascade的popularity即所有子cascade的总转发数。

使用-1构建全局图是让数据集里的所有node都可以连接起来,算一种折中的方式吧(毕竟拿不到真实的全量的social network,如果是工业界使用自己的数据,当然不存在这个问题,本文算作一个初步尝试)。把-1换做每个hashtag cascade的unique_id,然后将这些unique_id连结到某个点(e.g., -1),或许可以减轻对全局图的影响。

非常感谢对我们论文的关注!

from casflow.

Xovee avatar Xovee commented on June 24, 2024 1

@foreversunx
应该可以。构建cascade graph的过程不受这个id的影响,因为不同的cascade之间是独立的。

from casflow.

Xovee avatar Xovee commented on June 24, 2024

@foreversunx
友情提示:昨天刚更新了代码,可以在新的tensorflow版本下运行,你可以试试看呢~

from casflow.

XgSuen avatar XgSuen commented on June 24, 2024

谢谢夸奖!

首先说明一下数据集这方面的问题。因为社交网络平台的隐私等各种问题,所以数据集非常难找,带有转发路径的高质量数据集就更少了。之前很多公开的Twitter数据集好像都因为Twitter平台的政策陆续删除了(包括本文使用的Twitter数据集,它的公开下载地址已经无法访问了)。

然后本文的Twitter Cascade属于是Hashtag cascade。也就是说,我们建模的Information Item是#Hashtag#。-1/u1代表u1的tweet使用了该Hashtag,-1/u1/u2表示u2转发了u1的tweet。所以一个information cascade里包含多个子cascade。该cascade的popularity即所有子cascade的总转发数。

使用-1构建全局图是让数据集里的所有node都可以连接起来,算一种折中的方式吧(毕竟拿不到真实的全量的social network,如果是工业界使用自己的数据,当然不存在这个问题,本文算作一个初步尝试)。把-1换做每个hashtag cascade的unique_id,然后将这些unique_id连结到某个点(e.g., -1),或许可以减轻对全局图的影响。

非常感谢对我们论文的关注!

那是不是我将每个cascade的hashtag都设置一个唯一的id,即看作是类似weibo那样的源用户id,以此来构造每个cascade的cascade graph也是合适的呢?

from casflow.

XgSuen avatar XgSuen commented on June 24, 2024

from casflow.

Related Issues (5)

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.