witnesslq Goto Github PK
Type: User
Type: User
1. 主要分为三个模块,一个爬虫抓取模块,一个是数据处理模块,一个是用户模块。 2. 爬虫抓取模块主要是从直播吧、新浪体育、网易体育上爬取有关足球的新闻和用户关于足球的评论,利用集群HADOOP抓取网页,分析得出URL集,提取特征URL 3. 网页linux脚本过滤得到原始网页,然后二次过滤得到文本,并使用分布式储存。 4. 处理模块主要是根据训练集规则一和规则二,得到分词器,然后对文本进行操作,得出训练结果。 5. 通过特征脚本得到训练结果的特征词分类,然后提取出球队模糊集和球星模糊集。 6. 过滤得到球队精确集和球星精确集,并存入MYSQL数据库。 7. 从数据库中提取球星和球队的信息进行图表分析,并动态显示WIKI信息,调入显示模块中和用户进行交换
模仿spark源码实现的分布式缓存
分布式日志收集系统Web前端
分布式日志系统
毕业设计《基于Web的图书推荐系统展示平台》
数据挖掘实验系统
物流配送管理系统
Docs
文本分类器
基于Spark ML实现的豆瓣电影推荐系统
数据处理
数据中台,https://xiaoping1988.github.io/index.html#/
基于hbase+spark的精准广告平台
Zipkin是一款开源的分布式实时数据追踪系统,dubbo-zipkin-spring-starter是为服务治理框架dubbo 编写的instrument library,支持dubbo全链路实时调用数据统计。使用者可以直接引入此boot starter,扩展默认自动激活(AutoConfiguration)。
基于dubbo框架搭建的一套框架,使用spring+springmvc+mybatis 并使用jqueryUI实现后台页面搭建
因为需求而做的一些重复的工作
解析广电大数据
文件内容读取工具包
flume 自定义类
dw etl 工具 mysql 增量、全量抽取 to hive. 合并 hive 数据表, 等数据平台清洗工具
hive sql 组件
hive udf , udf ,udaf ,udtf
调度服务
数据对外 api 接口, 包含用户画像数据, 等对外接口
电子办的地图项目
E-BusinessDataAnalysis/电商数据分析
An app built on Cloudera Enterprise for tracking metrics of jobs that run in YARN framework
一个多维度的地震信息监测报警系统
easy-elastic4j是基于elasticsearch java client封装的elasticsearch操作库,使用更简单方便
A declarative, efficient, and flexible JavaScript library for building user interfaces.
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
An Open Source Machine Learning Framework for Everyone
The Web framework for perfectionists with deadlines.
A PHP framework for web artisans
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
Some thing interesting about web. New door for the world.
A server is a program made to process requests and deliver data to clients.
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
Some thing interesting about visualization, use data art
Some thing interesting about game, make everyone happy.
We are working to build community through open source technology. NB: members must have two-factor auth.
Open source projects and samples from Microsoft.
Google ❤️ Open Source for everyone.
Alibaba Open Source for everyone
Data-Driven Documents codes.
China tencent open source team.