Liuli

📖 构建一个多源、干净、个性化的阅读环境

琉璃开净界，薜荔启禅关

使用场景：

阅读源管控，构建自己的知识管理框架：目标阅读源不方便订阅可利用Liuli生成RSS源进行自定义输出阅读
公众号用户的广告问题：避免公众号阅读环境的广告轰炸，案例见：打造一个干净且个性化的公众号阅读环境
目标监控：针对特别关注的信息流进行监控，比如小说追更、特殊新闻追踪等

实现

我的思路很简单，大概流程如下：

简单解释一下：

采集器：监控各自关注的公众号或者博客源等自定义阅读源，最终构建Feed流作为输入源；
处理器：对目标内容进行自定义处理，如基于历史广告数据，利用机器学习实现一个广告分类器（可自定义规则），或者自动打标签等；
分发器：依靠接口层进行数据请求&响应，为使用者提供个性化配置，然后根据配置自动进行分发，将干净的文章流向微信、钉钉、TG甚至自建网站都行。

这样做就实现了干净阅读环境的构建，衍生一下，还可以实现个人知识库的构建，可以做诸如标签管理、图谱构建等，这些都可以在接口层进行实现。

使用

教程[使用前必读]：

快速开始，请先确保安装Docker：

mkdir liuli
# 配置 pro.env 具体查看 doc/02.环境变量.md
vim pro.env
# 下载 docker-compose
wget https://raw.githubusercontent.com/howie6879/liuli/main/docker-compose.yaml
# 启动
docker-compose up -d

代码安装使用过程如下：

# 确保有Python3.7+环境
git clone https://github.com/howie6879/liuli.git
cd liuli

# 创建基础环境
pipenv install --python={your_python3.7+_path}  --skip-lock --dev
# 配置.env 具体查看 doc/02.环境变量.md 启动调度
pipenv run dev_schedule

启动成功日志如下：

Loading .env environment variables...
[2021:12:23 23:08:35] INFO  Liuli Schedule started successfully :)
[2021:12:23 23:08:35] INFO  Liuli Schedule time: 00:00 06:00
[2021:12:23 23:09:36] INFO  Liuli playwright 匹配公众号 老胡的储物柜(howie_locker) 成功! 正在提取最新文章: 我的周刊(第018期)
[2021:12:23 23:09:39] INFO  Liuli 公众号文章持久化成功! 👉 老胡的储物柜
[2021:12:23 23:09:40] INFO  Liuli 🤗 微信公众号文章更新完毕(1/1)