- Windows 7 64位
- python 3.6
- Visual Studio 2017
- requests: 用于请求网络
- beautifulsoup: 用于操作 html 数据
- wkhtmltopdf: 用来把获取到的网络的 html 文件转换为 PDF 文件; 其中所使用的 pdfkit 是 wkhtmltopdf 的Python封装包
所以,需要先安装好下面的依赖包:
pip install requests
pip install beautifulsoup4
pip install pdfkit
然后需要在wkhtmltopdf官网下载稳定版进行安装,安装完成之后把该程序的执行路径加入到系统环境 $PATH 变量中(若在安装的时候将选择信息的两个选项打钩,安装过程中会自动将路径添加到环境变量)。
-
在末尾 Other 附有该程序的部分解读。
-
该程序是爬取RUNOOB.COM网站上的Python3教程并转换成 PDF 文档,若需爬取该网站其他信息或者其他网站,只需要做部分修改即可。
-
在该仓库中,附带有作者爬取到的RUNOOB.COM中的 Python3教程 。
-
另外,还附带有廖雪峰的官方网站中的Python3教程,可以做学习使用。
该程序是在号称宇宙最强的IED Visual Studio 2017 环境下编写的,其编辑界面如图:
爬虫运行完成之后,生成的 PDF 文件界面如图:
Author: Regan_Chai
E-Mail: [email protected]
CSDN: https://blog.csdn.net/u012319441/article/details/80032068