web spider for lianjia.com
说明:
1、程序入口:entrypoint.py,首先需要安装Python2.7,一般安装在默认路径,完成之后会自动配置好环境变量。
2、然后进入cmd,执行python entrypoint.py即可,如果在命令行环境执行本脚本,可能中文显示会有乱码,不过不用担心,不影响最后保存的数据库。
3、也可以在IDE执行和调试本脚本,推荐pycharm,非常好用。
4、如果需要爬取其他城市的房源信息,修改Houselink.py文件中的入口地址即可。