GithubHelp home page GithubHelp logo

写在前面

这是一款关于旅游的数据爬取和分析程序,用户只需要在终端输入一个旅游目的地,程序便可以自动生成相关的旅游信息,如该目的地的景点信息、美食信息、酒店信息、前往目的地的航班信息;系统还附带数据分析功能,并可以根据所爬取的信息画出相应的图表。但因为网站可能会采用新的反爬手段,绕过方法不具有永久性,所以未来程序某些功能的无法工作是不可避免的。

但人力终有所不逮,更何况是一名刚刚大二的初学python的学生。程序没有图形的交互界面,数据文件的处理也十分粗糙,数据分析和数据画图功能简单粗暴缺乏创新,甚至源码的基本格式也相当丑陋,毫无规范。所以,你完全可以评论该程序代码 is a piece of shit,但如果你有改进的方法和相关功能的扩展,欢迎加入我,一起进步!

程序框架

在主目录下执行python main.py即可启动程序。 其中log文件夹里面记录程序执行时的log日志;xiecheng文件夹里面存放爬取数据所需的基于scrapy的脚本文件,如果你想扩大数据的爬取量,请在里面的spiders更改参数,但相应的执行时间也会扩大;航班、酒店、景点、美食文件夹里存放生成的数据信息;City.json和hotel.txt是索引文件,请勿做任何修改,否则程序可能无法运行。

使用说明:

Travel 1.0 Author:OoLs

help -> 查看帮助文档

city [option] -> 查看城市景点,如:city 广州,即可获取广州景点信息

flight [option1] [option2] [option3] -> 查看航班信息,如:flight 广州 西安 2023-12-11,即可获取该23年12月11日广州->西安的航班信息

hotel [option] -> 查看酒店信息,如:hotel 广东,即可获取广东省部分酒店的信息(目前版本仅支持获取国内某个省份的酒店信息)

food [option] -> 查看美食信息,如:food 西安,即可获取西安美食信息

travel [option1] [option2] [option3] -> 一键生成旅游信息,如:travel 西安,即可获取西安的景点信息,西安的美食信息,当天起从广州(默认出发地是广州)到西安未来3天(默认是3天)的航班信息 如:travel 重庆 西安 7,即可获取重庆的景点信息,重庆的美食信息,当天起从西安到重庆未来7天的航班信息

draw [option] -> 根据生成的csv文件给前30名的画出数据分析图表,如:draw 广州景点,即可画出广州排名前30的景点数据分析图表(当前版本仅支持已经生成csv的景点、酒店或美食数据文件的画图)

read [option] -> 查看文本信息,如:read ./航班/flight.csv,即可打印当前目录下的航班文件夹里面的flight.csv文件信息

update [option] -> 更新城市索引文件City.json,为测试程序该文件已经更新了500页,基本涵盖了国内大部分景点的索引。如果需要继续更新,建议更新数值应大于500,如:update 700,即可更新City.json以便查看更多景点信息

exit() -> 退出Travel程序


法律声明: 该程序所有代码仅供学习交流使用,请勿用于商业用途和非法用途,如作他用所造成的一切后果和法律责任一概与本人无关!!! OoLs 2023-12-4


ools5's Projects

travel icon travel

一个基于Scrapy的专注于旅游相关数据的交互式爬取程序 -An interactive crawler based on Scrapy focusing on tourism-related dataConfig files for my GitHub profile.

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.