@ ^ - ^ @ 个人娱乐项目(本人萌新,欢迎大佬指教)
娱乐时间:2022-07-14 到 2022-07-17
爬取B站音乐区up主(风语·呢喃)的主页里所有的视频的音频信息(265首音乐,按照up主的最新发布顺序爬取),并上传到自己的私人云盘里用来享受生活(仅供学习交流,不做任何商业用途)
整个爬虫项目我分为前半部分和后半部分,
前半部分是:先利用webdriver从up主主页中爬取完整网页,再利用python的re模块和正则表达式获取其中的所有的视频的标题名称、封面图片地址、简介和BV号,把BV号拼成对应视频的网址,保存到tsv文件中
后半部分是:从tsv文件中读取所有视频的标题、网址、图片地址和简介,然后利用pydub进行MP3文件头修改,再高品质地保存音乐。