Scrapy 框架爬虫学习笔记

最编程 2024-06-30 19:17:30

...

写在开始：

为什么选择Scrapy？

Scrapy 是一套基于Twisted的异步处理框架，是纯python实现的爬虫框架，用户只需要定制开发几个模块就可以轻松的实现一个爬虫，用来抓取网页内容或者各种图片。相对入门简单，当然如果你足够了解正则，bs4 ，beautifulsoup 也是个不错的选择。

PS：需要一定的Python基础简单的xpath 基础

创建项目（以音悦台榜单为例）

Url=http://vchart.yinyuetai.com/vchart/trends?area=ALL

启动 Anaconda Prompt

创建工程

进入工程目录

定义工作域爬虫名称

修改文件

itmes.py

定义要爬取的数据内容

Musiclist.py

爬虫主程序

分析HTML

标记为我们需要的信息

详细信息在ul 标签下的li 标签

依此找到标题歌手时间的 xpath 修改原始 musiclist.py 文件

Pipelines.py setting.py

运行爬虫

数据结果

已使用 Microsoft OneNote 2016 创建。

上一篇： vue-echarts 的用法

下一篇： bs4爬虫练习四--获取月牙台海图

Scrapy 框架爬虫学习笔记

Go Gin 框架和 HTML 模板学习笔记

计算机毕业设计 Python 深度学习游戏推荐系统 Django PySpark 游戏可视化游戏数据分析游戏爬虫 Scrapy 机器学习人工智能大数据简历

轻松入门 Scrapy 爬虫库学习

前端主流框架 vue 第一学习笔记

【Python学习笔记】Scrapy案例 + B站amazon案例视频

爬虫框架 Scrapy】02 Scrapy 入门案例

Scrapy 框架爬虫学习笔记

初识 Scrapy 框架+爬虫大作战（7）--抓取链家网 100 页租房信息

JeeSite 框架学习笔记

xUtils3.0 框架学习笔记分享

Scrapy 框架爬虫学习笔记

Go Gin 框架和 HTML 模板学习笔记

计算机 毕业设计 Python 深度学习 游戏推荐系统 Django PySpark 游戏可视化 游戏数据分析 游戏爬虫 Scrapy 机器学习 人工智能 大数据 简历

轻松入门 Scrapy 爬虫库学习

前端主流框架 vue 第一学习笔记

【Python学习笔记】Scrapy案例 + B站amazon案例视频

爬虫框架 Scrapy】02 Scrapy 入门案例

Scrapy 框架爬虫学习笔记

初识 Scrapy 框架+爬虫大作战（7）--抓取链家网 100 页租房信息

JeeSite 框架学习笔记

xUtils3.0 框架学习笔记分享

计算机毕业设计 Python 深度学习游戏推荐系统 Django PySpark 游戏可视化游戏数据分析游戏爬虫 Scrapy 机器学习人工智能大数据简历