欢迎您访问 最编程 本站为您分享编程语言代码,编程技术文章!
您现在的位置是: 首页

如何使用 python 抓取 e-hentai 图像 - 如何抓取网站图像

最编程 2024-03-15 16:08:45
...

提到爬虫,就不可避免地得提到F12开发者模式(可能有的系统按键有区别,大家懂意思就行)。因为网络本身就是一个接受HTML源码并在自己的机器上编译的过程,所以绝对不存在一个你能访问但是得不到源码的网址。

得到源码后,我们就可以利用我们强大的HTML技巧,从中获取我们需要的信息。下面举例说明:

总之,我们先打开一个不太涩的E站图集。然后F12打开源码,大概就是这样:
在这里插入图片描述
在源码中,我们仔细调查一番后,会发现所有的图片其实都存在一个id为gdt的类中,这个大类里包含着很多子类,每个gdtm子类都是一张图片的类。类中包含着图片的大小尺寸、背景颜色……以及最重要的:图片的链接。如下

在这里插入图片描述
找到链接后,我们要做的就是用正则表达式把每张图片的链接提取出来,具体式子视情况而定,这里大家直接看代码就好。

随后,我们进入网址,把图片一张一张地以二进制文件格式下载下来就可以啦。