标题:java爬取p站_A站(ACFun)爬虫爬取并播放、下载视频(JAVA)
最编程
2024-02-25 09:55:34
...
本文使用的工具有vlc+ffmpeg+phantomjs
一般视频网站的视频地址暴露的方式有两种:
1、html直接暴露
2、通过ajax异步返回。
A站使用的方式是第二种。针对第一种方式,直接使用jsoup就可以解析出视频地址,但是大部分网站都不会采取这种方式,而是选择第二种。
进入浏览器按下f12(这里我使用firefox)
可以看到,传输的ts分片。这些分片是一块块小视频,大概只有几秒左右,但是这些视频能够拼接成一个完整的视频地址。而这些视频地址的地址其实被存放在一个m3u8的文件中,但通过浏览器没办法直接看到m3u8文件,因此这里使用phantomjs。
这是一款没有界面的模拟浏览器,可以模拟浏览器获取ajax请求,通过分析,可以看到返回结果中有m3u8文件。
因此,我们可以拿到m3u8文件,然后使用vlc就可以进行播放,也可以使用ffmpeg将m3u8文件转换成mp4文件。
上一篇: 案例分析