通过调试技术,我发现网站上的视频播放速度非常快。
b 站视频播放的是很快的,基本是点哪就播放到哪。
而且如果你上次看到某个位置,下次会从那个位置继续播放。
那么问题来了:如果一个很大的视频,下载下来需要很久,怎么做到点哪个位置快速播放那个位置的视频呢?
前面写过一篇 range 请求的文章,也就是不下载资源的全部内容,只下载 range 对应的范围的部分。
那视频的快速播放,是不是也是基于 range 来实现的呢?
我们先复习下 range 请求:
请求的时候带上 range:
服务端会返回 206 状态码,还有 Content-Range 的 header 代表当前下载的是整个资源的哪一部分:
这里的 Content-Length 是当前内容的长度,而 Content-Range 里是资源总长度和当前资源的范围。
更多关于 Range 的介绍可以看这篇文章:基于 HTTP Range 实现文件分片并发下载!
那 b 站视频是不是用 Range 来实现的快速播放呢?
我们先在知乎的视频试一下:
随便打开一个视频页面,比如这个:
然后打开 devtools,刷新页面,拖动下进度条,可以看到确实有 206 的状态码:
我们可以在搜索框输入 status-code:206 把它过滤出来:
这是一种叫过滤器的技巧:
可以根据 method、domain、mime-type 等过滤。
-
has-response-header:过滤响应包含某个 header 的请求
-
method:根据 GET、POST 等请求方式过滤请求
-
domain: 根据域名过滤
-
status-code:过滤响应码是 xxx 的请求,比如 404、500 等
-
larger-than:过滤大小超过多少的请求,比如 100k,1M
-
mime-type:过滤某种 mime 类型的请求,比如 png、mp4、json、html 等
-
resource-type:根据请求分类来过滤,比如 document 文档请求,stylesheet 样式请求、fetch 请求,xhr 请求,preflight 预检请求
-
cookie-name:过滤带有某个名字的 cookie 的请求
当然,这些不需要记,输入一个 - 就会提示所有的过滤器:
但是这个减号之后要去掉,它是非的意思:
和右边的 invert 选项功能一样。
然后点开状态码为 206 的请求看一下:
确实,这是标准的 range 请求。
我点击进度条到后面的位置,可以看到发出了新的 range 请求:
那这些 range 请求有什么关系呢?
我们需要分析下 Content-Range,但是一个个点开看不直观。
这时候可以自定义显示的列:
右键单击列名,可以勾选展示的 header,不过这里面没有我们想要的 header,需要自定义:
点击 Manage Header Columns
添加自定义的 header,输入 Content-Range:
这时候就可以直观的看出这些 range 请求的范围之间的关系:
点击 Content-Range 这一列,升序排列。
我们刷新下页面,从头来试一下:
随着视频的播放,你会看到一个个 range 请求发出:
这些 range 请求是能连起来的,也就是说边播边下载后面的部分。
视频进度条这里的灰条也在更新:
当你直接点击后面的进度条:
观察下 range,是不是新下载的片段和前面不连续了?
也就是说会根据进度来计算出 range,再去请求。
那这个 range 是完全随意的么?
并不是。
我们当前点击的是 15:22 的位置:
我刷新下页面,点击 15:31 的位置:
如果是任意的 range,下载的部分应该和之前的不同吧。
但是你观察下两次的 range,都是 2097152-3145727
也就是说,视频分成多少段是提前就确定的,你点击进度条的时候,会计算出在哪个 range,然后下载对应 range 的视频片段来播放。
那有了这些视频片段,怎么播放呢?
浏览器有一个 SourceBuffer 的 api,我们在 MDN 看一下:
大概是这样用的:
也就是说,可以一部分一部分的下载视频片段,然后 append 上去。
拖动进度条的时候,可以把之前的部分删掉,再 append 新的:
我们验证下,搜索下代码里是否有 SourceBuffer:
按住 command + f 可以搜索请求内容:
可以看到搜索出 3 个结果。
在其中搜索下 SourceBuffer:
可以看到很多用到 SourceBuffer 的方法,基本可以确认就是基于 SourceBuffer 实现的。
也就是说,知乎视频是通过 range 来请求部分视频片段,通过 SourceBuffer 动态播放这个片段,来实现的快速播放的目的。具体的分段是提前确定好的,会根据进度条来计算出下载哪个 range 的视频。
那服务端是不是也要分段存储这些视频呢?
确实,有这样一种叫做 m3u8 的视频格式,它的存储就是一个个片段 ts 文件来存储的,这样就可以一部分一部分下载。
不过知乎没用这种格式,还是 mp4 存储的,这种就需要根据 range 来读取部分文件内容来返回了:
再来看看 b 站,它也是用的 range 请求的方式来下载视频片段:
大概 600k 一个片段:
下载 600k 在现在的网速下需要多久?这样播放能不快么?
相比之下,知乎大概是 1M 一个片段:
网速不快的时候,体验肯定是不如 b 站的。
而且 b 站用的是一种叫做 m4s 的视频格式:
它和 m3u8 类似,也是分段存储的,这样提前分成不同的小文件,然后 range 请求不同的片段文件,速度自然会很快。
然后再 command + f 搜索下代码,同样是用的 SourceBuffer:
这样,我们就知道了为什么 b 站视频播放的那么快了:
m4s 分段存储视频,通过 range 请求动态下载某个视频片段,然后通过 SourceBuffer 来动态播放这个片段。
总结
我们分析了 b 站、知乎视频播放速度很快的原因。
结论是通过 range 动态请求视频的某个片段,然后通过 SourceBuffer 来动态播放这个片段。
这个 range 是提前确定好的,会根据进度条来计算下载哪个 range 的视频。
播放的时候,会边播边下载后面的 range,而调整进度的时候,也会从对应的 range 开始下载。
服务端存储这些视频片段的方式,b 站使用的 m4s,当然也可以用 m3u8,或者像知乎那样,动态读取 mp4 文件的部分内容返回。
除了结论之外,调试过程也是很重要的:
我们通过 status-code 的过滤器来过滤出了 206 状态码的请求。
通过自定义列在列表中直接显示了 Content-Range:
通过 command + f 搜索了响应的内容:
这篇文章就是对这些调试技巧的综合运用。
以后再看 b 站和知乎视频的时候,你会不会想起它是基于 range 来实现的分段下载和播放呢?
更多调试技术可以看我的调试小册《前端调试通关秘籍》
上一篇: 学习编程的一些个人经历 傻瓜也能理解的弗洛伊德算法
下一篇: 我贴出来只是为了好看。
推荐阅读
-
通过调试技术,我发现网站上的视频播放速度非常快。
-
反传销网8月30日发布:视频区块链里的骗子,币里的韭菜,杜子建骂人了!金融大V周召说区块链!——“一小帮骗子玩一大帮小白,被割韭菜,小白还轮流被割,割的就是你!” 什么区块链,统统是骗子 作者:周召(知乎金融领域大V,毕业于上海财经大学,目前任职上海某股权投资基金合伙人) 有人问我,区块链现在这么火,到底是不是骗局? 我的回答是: 是骗局。而且我并不是说数字货币是骗局,而是说所有搞区块链的都是骗局。 -01- 区块链是一种鸡肋技术 人类社会任何技术的发明应用,本质都是为了提高社会的生产效率。而所谓区块链技术本质不过是几种早已成熟的技术的大杂烩,冗余且十分低效,除了提高了洗钱和诈骗的效率以外,对人类社会的进步毫无贡献。 真正意义上的区块链得包含三个要素:分布式系统(包括记账和存储),无法篡改的数据结构,以及共识算法,三者互为基础和因果,就像三体世界一样。看上去挺让人不明觉厉的,而经过几年的瞎折腾,稍微懂点区块链的碰了几次壁后都已经渐渐明白区块链其实并没有什么卵用,区块链技术已经名存实亡,沦为了营销工具和传销组织的画皮。 因为符合上述定义的、以比特币为代表的原教旨区块链技术,是反效率的,从经济学角度来说,不但不是一种帕累托改进,甚至还可以说是一种帕累托倒退。 原教旨区块链技术的效率十分低下,因为要遍历所有节点,只能做非常轻量级的数据应用,一旦涉及到大量的数据传输与更新,区块链就瞎了。 一方面整条链交易速度会极慢,另一方面数据库容量极速膨胀,考虑到人手一份的存储机制,区块链其实是对存储资源和能源的一种极大的浪费。 这里还没有加上为了取得所谓的共识和挖矿消耗的巨大的能源,如果说区块链技术是屎,那么这波区块链投机浪潮可谓人类历史上最大规模的搅屎运动。 区块链也验证不了任何东西。 所谓的智能合约,即不智能,也非合约。我看有人还说,如果有了智能合约,就可以跟老板签一份放区块链上,如果明年销售业绩提升30%,就加薪10%,由于区块链不能篡改,不能抵赖,所以老板必须得执行,说得有板有眼,不懂行的愣一看,好像还真是那么回事。 但仔细一想,问题就来了。首先,在区块链上如何证明你真的达到了30%业绩提升?即便真的达到老板耍赖如何执行? 也就是说,如果区块链真这么厉害,要法院和仲裁干什么。 人类社会真正的符合成本效益原则的是代理制度。之前有人说要用区块链改造注册会计师行业,我不知道他准备怎么设计,我猜想他思路大概是这样的,首先肯定搞去中心化,让所有会计师到链上来,然后一个新人要成为注册会计师就要所有会计师同意并记录在链上。 那我就请问了,我每天上班累死累活,为什么还要花时间去验证一个跟我无关的的人的专业能力?最优做法当然是组织一个委员会,让专门的人来负责,这不就是现在注册会师协会干的事儿吗?区块链的逻辑相当于什么事情都要拿出来公投,这个绝对是扯淡的。 当然这么说都有点抬举区块链了,区块链技术本身根本没有判断是非能力,如果这么高级的人工智能,靠一个无脑分布式记账就能实现的话,我们早就进入共产主义社会了。 虽然EOS等数字货币采用了超级节点,通过再中心化的方式提高效率,有点行业协会的意思,是对区块链原教旨主义的一种修正,但是依然无法突破区块链技术最本质的局限性。有人说,私有链和联盟链是区块链技术的未来,也是扯淡,因为区块链技术没有未来。如果有,说明他是包装成区块链的伪区块链技术。 区块链所涉及的所有底层技术,不管是分布式数据库技术,加密技术,还是点对点传输技术等,基本都是早已存在没什么秘密可言的技术。 比特币系统最重要的特性是封闭性和自洽性,他验证不了任何系统自身以外产生的信息的真实性。 所谓系统自身产生的信息,就是数据库数据的变动信息,有价值的基本上有且只有交易信息。所以说比特币最初不过是中本聪一种炫技的产物,来证明自己对几种技术的掌握,你看我多牛逼,设计出了一个像三体一样的系统。因此,数字货币很有可能是区块链从始至终唯一的杀手应用。 比特币和区块链概念从诞生到今天已经快10年了,很多人说区块链技术在爆发的前夜,但这个前夜好像是不是有点过长了啊朋友,跟三体里的长夜有一拼啊。都说区块链技术像是90年代初的互联网,可是90年代初的互联网在十年发展后,已经出现了一大批伟大的公司,阿里巴巴在99年都成立了,区块链怎么除了币还是币呢? 正规的数字货币未来发展的形式无外乎几种,要么就是论坛币形式,或者类似股票的权益凭证等。问题是论坛币和股票之前,本来也都电子化了,区块链来了到底改变了什么呢? 所有想把TOKEN和应用场景结合起来的人最后都很痛苦,最后他们会发现区块链技术就是脱裤子放屁,自己辛苦搞半天,干嘛不自己作为中心关心门来收钱?最后这些人都产生了价值的虚无感,最终精神崩溃,只能发币疯狂收割韭菜,一边嘴里还说着我是个好人之类的奇怪的话。 因此,之前币圈链圈还泾渭分明,互相瞧不起,但这两年链圈逐渐坐不住了,想着是不是趁着泡沫没彻底破灭之前赶快收割一波,不然可能什么都捞不着了。 前段时间和一个名校毕业的链圈朋友瞎聊天,他说他们“致力于用区块链技术解决数字版权保护问题”,我就问他一个问题,你们如何保证你链的版权所有权声明是真实的,万一盗版者抢先一步把数据放在链上怎么办。他说他们的解决方案是连入国家数字版权保护中心的数据库进行验证…… 所以说区块链技术就是个鸡肋,研究到最后都会落入效率与真实性的黑洞,很多人一头扎进链圈后才发现,真正意义上的区块链技术,其实什么都干不了。 -02- 不是蠢就是坏的区块链媒体 空气币和区块链的造富神话,让区块链自媒体也开始迎风乱扭。一群群根本不知道区块链为何物的妖魔鬼怪纷纷进驻区块链自媒体战场,开始大放厥词胡编乱造。 任何东西,但凡只要和区块,链,分,分布式,记账,加密,验证,可追溯等等这些个关键词沾到哪怕一点点,这些所谓的区块链媒体人就会像狗闻到了屎了一样疯狂地把区块链概念往上套。 这让我想起曾经一度也是热闹非凡的物联网,我曾经去看过江苏一家号称要改变世界的“物联网”企业,过去一看是生产路由器的,我黑人问号脸,对方解释说没有路由器万物怎么互联,我觉得他说得好有道理,竟无言以对。 好,下面让我们进入奇葩共赏析时间,来看看区城链媒体经常有哪些危言耸听的奇谈怪论 区块链(分布式记账)的典型应用是*?? 正如前面所说,真正意义上的区块链分布式记账,不光包括“记”这个动作,还包括分布式存储和共识机制等。而*诞生远远早于区块链这个词的出现,勉强算是“分布式编辑”吧,就被很多区块链媒体拿来强行充当区块链技术应用的典范。 其实事实恰恰相反,*恰恰是去中心化失败的典范,现在如果没有精英和专业人士的编辑和维护,*早就没法看了。 区块链会促进社会分工?? 罗振宇好像就说过类似的话,虽然罗振宇说过很多没有逻辑的话,但这句话绝对是最没逻辑思维的。很多区块链自媒体也常常用这句话来忽悠老百姓,说分工代表效率提高社会进步,而区块链“无疑”会促进分工,他们的理由仅仅是分工和分布式记账都共用一个“分”字,就强行把他们扯到一起。 实际情况恰恰相反,区块链是逆分工的,区块链精神是号召所有人积极地参与到他不擅长也不想掺合的事情里面去。 区块链不能像上帝一样许诺他的子民死后上天国,只能给他们许诺你们是六度人脉中的第一级,我可以赚后面五级人的钱,你处于金字塔的顶端。