《揭秘腾云:云计算与大数据时代的网络技术》.pdf
关注“Java后端技术全栈”
回复“面试”获取全套面试资料
什么是大数据?
最有名的回答莫过于"5V特点":
1)Volume:数据量大,包括采集、存储和计算的量都非常大。大数据的起始计量单位至少是P(1000个T)、E(100万个T)或Z(10亿个T)。
2)Variety:种类和来源多样化。包括结构化、半结构化和非结构化数据,具体表现为网络日志、音频、视频、图片、地理位置信息等等,多类型的数据对数据的处理能力提出了更高的要求。
3)Value:数据价值密度相对较低,或者说是浪里淘沙却又弥足珍贵。随着互联网以及物联网的广泛应用,信息感知无处不在,信息海量,但价值密度较低,如何结合业务逻辑并通过强大的机器算法来挖掘数据价值,是大数据时代最需要解决的问题。
4)Velocity:数据增长速度快,处理速度也快,时效性要求高。比如搜索引擎要求几分钟前的新闻能够被用户查询到,个性化推荐算法尽可能要求实时完成推荐。这是大数据区别于传统数据挖掘的显著特征。
5)Veracity:数据的准确性和可信赖度,即数据的质量。
随着云计算跟大数据的深入人心,所有行业都在发生着或大或小的变化,作为一名程序员,也需要在改变到来之前就已做好充分的准备,而学习就是最保险的准备。最近很多小伙伴问我要一些 大数据 相关的资料,于是我翻箱倒柜,找到了这本非常经典的电子书——《腾云:云计算和大数据时代网络技术揭秘》。
资料介绍
这本书名字就取得非常有意思,这是国内第一本系统讲解云计算网络的书籍。阅读本书,读者将清楚地了解到如何在云计算与大数据时代构建安全、可靠、高速与灵活的网络。最主要的,本书语言通俗易懂,内容深入浅出,可作为云计算网络技术入门和提高阶段的自学、参考书籍。
如何获取?
识别二维码并关注公众号「Java后端技术全栈」;
在公众号后台回复关键字「9999」
推荐阅读
-
解密腾云:云计算和大数据时代的网络技术(读书笔记1+2)
-
《腾云,云计算和大数据时代网络技术揭秘》的读书笔记:探索云计算时代的网络
-
腾云公司揭示云计算和大数据时代网络技术的试读报告
-
《揭秘腾云:云计算与大数据时代的网络技术》.pdf
-
揭示《腾云: 云计算与大数据时代网络技术的收获与分享》
-
小红书大产品部架构 小红书产品概览--经过性能、稳定性、成本等多个维度的详细评估,小红书最终决定选择基于腾讯云星海自研硬件的SA2云服务器作为主力机型使用。结合其秒级的快速扩缩、超强兼容和平滑迁移能力,小红书在抵御上亿次用户访问、保证系统稳定运行的同时,也实现了成本的大幅降低。 星海SA2云服务器是基于腾讯云星海的首款自研服务器。腾讯云星海作为自研硬件品牌,通过创新的高兼容性架构、简洁可靠的自主设计,结合腾讯自身业务以及百万客户上云需求的特点,致力于为云计算时代提供安全、稳定、性能领先的基础架构产品和服务。如今,星海SA2云服务器也正在为越来越多的企业提供低成本、高效率、更安全的弹性计算服务。 以下是与小红书SRE总监陈敖翔的对话实录。 问:请您介绍一下小红书及其主要商业模式? 小红书是一个面向年轻人的生活方式平台,在这里,他们发现了向上、多元的真实世界。小红书日活超过 3500 万,月活跃用户超过 1 亿,日均笔记曝光量达 80 亿。小红书由社交平台和在线购物两大部分组成。与其他线上平台相比,小红书的内容基于真实的口碑分享,播种不止于线上,还为线下实体店赋能。 问:围绕业务发展,小红书的系统架构经历了怎样的变革和演进? 系统架构变化不大,影响最深的是资源开销。过去三年,资源开销大幅增加,同比增长约 10 倍。在此背景下,我们努力进行优化,包括很早就开始使用 K8S 进行资源调度。到 18 年年中,绝大多数服务已经完全实现了容器化。 问:目前小红书系统架构中的计算基础设施建设和布局是怎样的? 我们目前的建设方式可以简单描述为星型结构。腾讯云在上海的一个区是我们的计算中心,承载着我们的核心数据和在线业务。在外围,我们还有两个数据中心进行计算分流,同时承担灾备和线上业务双活的角色。 与其他新兴电子商务互联网公司类似,小红书的大部分计算能力主要用于线下数据分析、模型训练和在线推荐等平台。随着业务的发展,对算力的需求也在加速增长。