FFA 2021 口译 - 实时计数仓库
最编程
2024-03-22 18:05:07
...
12 月 4-5 日,Flink Forward Asia 2021 重磅开启,全球 40+ 多行业一线厂商,80+ 干货议题,带来专属于开发者的技术盛宴。
美团实时数仓平台建设 2021 新进展
快手实时数仓保障体系研发实践
Apache Flink 在腾讯大数据的实践
Apache Flink 已经成为实时计算的事实标准,腾讯大数据使用 Flink 满足内部用户超大规模的实时计算需求。本次分享主要介绍 Apache Flink 在腾讯大数据的实践和优化,包括如下几个方面:
-
背景介绍。 介绍 Flink 在腾讯大数据的发展过程、现状与痛点; -
容器化实践。 介绍腾讯大数据的容器化方案与最佳实践,以及大规模 Flink 任务调度的最佳实践; -
平台化实践。 介绍腾讯大数据在开发平台层、runtime层、生态层使用 Flink 的实践; -
实时数仓实践。 介绍腾讯大数据如何使用 Flink、Iceberg 和 ClickHouse 构建高性能的实时数仓; -
未来展望。
理想汽车基于 Flink 的
实时数据仓库 0-1 初步建设
蚂蚁实时数仓体系升级实践
TiDB X Flink|HTAP
为实时数据服务插上翅膀
Flink 在讯飞 AI 营销业务实时数仓实践
汪李之|科大讯飞中级大数据工程师
-
业务简介: 交易平台、广告的生命周期; -
实时数仓架构: 数仓分层、数仓建模; -
场景实践: DWD 实践、DWS 实践、ADS 实践、流批混合; -
未来展望: 流批一体。
SmartNews 基于 Flink 的实时数仓建设
-
Brief Introduction of SmartNews (SmartNews 简介) -
Architecture of data platform in SmartNews (SmartNews 数据平台架构) -
Usage of Flink in SmartNews (Flink 在 SmartNews 的应用简介) -
Motivation: reduce latency of daily tables significantly (动机:显著降低日表的延迟)
-
background (问题的背景) -
goals (目标) -
challenges (挑战)
-
Avoid small files (避免小文件) -
Streaming File Source over object store (基于对象存储的流式文件源) -
Integrate with Airflow (与 Airflow 的集成) -
Minimize latency (减少延迟)
十荟团基于 Flink SQL 与 Zeppelin
构建实时数仓的实践
康琪|十荟团高级大数据研发工程师、实时计算团队负责人,Apache Flink Contributor
-
十荟团构建实时数仓的场景和必要性; -
Flink SQL 和 Zeppelin 简介,以及为实时数仓建设带来的便利; -
十荟团实时数仓整体架构介绍与实际应用示例; -
数仓平台化建设:统一接入开发、元数据管理、数据血缘、作业监控与报警; -
Flink SQL 增强开发:扩展 Connector、MySQL/TiDB Catalog、Formats 优化、维表 join 优化、UDF 复用等; -
未来规划:流批一体、数据湖集成、自动化运维。
Flink Forward Asia 2021 赞助与合作
欢迎进入赛事官网了解详情:
https://www.aliyun.com/page-source//tianchi/promotion/FlinkForwardAsiaHackathon
戳我,报名 FFA 2021 大会!