阿里云实时数仓
前言
使用阿里云现有的产品生态体系,可以解决企业自建集群复杂,难维护,部署成本高的问题。基于这些情况我们可以使用目前阿里云已有的产品进行开通,来满足企业业务需求。
目前面临痛点
1、底层数据库无法承载海量数据,根据后续企业发展,10T,100T,以及PB,EB数据量无法承载,以及无法支撑快速查询响应,数据分析以及数据挖掘等工作。
2、实时计算性能存在一定不足,需要通过可靠计算引擎进行毫秒级实时计算,并且数据质量可靠,可控,可遥测。
3、数据模型调整效率不够快速,不能够非常灵活的调整数据模型结构,快速的提供业务场景报表需求。
应用场景
* 基于Flink和规则引擎的实时风控解决方案
* 基于实时计算(Flink)与高斯模型构建实时异常检测系统
* 基于实时计算(Flink)打造一个简单的实时推荐系统
实时数仓
总体数据开发流程
数据拉取->数据缓冲->实时计算->下沉落库
组件选型
Flink
阿里云实时计算 Flink 版阿里云基于Apache Flink构建的企业级、高性能实时大数据处理系统,由Apache Fl