应用场景
ApsaraDB for HBase的使用场景比较广泛,以至于很多客户无法把握他。以下我们大致列下,适合的场景:
HBase的设计之初是为了存储互联网,几乎所有非事务类结构化的存储需求都可以使用HBASE来满足。HBase是NoSql,讲的是Not only SQL,也是支持SQL及二级索引的。在整个数据的世界里,事务是比较少,占了不到1%的份额,大部分的数据存储都是无事务的。
目前阿里的使用情况:
在讲述具体的HBase场景,我们先看下HBase在整个数据处理大图之间的位置:
云HBase处于数据存储的位置,自带分析的功能
1、数据来源的途径有:
- 通过业务 ECS 直接写入到 云HBase之中
- 有一些消息中间件自带push功能,可以直接写入到HBase之中;有一些不行,需要拉取消息再转化处理后写入到HBase之中
- 通过流式系统,比如:SparkStreaming、Flink、Storm等流式引擎计算写入到云HBase之中
- 从离线同步数据到云HBase之中,一般为T+1同步
- 从关系型数据库同步数据到云Hbase之中,可以做到实时同步
- 在机器学习场景中,直接把云Hbase作为存储
2、云HBase的数据的去向:
- 云HBase自带Phoenix模块分析,支持百亿的毫秒级别分析
- 通过Spark等离线分析引擎分析
- ECS业务端查询,如Scan一些数据,在客户端展示
物联网大数据
HBase天生适合物联网的场景,比如:单车、物流轨迹类 等等
大数据类
满足安全风控、大数据处理、搜索等等具体的场景,一般跟流式系统、离线系统结合
大数据存储类、包括历史数据存储
存储包括各类数据,比如:日志、订单、交易数据、消息等等,在线实时写入,在实时查询。历史数据查询批量低,需要分层存储,云HBase预计在12月份支持冷热数据分离存储,降低存储成本
实时分析类
在百亿的数据量下,秒级别返回数据,适合 报表、统计等需求
版权声明
本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。
评论