生态篇-HBase 生态介绍
HBase 生态介绍
我们都知道,HBase是受Google公布的BigTable论文而产生的一种分布式、多版本、面向列的开源 KV 数据库。HBase稀疏矩阵的设计使得其特别适合存储非结构化的数据,比如用户画像、日志以及消息等数据。但是随着业务的快速发展,我们面临着各种新挑战和新需求,数据格式也随着业务的发展变得多种多样,其中包括:KV 数据、关系数据、文档数据、图数据以及时空时序等数据。而且随着时间的推移,各种数据占比越来越大,如下图所示:
从上图可以看出,从2013年开始,关系型数据的总体占比在逐年下降;而图数据、搜索数据、KV 数据、文档数据以及时序数据等却在逐年上升。到2018年, 关系型数据的占比已经由2013年的90%多下降到 2018年的75.4%。
面对如此多样的数据,我们急需一种系统,能够存储这些逐年增长的数据。所以 很有必要在 HBase 之上引入各种组件,使得 HBase 能够支持 SQL、时序、时空、 图、全文检索能力、及复杂分析。所以,完整的 HBase 生态如下:
从最底下开始看,这里面可以根据不同的需求选择不同的存储介质。比如热数据我们可以存储在SSD中;温数据存储在HDD中,冷数据存储在 OSS中。中间一层就是HBase以及Solr。最上层是解决各种场景的组件。下面简单介绍下每种组件的作用。
通过在 HBase之上引入了各种组件之后,使得HBase应用场景得到了极大的扩展,满足了监控、车联网、风控、实时推荐、政企、人工智能等场景的需求。
目前阿里云提供了HBase及X-Pack组件,其X-Pack组件形式和上面的 HBase生态很类似;除此之外,X-Pack 组件还针对HBase做了大量的优化,满足丰富业务处理需求、同时更加易用、更加强大功能。
总结
以上是生活随笔为你收集整理的生态篇-HBase 生态介绍的全部内容,希望文章能够帮你解决所遇到的问题。
- 上一篇: 使用Xshell连接Linux服务器
- 下一篇: crontab添加定时任务