全面了解糖化血红蛋白酶:值得拥有的NoSQL数据库(1)

前言:谈到HBase技术,对于那些稍微接触或使用过它的人来说,它可能只是十万个数据库中的一个公共库,就像我对Redis的了解:缓存!但是对于HBase,我确实有一些感觉。今天,我突然想到了一个有趣的想法。我想从技术角度和情感角度来写这位老朋友,就像写小说一样。这可能有点好笑,但我觉得很放松。《全方位认识HBase:一个值得拥有的NoSQL数据库》:从今天开始,让我们暂时把它当作一部小说的名字。哈哈~

事实上,我特别想做的一件事是让更多的人了解和使用真正的大数据堆栈技术。当然,没有其他原因。主要原因是HBase真的很棒也很热门。当我使用它的时候,我感觉真的很好。我怎样才能向你推荐一种不好的产品?~毕竟,这家伙不会给我任何广告费~

首先,我想和你们分享的是:当我第一次和这位糖化血红蛋白的老朋友联系时,我不想看到的东西。什么?事实上,这是一个非常无聊和深刻的灵魂,似乎要问三个问题:我是谁?我来自哪里?我要去哪里?

你为什么要写这个?这真的很无聊~当然,我绝对不是太无聊。说实话,那是因为我真的对它有感觉,所以我想向你介绍它过去的所有生活。这可能是一种感觉,可能是一种敬畏,或者只是害怕在路上的人会忘记是谁。

我从哪里来?

我们知道糖化血红蛋白酶是在大数据的背景下出现的,所以当谈到这个问题时,我们不得不提到那一年为大数据算法奠定基础的三篇受欢迎的谷歌论文,也被称为谷歌的三驾马车:谷歌[2003,地图简化[2004,大格[2006。这里提供了三篇论文的中文版本的链接,供每个人在有空的时候查看。

链接:https://pan.baidu.com/s/1EIhGR6gADm2BnEh5hW4KUA

提取代码:c1wb

为什么这三份报纸在全世界如此受欢迎?我们说过,随着大数据时代的到来,我们也面临着大数据带来的两个核心问题:

1.如何存储海量数据

2.如何计算海量数据

3.如何高效读写海量结构化数据?

然而,谷歌公司从2003年到2006年发表的三篇论文为解决这两个问题提供了思路。

“我们设计并实施了谷歌通用文件系统(Google GFS file system),这是一个可扩展的分布式文件系统,适用于大规模数据密集型应用。

尽管GFS运行在廉价且通用的硬件设备上,但它仍能为大量客户端提供灾难冗余和高性能。

服务

.

GFS完全满足我们的存储需求。"

谷歌GFS文件系统的先进设计思想为大数据时代海量数据的存储提供了解决方案,也为未来的分布式系统设计提供了有价值的指导。MapReduce框架解决了大数据时代如何计算海量数据的问题。虽然斯帕克现在很受欢迎,但是人们在喝水的时候不能忘记挖井的人。

2006年,谷歌发布了第三篇重要论文。Bigtable是一个分布式结构化数据存储系统,设计用于处理海量数据:通常是分布在数千台普通服务器上的PB级数据。Bigtable旨在可靠地处理PB级数据,可以部署在数千台机器上。它用于解决谷歌海量结构化数据的存储和高效读写。

也正是因为这三篇论文的发表,HDFS、MapReduce和HBase应运而生,并迎来了大数据2015年的第一年。让我们详细看一下Hadoop家族的历史,在这里您可能会看到HBase在Hadoop家族中的位置。

* 2002年10月,道格卡丁和迈克卡法雷拉创建了一个开源网络爬虫项目Nutch。

* 2003年10月,谷歌发表了一篇谷歌文件系统论文。

* 2004年7月,Doug Cutting和Mike Cafarella在HDFS的前身Nutch实施了类似全球森林服务的功能。

* 2004年10月,谷歌发表了一篇地图简化论文。

* 2005年2月,Mike Cafarella在Nutch实现了MapReduce的原始版本。

* 2006年1月,道格卡特加入了雅虎,雅虎!提供专门的团队和资源,将Hadoop开发成可以在网络上运行的系统。

* 2006年2月,Apache Hadoop项目正式启动,以支持MapReduce和HDFS的独立开发。

* 2006年3月,雅虎!第一个Hadoop集群是为开发而构建的。

* 2006年4月,第一个Apache Hadoop发布。

* 2006年11月,谷歌发表了Bigtable论文,最终激发了HBase库的创建。

* 2007年10月,第一个可用的HBase发布。

* Hadoop于2008年1月成为阿帕奇的顶级项目。

* 2008年1月,HBase成为Hadoop的一个子项目。

* 2008年6月,Hadoop的第一个SQL框架——Hive成为Hadoop的一个子项目。

* MapReduce和HDFS于2009年7月成为Hadoop项目的独立子项目。

* 2009年7月,Avro和Chukwa成为Hadoop的新次级项目。

* 2009年10月,第一届Hadoop世界大会在纽约举行

* 2010年5月,HBase脱离了Hadoop项目,成为Apache的顶级项目。

* 2010年9月,Hive脱离了Hadoop,成为Apache的顶级项目。

* 2010年9月,Pig脱离Hadoop,成为Apache的顶级项目。

* ZooKeeper脱离Hadoop,在2011年1月成为Apache的顶级项目。

* 2012年8月,纱线成为一个Hadoop子项目。

* 2012年10月,首个Hadoop原生MPP查询引擎Impala加入了Hadoop生态系统。

* 2014年2月,Spark逐渐取代MapReduce成为Hadoop的缺省执行引擎,并成为阿帕奇基金会的顶级项目。

* 2015年10月,Cloudera宣布推出第一款Hadoop本机存储替代产品,仅次于HBase ——Kudu。

* 2015年12月,Cloudera发起的Impala和Kudu项目加入了Apache孵化器。

好吧,让我们向照片里的每个人说晚安。已经很晚了。该睡觉了。在下一章,我们会问,“我是谁?”~思考的灵魂

全面了解糖化血红蛋白酶:值得拥有的NoSQL数据库(1)

参考文章

https://blog.csdn.net/lfq1532632051/article/details/53219558

全面了解糖化血红蛋白酶:值得拥有的NoSQL数据库(1)