一、进行迁移的原因

由于业务的发展，使用mysql进行建立索引进行搜索已经造成数据流的瓶颈卡在了数据库io，例如每次dump全表的时候，会造成压力过大，造成耗时很长，并且当前的数据量基本上已经达到了亿级别的数据量，如果希望mysql能更好的提供服务，下一步必须考虑分库分表才可以；基于这种情况下，考虑使用hbase用来进行数据的存储，因为hbase所能承受的数据量远大于mysql，并且对列的扩展也很方便

二、关系型数据库与Nosql的一些区别

（1）存储方式的区别

在类似mysql，sqlserver，oracle等关系型数据库，数据的存储是按照行进行存储的，如下图所示：

但是在hbase里面，所有的数据是基于列进行存储的，如下所示：

其中hbase的逻辑模型如下所示：

其中：com.cnn.ww对应的是rowkey，相当于mysql的主键的概念

contents，anchor：这两个对应的是列族的概念，在物理的存储上，同一个列族的数据存储在相同文件

cnnsi.com，mylook.ca：对应的是列族下面的列，在hbase中列是可以动态增加的

对应的方格数据表示的是单元数据，即对应rowkey，cf：column下面的具体的值

其中tn：表示的是时间戳，单元数据的不同版本

其中有一张存储结构如下：

（2）CRUD一些区别

CRUD是数据库的最基本也是最常用的操作，在hbase里面也有对应的命令，例如建表语句对于mysql的在此不详述，对于hbase shell的如下所示

create ‘table’，‘columnfamily’

即可以创建一个名为table，列族为columnfamily的表，其他的一些blocksize，version数据为默认

读取数据的时候，在hbase语句如：get ‘table’，'row',‘cf:column’即可得到对应的数据

更新数据的时候，在hbase中没有对应更新的概念，只是会有一个新的版本，从时间戳上可以体现出来，所用的语句为

put ‘table’，‘row’，‘cf：name’，‘value’

即可将value的值赋给对应cf列族，name的列

删除数据的区别，在mysql中删除数据只能是直接删除一行，或者将某一列置为空，在hbase里面可以直接删除某一列

（3）索引的区别

在mysql中可以建立索引，或者过滤查询，但是在hbase中，只支持按照rowkey进行查询速率最快

（4）从mysql到nosql的发展的思考

关系型数据库的历史已经很久，但是当数据量膨胀之后，例如对于mysql数据库，当数据量为上亿或者更多的时候，如果按照索引进行查询，可能效果也不是特别的明显，最后只能按照主键进行查询，或者逐渐发展为分库分表的模式，但是分库分表又给运维以及使用带来了很大的麻烦；于是这个时候，nosql数据库主键发展，nosql简称not only sql，是在数据量暴增的当前逐渐发展壮大起来，以nosql里面的hbase作为例子，支持TB以及PB的数据，并且列的扩展特别的灵活