更新时间:2024-03-01 16:10
Cassandra是一套开源分布式NoSQL数据库系统。它最初由Facebook开发,用于储存收件箱等简单格式数据,集GoogleBigTable的数据模型与Amazon Dynamo的完全分布式的架构于一身。Facebook于2008将 Cassandra 开源,此后,由于Cassandra良好的可扩展性,被Digg、Twitter等知名Web 2.0网站所采纳,成为了一种流行的分布式结构化数据存储方案。
● 分布式
● 基于column的结构化
● 高伸展性
Cassandra的主要特点就是它不是一个数据库,而是由一堆数据库节点共同构成的一个分布式网络服务,对Cassandra 的一个写操作,会被复制到其他节点上去,对Cassandra的读操作,也会被路由到某个节点上面去读取。对于一个Cassandra集群来说,扩展性能是比较简单的事情,只管在集群里面添加节点就可以了。
这里有很多理由来选择Cassandra用于您的网站。和其他数据库比较,有三个突出特点:
使用Cassandra,像文档存储,你不必提前解决记录中的字段。你可以在系统运行时随意的添加或移除字段。这是一个惊人的效率提升,特别是在大型部署上。
Cassandra是纯粹意义上的水平扩展。为给集群添加更多容量,可以指向另一台电脑。你不必重启任何进程,改变应用查询,或手动迁移任何数据。
你可以调整你的节点布局来避免某一个数据中心起火,一个备用的数据中心将至少有每条记录的完全复制。
一些使Cassandra提高竞争力的其他功能:
如果你不喜欢全部的键值查询,则可以设置键的范围来查询。
在混合模式可以将超级列添加到5维。对于每个用户的索引,这是非常方便的。
有可以在任何地方任何时间集中读或写任何数据。并且不会有任何单点失败。
应用客户facebook
以Cassandra 1.0.2为例。
下载Cassandra、Jre 1.6。(全部推荐最新版本)
(1)安装Jre的过程很简单,这里不做说明。
(2)在“系统属性”中打开“环境变量”窗口,添加Java环境的系统变量:
(1)解压下载的Cassandra文件包,放置到一个目录中。
注意程序所在的路径中不要包含空格,以避免造成加载某些文件找不到的问题。
(2)在“系统属性”中打开“环境变量”窗口,添加Cassandra运行环境的系统变量:
(3)修改日志存放地址
打开文件: log4j-server.properties,修改
(4)修改其它地址
打开文件:cassandra.yaml,修改:
data_file_directories:
根据实际安装路径设置。
(5)修改内存大小和CPU核心数设置
*)
# assume reasonable defaults for e.g. a modern desktop or
# cheap server
;;
按照实际情况设置。
在命令提示符工具中启动Cassandra,用nodetool工具确认Cassandra已经启动: