[Cassandra教程] （五）Cassandra自带工具介绍

Cassandra 自带了多个集群或数据管理工具，本文接下来简要介绍一下，欲知详情还是推荐大家自己啃一遍英文文档。下面是本文将会介绍到的工具：

nodetool utility CQL shell cassandra utility cassandra-stress tool SSTable utilities 一、Nodetool

nodetool 是一个进行集群管理的利器，功能强大繁杂，通过命令行方式操作，标准使用方式如下：

$ nodetool [options] command [args]

下面是一个常用option list

Short Long Description -h --host Hostname or IP address -p --port Port number -pwf --password-file Password file path -pw --password Password -u --username User name

如果是tar包方式安装，nodetool工具位于安装目录的./bin 目录内。

通常情况需要通过 -h+ip指定nodetool操作对应的集群中node节点，但是如果你要操作的都是当前节点，也可以省略掉这个选项。

nodetool操作内容炒鸡炒鸡的多，保准看花了你的眼，所以我们需要知道他的 help 命令，如下：

# 列出nodetool所有可用的命令 $ nodetoolhelp # 列出指定command 的帮助内容 $ nodetoolhelpcommand-name # 例如：查看status 命令的详细帮助内容 $ nodetoolhelpstatus

请大家务必记住上面个两个help命令，常用且实用。

下面介绍一下常用的几个nodetool command：

1、查看集群运行状态

$ nodetoolstatus

执行结果类似下图：

2、移除某个废弃节点

# 命令模板 $ nodetool <options> removenode -- <status> | <force> | <ID> # 使用实例 # 移除Host ID为d0844a21-3698-4883-ab66-9e2fd5150edd的节点 $ nodetoolremovenoded0844a21-3698-4883-ab66-9e2fd5150edd # 查看节点删除状态 $ nodetoolremovenodestatus

3、其他

# 参看某个节点负载，内存使用情况 $ nodetoolinfo # 查看各个CF的详细统计信息，包括读写次数、响应时间、memtable信息等 $ nodetoolcfstats # 其他 $ nodetoolhelp

参考文献

原文链接 : http://www.flyml.net/2016/09/06/cassandra-tutorial-tools-used

二、CQL shell

cqlsh是一个通过CQL（ Cassandra Query Language）来与Cassandra集群中的数据进行交互的命令行工具，可以在 ./bin 目录内找到。

cqlsh本身基于python 2.7，所以可能需要事先有python 2.7环境（如果采用python 2.7.11+版本可能会报错 ‘ref() does not take keyword arguments’，可以将python降级，或者升级Cassandra版本即可解决，参见连接）。

cqlsh的help类似nodetool，单help 列出所有命令，help + command列出该命令详细信息

# 连接本机cql shell，如果Cassandra.yaml 配置了listen 的rpc_address和rpc_port， # 则需连接此ip-port $ cqlsh [options] [host [port]]

下面通过一个实例介绍一下cqlsh的基本使用，实例参考自此处。

1、进入到命令行交互模式，查看当前的keyspace有哪些

cqlsh> desckeyspaces; systemmykeyspaceOpsCentersystem_traces

2、使用SimpleStrategy策略创建一个新的keyspace，Cassandra里的keyspace对应mysql里的database的概念，这种策略不会区分不同的数据中心和机架，数据复制份数为2，也就是说同一份数据最多存放在两台机器上

cqlsh> CREATEKEYSPACEtestks WITHreplication = { 'class': 'SimpleStrategy', 'replication_factor': '2' };

Cassandra中之前是没有表的概念，之前叫Column Family，现在这个概念逐渐被淡化，像CQL中就直接称作Table，和传统数据库中表是一个意思。但是和传统数据库表的明显区别是必须有主键，因为一个表的数据可能是分布在多个机器上的，Cassandra使用主键来做分区，常用的分区方法有Murmur3Partioner、RandomPartitioner、ByteOrderedPartioner，一般默认使用第一个它的效率和散列性更好。还一个非常让人振奋的特性是列支持List、Set、Map三种集合类型，不仅仅是整形、字符串、日期等基本类型了，这给很多数据存储带来极大方便，比如一个用户帐号对应多个Email地址，或者一个事件对应多个属性等，就可以分别使用List和Map来表示，并且支持对集合的追加操作，这对一些追加的场景就特别方便，比如我们在做Velocity计算时，同一个Key值往往对应多条记录，比如记录一个IP过去3个月所有的登陆信息，就可以放在List中来表示，而不用拆成多条来存储了。

3、创建一个表

cqlsh:testks> createtablemytab (idtext,List<text>) ; cqlsh:testks> desctablemytab; CREATETABLEmytab ( idtext, valueslist<text>, PRIMARYKEY (id) ) WITH bloom_filter_fp_chance=0.010000 AND caching='KEYS_ONLY' AND comment='' AND dclocal_read_repair_chance=0.000000 AND gc_grace_seconds=864000 AND index_interval=128 AND read_repair_chance=0.100000 AND replicate_on_write='true' AND populate_io_cache_on_flush='false' AND default_time_to_live=0 AND speculative_retry='99.0PERCENTILE' AND memtable_flush_period_in_ms=0 AND compaction={'class': 'SizeTieredCompactionStrategy'} AND compression={'sstable_compression': 'LZ4Compressor'};

bloom_filter_fp_change：在进行读请求操作时，Cassandra首先到Row Cache中查看缓存中是否有结果，如果没有会看查询的主键是否Bloom filter中，每一个SSTable都对应一个Bloom filter，以便快速确认查询结果在哪个SSTable文件中。但是共所周知，Bloom filter是有一定误差的，这个参数就是设定它的误差率。

caching：是否做Partition Key的缓存，它用来标明实际数据在SSTable中的物理位置。Cassandra的缓存包括Row Cache、Partitioin Key Cache，默认是开启Key Cache，如果内存足够并且有热点数据开启Row Cache会极大提升查询性能，相当于在前面加了一个Memcached。

memtable_flush_period_in_ms：Memtable间隔多长时间把数据刷到磁盘，实际默认情况下Memtable一般是在容量达到一定值之后会被刷到SSTable永久存储。

compaction：数据整理方式，Cassandra进行更新或删除操作时并不是立即对原有的旧数据进行替换或删除，这样会影响读写的性能，而是把这些操作顺序写入到一个新的SSTable中，而在定期在后台进行数据整理，把多个SSTable进行合并整理。合并的策略有SizeTieredCompactionStrategy和LeveledCompactionStrategy两种策略，前者比较适合写操作比较多的情况，后者适合读比较多的情况。

compression：是否对存储的数据进行压缩，一般情况下数据内容都是文本，进行压缩会节省很多磁盘空间，但会稍微消耗一些CPU时间。除了LZ4Compressor这种默认的压缩方式外，还有SnoopyCompressor等压缩方式，这种是Google发明的，号称压缩速度非常快，但压缩比一般。

4、插入一条数据到数据表中

cqlsh:testks> insertintomytab(id,values) values('100',['hello','world']); cqlsh:testks> select * frommytab; id| values -----+-------------------- 100 | ['hello', 'world'] (1 rows)

5、追加一个值到List元素中

cqlsh:testks> updatemytabsetvalues=values+['My name is Brian'] whereid='100'; cqlsh:testks> select * frommytab; id| values -----+---------------------------------------- 100 | ['hello', 'world', 'My name is Brian']

6、对某一行数据或集合中的某一个值设置过期时间，单位为秒

cqlsh:testks> updatemytabusingttl 60 setvalues=values+['Who are you'] whereid='100'; cqlsh:testks> select * frommytab; id| values -----+------------------------------------------------------- 100 | ['hello', 'world', 'My name is Brian', 'Who are you'] (1 rows) cqlsh:testks> select * frommytab; id| values -----+---------------------------------------- 100 | ['hello', 'world', 'My name is Brian']

参考文献1

参考文献2

原文链接 : http://www.flyml.net/2016/09/06/cassandra-tutorial-tools-used

三、cassandra utility

Cassandra utility 其实是Cassandra提供的一个启动时配置接口，也就是说通过这个方法可以配置C*启动参数，例如运行时java heap size等。

根据安装方式的不同，C*工具使用方法也略有不同，如下：

# 1、在 conf/cassandra-env.sh 中添加运行参数 # 适用于：tar包安装或pachage安装 JVM_OPTS="$JVM_OPTS -D[PARAMETER]" # 2、在启动C*的命令行后直接跟运行参数 # 适用于：tar包安装 $ cassandra [PARAMETERS] # 例如： cassandra-env.sh: JVM_OPTS="$JVM_OPTS -Dcassandra.load_ring_state=false" 命令行: $ bin/cassandra -Dcassandra.load_ring_state=false

下面是一些仅支持命令行方式的选项：

Option Description

[Cassandra教程] （五）Cassandra自带工具介绍

Trending Articles

《踏血寻梅》拍援交妹命案春夏露点争新人奖

uni.requestPayment,支付报错，"errMsg":"requestPayment:fail:[payment微信:-1]General...

出售: 100% New 抗鼻敏感噴霧 Budesonide PH&T 50 x 3

博讯｜张磊帮助下，李源潮的儿子被耶鲁录取

日活罗曼晴色粉红电影系列目录

有人買民雄嘉大博識嗎?(或美銓建設以前的建案)

[一般] 至尊不動劍成長進化史給大家參考

[心得] 從來沒碰過魔獸世界的新手照過來,一篇文章就讓你快速上手!

[搬運][ANi] 愛有點沉重的暗黑精靈從異世界緊追不放 - 07 [1080P][Baha][WEB-DL][AAC AVC][CHT][MP4]

請問Rogue這個故障燈號是什麼意思？

Artweaver 7.0.17 免安裝中文版 (8.0.4 安裝版) - 小型繪圖軟體

原中国500强建企工程款断崖式下降生存艰难

出售:美國JBL,Paul Audio 出品15吋低音喇叭

清查Cisco Switch port mapping

RAV4 E-Mirror電子式後視鏡無法連線

星露谷最新200+MOD整合包V2.0！爱的实验室+山谷女孩

bundle.load 不回调

creator的editbox怎么隐藏键盘

【查】土星在第三宫的表现 (豆瓣草菇@占星社区小组)

360度无死角偷窥胖次！成人游戏「VR女友」DEMO试玩公开！