主倉庫包含一段代碼(bench/bench.py),它能在 EC2 上自動完成分布式基準。
它引導 N 個節(jié)點,一些運行 nsqd,一些運行加載生成工具(PUB 和 SUB),并分析它們的輸出來提供聚合。
下面的代碼反應了默認參數(shù)6 c3.2xlarge,這個實例支持 1g 比特的連接。3 個節(jié)點運行 nsqd 實例,剩下的運行 bench_reader (SUB) 和 bench_writer (PUB) 實例,來生成依賴于基準模式的負載。
$ ./bench/bench.py --access-key=... --secret-key=... --ssh-key-name=...
[I 140917 10:58:10 bench:102] launching 6 instances
[I 140917 10:58:12 bench:111] waiting for instances to launch...
...
[I 140917 10:58:37 bench:130] (1) bootstrapping ec2-54-160-145-64.compute-1.amazonaws.com (i-0a018ce1)
[I 140917 10:59:37 bench:130] (2) bootstrapping ec2-54-90-195-149.compute-1.amazonaws.com (i-0f018ce4)
[I 140917 11:00:00 bench:130] (3) bootstrapping ec2-23-22-236-55.compute-1.amazonaws.com (i-0e018ce5)
[I 140917 11:00:41 bench:130] (4) bootstrapping ec2-23-23-40-113.compute-1.amazonaws.com (i-0d018ce6)
[I 140917 11:01:10 bench:130] (5) bootstrapping ec2-54-226-180-44.compute-1.amazonaws.com (i-0c018ce7)
[I 140917 11:01:43 bench:130] (6) bootstrapping ec2-54-90-83-223.compute-1.amazonaws.com (i-10018cfb)
這個基準僅反應了生產(chǎn)者吞吐量。消息體有 100 個字節(jié),并且消息通過 3 個話題(topic)分布。
$ ./bench/bench.py --access-key=... --secret-key=... --ssh-key-name=... --mode=pub --msg-size=100 run
[I 140917 12:39:37 bench:140] launching nsqd on 3 host(s)
[I 140917 12:39:41 bench:163] launching 9 producer(s) on 3 host(s)
...
[I 140917 12:40:20 bench:248] [bench_writer] 10.002s - 197.463mb/s - 2070549.631ops/s - 4.830us/op
入口處 ~2.07mm msgs/sec,使用了 197mb/s 的帶寬。
通過服務生產(chǎn)者和消費者,這個基準更加準確的反應了實際情況。這個消息也是 100 個字節(jié),并且通過 3 個話題(topic)分布,每個都包含一個 通道(channel)(每個 通道(channel) 24 個客戶端)。
$ ./bench/bench.py --access-key=... --secret-key=... --ssh-key-name=... --msg-size=100 run
[I 140917 12:41:11 bench:140] launching nsqd on 3 host(s)
[I 140917 12:41:15 bench:163] launching 9 producer(s) on 3 host(s)
[I 140917 12:41:22 bench:186] launching 9 consumer(s) on 3 host(s)
...
[I 140917 12:41:55 bench:248] [bench_reader] 10.252s - 76.946mb/s - 806838.610ops/s - 12.706us/op
[I 140917 12:41:55 bench:248] [bench_writer] 10.030s - 80.315mb/s - 842149.615ops/s - 11.910us/op
入口處的 ~842k ~806k msgs/s, 合計消費帶寬 156mb/s,我們已經(jīng)盡力提升了 nsqd 節(jié)點的 CPU 處理能力。通過引入消費者,nsqd 需要維持每個 通道(channel),因此負載自然會高一點。
消費者的數(shù)量略微少于生產(chǎn)者,因為消費者發(fā)送2次命令(每個消息都要發(fā)送 FIN 命令)。
增加兩個節(jié)點(一個是 nsqd 另一個是產(chǎn)生負載),達到了 1mm msgs/s:
$ ./bench/bench.py --access-key=... --secret-key=... --ssh-key-name=... --msg-size=100 run
[I 140917 13:38:28 bench:140] launching nsqd on 4 host(s)
[I 140917 13:38:32 bench:163] launching 16 producer(s) on 4 host(s)
[I 140917 13:38:43 bench:186] launching 16 consumer(s) on 4 host(s)
...
[I 140917 13:39:12 bench:248] [bench_reader] 10.561s - 100.956mb/s - 1058624.012ops/s - 9.976us/op
[I 140917 13:39:12 bench:248] [bench_writer] 10.023s - 105.898mb/s - 1110408.953ops/s - 9.026us/op
聲明:請牢記 NSQ 設計的初衷是分布式。單個節(jié)點的性能非常重要,但這并不是我們所追求的。
$ ./bench.sh
results...
PUB: 2014/01/12 22:09:08 duration: 2.311925588s - 82.500mb/s - 432539.873ops/s - 2.312us/op
SUB: 2014/01/12 22:09:19 duration: 6.009749983s - 31.738mb/s - 166396.273ops/s - 6.010us/op
$ ./bench.sh
results...
PUB: 2014/01/13 16:58:05 duration: 1.411492441s - 135.130mb/s - 708469.965ops/s - 1.411us/op
SUB: 2014/01/13 16:58:16 duration: 5.251380583s - 36.321mb/s - 190426.114ops/s - 5.251us/op