1.開篇Redis 在 2.8.9 版本添加了 HyperLogLog 結(jié)構(gòu)。 Redis HyperLogLog 是用來做基數(shù)統(tǒng)計(jì)的算法,HyperLogLog 的優(yōu)點(diǎn)是,在輸入元素的數(shù)量或者體積非常非常大時(shí),計(jì)算基數(shù)所需的空間總是固定的、并且是很小的。 在 Redis 里面,每個(gè) HyperLogLog 鍵只需要花費(fèi) 12 KB 內(nèi)存,就可以計(jì)算接近 2^64 個(gè)不同元素的基 數(shù)。這和計(jì)算基數(shù)時(shí),元素越多耗費(fèi)內(nèi)存就越多的集合形成鮮明對(duì)比。 但是,因?yàn)?HyperLogLog 只會(huì)根據(jù)輸入元素來計(jì)算基數(shù),而不會(huì)儲(chǔ)存輸入元素本身,所以 HyperLogLog 不能像集合那樣,返回輸入的各個(gè)元素。 比如數(shù)據(jù)集 {1, 3, 5, 7, 5, 7, 8}, 那么這個(gè)數(shù)據(jù)集的基數(shù)集為 {1, 3, 5 ,7, 8},基數(shù)(不重復(fù)元素)為5。 基數(shù)估計(jì)就是在誤差可接受的范圍內(nèi),快速計(jì)算基數(shù)。
2.Redis HyperLogLog的相關(guān)命令序號(hào) | 命令及描述 |
---|
1 | PFADD key element [element...] 添加指定元素到 HyperLogLog 中。 | 2 | PFCOUNT key [key...] 返回給定 HyperLogLog 的基數(shù)估算值。 | 3 | PFMERGE destkey sourcekey [sourcekey...] 將多個(gè) HyperLogLog 合并為一個(gè) HyperLogLog |
2.1 PFADD命令Redis Pfadd 命令將所有元素參數(shù)添加到 HyperLogLog 數(shù)據(jù)結(jié)構(gòu)中。 語法redis 127.0.0.1:6379> PFADD key element [element ...] 返回值整型,如果至少有個(gè)元素被添加返回 1, 否則返回 0。
2.2 PFCOUNT命令Redis Pfcount 命令返回給定 HyperLogLog 的基數(shù)估算值。 語法redis 127.0.0.1:6379> PFCOUNT key [key ...] 返回值整數(shù),返回給定 HyperLogLog 的基數(shù)值,如果多個(gè) HyperLogLog 則返回基數(shù)估值之和。

2.3 PFMERGE命令Redis PFMERGE 命令將多個(gè) HyperLogLog 合并為一個(gè) HyperLogLog ,合并后的 HyperLogLog 的基數(shù)估算值是通過對(duì)所有 給定 HyperLogLog 進(jìn)行并集計(jì)算得出的。 語法redis 127.0.0.1:6379> PFMERGE destkey sourcekey [sourcekey ...] 返回值返回 OK。

|