redis高级用法：慢查询、pipline与事务、发布订阅、bitmap位图、HyperLogLog、GEO地理位置

zjyao / 2023-08-29 / 原文

一高级用法之慢查询
- 1.1 生命周期
- 1.2 两个配置
  - 1.2.1 slowlog-max-len
  - 1.2.2 slowlog-max-len
- 1.3 设置慢查询
- 1.5 作用
二 pipline与事务
- 2.1 什么是pipeline(管道)
- 2.2 python客户端实现pipline
- 2.3 与原生操作对比
- 2.4 使用建议
- 2.5 原生redis操作操作事务
三发布订阅
- 3.1 角色
- 3.2 模型
- 3.3 使用
四 bitmap位图
- 4.1 位图是什么
- 4.3 独立用户统计
五 HyperLogLog
- 5.1 介绍
- 5.2 三个命令
六 GEO地理位置信息
- 6.1 介绍
- 6.2 案例

一高级用法之慢查询

1.1 生命周期

配置一个时间，如果查询时间超过了我们设置的时间，我们就认为这是一个慢查询
配置的慢查询，只在命令执行阶段
客户端超时不一定慢查询，但慢查询是客户端超时的一个可能因素

1.2 两个配置

1.2.1 slowlog-max-len

慢查询是一个先进先出的队列
固定长度
保存在内存中

1.2.2 slowlog-max-len

慢查询阈值（单位：微秒）

slowlog-log-slower-than=0，记录所有命令
slowlog-log-slower-than <0,不记录任何命令

1.3 设置慢查询

# 慢查询演示
	-设置慢查询--->只要超过某个时间的命令--->都会保存起来
    # 设置记录所有命令
    CONFIG SET slowlog-log-slower-than 0
    # 最多记录100条
    config set slowlog-max-len 100
    # 持久化到本地配置文件
    config rewrite
    
# 就会记录所有命令了


## 1.4 查看慢查询队列
```python
slowlog get [n]
slowlog len #获取慢查询队列长度
slowlog reset #清空慢查询队列

1.5 作用

# 有什么用，如何聊？
	-公司好多项目用这一个redis实例
    -最近公司发现，redis响应非常慢
    -通过排查它的 慢查询-->排查出一些慢命令
    -找到对应的执行项目--->位置
   	-避免再执行这些命令了

二 pipline与事务

2.1 什么是pipeline(管道)

Redis的pipeline(管道)功能在命令行中没有，但redis是支持pipeline的，而且在各个语言版的client中都有相应的实现

将一批命令，批量打包，在redis服务端批量计算(执行)，然后把结果批量返回

1次pipeline(n条命令)=1次网络时间+n次命令时间

pipeline期间将“独占”链接，此期间将不能进行非“管道”类型的其他操作，直到pipeline关闭；如果你的pipeline的指令集很庞大，为了不干扰链接中的其他操作，你可以为pipeline操作新建Client链接，让pipeline和其他正常操作分离在2个client中。不过pipeline事实上所能容忍的操作个数，和socket-output缓冲区大小/返回结果的数据尺寸都有很大的关系；同时也意味着每个redis-server同时所能支撑的pipeline链接的个数，也是有限的，这将受限于server的物理内存或网络接口的缓冲能力

2.2 python客户端实现pipline

import redis
pool = redis.ConnectionPool(host='10.211.55.4', port=6379)
r = redis.Redis(connection_pool=pool)
# pipe = r.pipeline(transaction=False)
#创建pipeline
pipe = r.pipeline(transaction=True)
#开启事务
pipe.multi()
pipe.set('name', 'lqz')
#其他代码，可能出异常

pipe.set('role', 'nb')
pipe.execute()  # 事务的执行

2.3 与原生操作对比

通过pipeline提交的多次命令，在服务端执行的时候，可能会被拆成多次执行，而mget等操作，是一次性执行的，所以，pipeline执行的命令并非原子性的

2.4 使用建议

1 注意每次pipeline携带的数据量

2 pipeline每次只能作用在一个Redis的节点上

3 M(mset，mget….)操作和pipeline的区别

2.5 原生redis操作操作事务

三发布订阅

3.1 角色

# 发布者发布了消息，所有的订阅者都可以收到，就是生产者消费者模型（后订阅了，无法获取历史消息）
# 设计模式的：观察者模式

3.2 模型

3.3 使用

# 发布消息，向lqz频道发送了hellowrold-->不会有人收到--->没有人订阅
publish lqz "hello world"

# 订阅消息客户端1
subscribe lqz
# 订阅消息客户端2
subscribe lqz


# 发布订阅和消息队列的区别
发布订阅，订阅者都能收到，
消息队列有个抢的过程，只有一个抢到

四 bitmap位图

4.1 位图是什么

4.3 独立用户统计

-假设有1亿用户，假设5千万活跃--->统计日活
	-使用集合：大约需要200m
    -使用bitmap位图：大约需要12m内存
-如果活跃用户量少，不适合用bitmap

数据类型	每个userid占用空间	需要存储用户量	全部内存量
set	32位(假设userid是整形，占32位)	5千万	32位*5千万=200MB
bitmap	1位	1亿	1位*1亿=12.5MB

# 面试题：
redis的key值最大多少 512M
redis的string 类型vaule值最大多少  512M

五 HyperLogLog

5.1 介绍

基于HyperLogLog算法：极小的空间完成独立数量统计

本质还是字符串

5.2 三个命令

# 基于HyperLogLog算法：极小的空间完成独立数量统计，去重

# 布隆过滤器

# 具体操作
pfadd uuids "uuid1" "uuid2" "uuid3" "uuid4"   # 增加值
pfcount uuids  # 统计个数

# 数据不能删除单个

# 跟集合很像，但是占的内存空间很小
    百万级别独立用户统计，百万条数据只占15k
    错误率 0.81%
    无法取出单条数据，只能统计个数
# 作用：
	-爬虫去重
    -黑白名单
    -垃圾邮件过滤
    -独立用户统计
    	-有个用户登录，就把用户id放到HyperLogLog中
        -最后只需要统计一下 个数  就能统计出今天的活跃人数

六 GEO地理位置信息

6.1 介绍

GEO（地理信息定位）：存储经纬度，计算两地距离，范围等

# 类似于
	-附近的人，餐馆，医院
    -附近5km内的 xx
    -我距离某个好友的距离
    
    
# 经纬度哪里来？
	-前端(app,web),都是可以申请，获得经纬度的-->是前端做
    -前端拿到--->调用我们的一个接口--->把经纬度传入--->存起来-->redis的geo中
    -我要统计我附近5公里以内的好友
    	-需要我的经纬度
        -我所有好友的经纬度，已经在 redis的geo中存好了

6.2 案例

geoadd cities:locations 116.28 39.55 beijing 
geoadd cities:locations 117.12 39.08 tianjin
geoadd cities:locations 114.29 38.02 shijiazhuang
geoadd cities:locations 118.01 39.38 tangshan
geoadd cities:locations 115.29 38.51 baoding


# 计算两个地理位置的距离
geodist cities:locations beijing tianjin km


# 计算北京方圆 150km内的城市
georadiusbymember cities:locations beijing 90 km


# geo本质时zset类型