一起聊聊Redis變慢的原因及檢驗方法-Redis-PHP中文網

這篇文章為大家帶來了關於Redis的相關知識，其中主要介紹了關於Redis變慢的原因及排查方法的相關問題，下面一起來看一下，希望對大家有幫助。

一起聊聊Redis變慢的原因及檢驗方法

推薦學習：Redis影片教學

#原因1：實例記憶體達到上限

排查想法

如果你的Redis 實例設定了記憶體上限maxmemory，那麼也有可能導致Redis 變慢。

當我們把 Redis 當做純快取使用時，通常會為這個實例設定一個記憶體上限 maxmemory，然後設定一個資料淘汰策略。而當實例的記憶體達到了 maxmemory 後，你可能會發現，在此之後每次寫入新數據，操作延遲變大了。

導致變慢的原因

當Redis 記憶體達到maxmemory 後，每次寫入新的資料之前，Redis 必須先從實例中踢出一部分數據，讓整個實例的記憶體維持在maxmemory 之下，然後才能把新資料寫進來。

這個踢出舊資料的邏輯也是需要消耗時間的，而具體耗時的長短，要取決於你配置的淘汰策略：

allkeys-lru：不管key是否設定了過期，淘汰最近最少訪問的key
volatile-lru：只淘汰最近最少訪問、並設定了過期時間的key
allkeys-random：不管key 是否設定了過期，隨機淘汰key
volatile-random：只隨機淘汰設定了過期時間的key
allkeys-ttl：不管key 是否設定了過期，淘汰即將過期的key
noeviction：不淘汰任何key，實例記憶體達到maxmeory 後，再寫入新資料直接回傳錯誤
allkeys-lfu：不管key 是否設定了過期，淘汰存取頻率最低的key（4.0 版本支援）
volatile-lfu：只淘汰訪問頻率最低、並設定了過期時間key（4.0 版本支援）

具體使用哪種策略，我們需要根據特定的業務場景來配置。一般最常使用的是allkeys-lru / volatile-lru 淘汰策略，它們的處理邏輯是，每次從實例中隨機取出一批key（這個數量可配置），然後淘汰一個最少訪問的key，之後把剩下的key 暫存到一個池子中，繼續隨機取一批key，並與先前池子中的key 比較，再淘汰一個最少訪問的key。以此往復，直到實例記憶體降到 maxmemory 之下。

需要注意的是，Redis 的淘汰資料的邏輯與刪除過期key 的一樣，也是在命令真正執行之前執行的，也就是說它也會增加我們操作Redis 的延遲，而且，寫OPS越高，延遲也會越明顯。

另外，如果此時你的 Redis 實例中還儲存了 bigkey，那麼在淘汰刪除 bigkey 釋放記憶體時，也會耗時比較久。

看到了麼？ bigkey 的危害到處都是，這也是前面我提醒你盡量不儲存 bigkey 的原因。

解決方案

避免儲存bigkey，降低釋放記憶體的耗時
淘汰策略改為隨機淘汰，隨機淘汰比LRU要快很多（視業務狀況調整）
分割實例，把淘汰key 的壓力分攤到多個實例上
如果使用的是Redis 4.0 以上版本，開啟layz-free 機制，把淘汰key 釋放記憶體的操作放到後台執行緒執行（設定lazyfree-lazy-eviction = yes）

原因2：開啟記憶體大頁

#排查想法

我們都知道，應用程式向作業系統申請記憶體時，是按記憶體頁申請的，而常規的記憶體頁大小是4KB。
Linux 核心從 2.6.38 開始，支援了記憶體大頁機制，該機制允許應用程式以 2MB 大小為單位，向作業系統申請記憶體。
應用程式每次向作業系統申請的記憶體單位變大了，但這也意味著申請記憶體的耗時變長。

導致變慢的原因

當 Redis 在執行後台 RDB 和 AOF rewrite 時，會採用 fork 子程序的方式來處理。但主進程 fork 子進程後，此時的主進程依舊是可以接收寫入請求的，而進來的寫入請求，會採用 Copy On Write（寫時複製）的方式操作記憶體資料。
也就是說，主程序一旦有數據需要修改，Redis 並不會直接修改現有記憶體中的數據，而是先將這塊記憶體資料拷貝出來，再修改這塊新記憶體的數據，這就是所謂的「寫時複製」。
寫時複製你也可以理解成，誰需要發生寫入操作，誰就需要先拷貝，再修改。
這樣做的好處是，父進程有任何寫入操作，並不會影響子進程的資料持久化（子進程只持久化fork 這一瞬間整個實例中的所有資料即可，不關心新的資料變更，因為子進程只需要一份記憶體快照，然後持久化到磁碟上）。
但是請注意，主進程在拷貝記憶體資料時，這個階段就涉及到新記憶體的申請，如果此時作業系統開啟了記憶體大頁，那麼在此期間，客戶端即便只修改10B 的數據，Redis 在申請記憶體時也會以2MB 為單位向作業系統申請，申請記憶體的耗時變長，進而導致每個寫入請求的延遲增加，影響到Redis 效能。
同樣地，如果這個寫請求操作的是一個 bigkey，那麼主程序在拷貝這個 bigkey 記憶體區塊時，一次申請的記憶體會更大，時間也會更久。可見，bigkey 在這裡又一次影響到了效能。

解決方案

#關閉記憶體大頁機制。

首先，你需要查看Redis 機器是否開啟了記憶體大頁：

$ cat /sys/kernel/mm/transparent_hugepage/enabled [always] madvise never

登入後複製

如果輸出選項是always，就表示目前開啟了記憶體大頁機制，我們需要關掉它：

$ echo never > /sys/kernel/mm/transparent_hugepage/enabled

登入後複製

其實，作業系統提供的記憶體大頁機制，其優點是，可以在一定程式上降低應用程式申請記憶體的次數。

但是對於 Redis 這種對效能和延遲極其敏感的資料庫來說，我們希望 Redis 在每次申請記憶體時，耗時盡量短，所以我不建議你在 Redis 機器上開啟這個機制。

原因3：使用Swap

檢查思路

#如果你發現Redis 突然變得非常慢，每次的操作耗時都達到了幾百毫秒甚至秒級，那此時你就需要檢查Redis 是否使用到了Swap，在這種情況下Redis 基本上已經無法提供高效能的服務了。

導致變慢的原因

什麼是 Swap？為什麼使用 Swap 會導致 Redis 的效能下降？

如果你對作業系統有些了解，就會知道作業系統為了緩解記憶體不足對應用程式的影響，允許把一部分記憶體中的資料換到磁碟上，以達到應用程式對記憶體使用的緩衝，這些記憶體資料換到磁碟上的區域，就是Swap。

問題就在於，當記憶體中的資料換到磁碟上後，Redis 再存取這些資料時，就需要從磁碟上讀取，存取磁碟的速度要比存取記憶體慢幾百倍！尤其是針對 Redis 這種對效能要求極高、效能極為敏感的資料庫來說，這個操作延遲是無法接受的。

此時，你需要檢查 Redis 機器的記憶體使用情況，確認是否存在使用了 Swap。你可以透過以下方式來查看 Redis 進程是否使用到了 Swap：

# 先找到 Redis 的进程 ID $ ps -aux | grep redis-server # 查看 Redis Swap 使用情况 $ cat /proc/$pid/smaps | egrep '^(Swap|Size)'

登入後複製

輸出結果如下

Size: 1256 kB Swap: 0 kB Size: 4 kB Swap: 0 kB Size: 132 kB Swap: 0 kB Size: 63488 kB Swap: 0 kB Size: 132 kB Swap: 0 kB Size: 65404 kB Swap: 0 kB Size: 1921024 kB Swap: 0 kB ...

登入後複製

這個結果會列出 Redis 流程的記憶體使用量。

每一行Size 表示Redis 所使用的一塊內存大小，Size 下面的Swap 就表示這塊Size 大小的內存，有多少資料已經被換到磁碟上了，如果這兩個值相等，說明這區塊記憶體的資料都已經完全被換到磁碟上了。

如果只是少量資料被換到磁碟上，例如每一塊 Swap 佔對應 Size 的比例很小，那麼影響並不是很大。如果是幾百兆甚至上 GB 的記憶體被換到了磁碟上，那麼你就需要警惕了，這種情況 Redis 的效能肯定會急劇下降。

解決方案