記一次mysql字符串末尾空白丟失的排查
一天,小伙伴找到我,他說他碰到一個很奇怪的問題
他說:明明表名的入參是 test ,為什么展示到界面的記錄包括 test 這條記錄?
他補充道:會不會是 MyBatis-Plus 做了什么騷操作,把 test 末尾的空格給拿掉了
我:你直接把 SQL 語句到 MySQL 執行下試試
結果如下:
這看起來不夠直觀,我移動下光標
然后我和小伙伴面面相覷
MySQL5 、 MySQL8 各準備一個
我們來看下默認情況下,末尾空白的判斷情況
MySQL 5.7.36 如下
1 表示 TRUE ,也就是相等
MySQL 8.0.27 如下
0 表示 FALSE ,表示不相等
這是什么原因,我們繼續往下看
字符集與字符序比較肯定就需要比較規則, SQL 的比較規則就離不開字符序,字符序又與字符集相關,所以我們一個一個來捋
字符集關于字符集,不是只言片語可以說清楚的,但是大家也不用擔心,網上相關資料已經非常多,大家擦亮慧眼去查閱即可
簡單點來說:字符集定義了字符和字符的編碼
有人又問了:字符、字符的編碼又是什么?
為了方便大家理解,舉個簡單栗子
有四個字符:A、B、C、D,這四個字符的編碼分別是 A = 0, B = 1, C = 2, D = 3
這里的字符(A、B、C、D) + 編碼(0、1、2、3)就構成了字符集(character set)
MySQL 支持的字符集有很多,可以通過 SHOW CHARACTER SET; 查看
Charset :字符集名
Description :描述
Default collation :默認字符序
Maxlen :每個字符最多字節數
字符序定義了字符的比較規則;字符間的比較按何種規則進行
一個字符集對應多個字符序,通過 SHOW COLLATION; 可以查看全部的字符序;也可以帶條件查具體某個字符集的字符序
Default 等于 Yes 表示是默認字符序
每個字符集都有默認的字符序
server的字符集與字符序當我們創建數據庫時,沒有指定字符集、字符序,那么server字符集、server字符序就會作為該數據庫的字符集、字符序
指定數據庫級別的字符集、字符序
同一個MySQL服務下的數據庫,可以分別指定不同的字符集、字符序
創建、修改數據庫的時候,可以通過 CHARACTER SET 、 COLLATE 指定數據庫的字符集、字符序
可以通過
table的字符集與字符序
創建、修改表的時候,可以通過 CHARACTER SET 、 COLLATE 指定表的字符集、字符序
可以通過
查看表的字符序
column的字符集與字符序
類型為 CHAR 、 VARCHAR 、 TEXT 的列,可以指定字符集、字符序
可以通過
查看字段的字符集和字符序
多個維度指定字符集、字符序的話,粒度越細的優先級越高( column > table > database > server )
如果細粒度未指定字符集、字符序,那么會繼承上一級的字符集,字符序則是上一級字符集的默認字符序
通常情況下我們一般不會指定 table 、 column 粒度的字符集、字符序
也就是說,通常情況下 column 的字符集會與 database 的字符集一致,而 column 的字符序則是 database 字符集的默認字符序
空白丟失上面講了那么多,跟空白丟失有什么關系?
大家先莫急,繼續往下看
MySQL5.7 The CHAR and VARCHAR Types中有這么一段
翻譯過來就是:
1、類型是 CHAR 、 VARCHAR 、 TEXT 列的值,會根據列的字符序來比較和排序
2、所有 MySQL 排序規則的類型都是 PAD SPACE 。這就意味著, CHAR 、 VARCHAR 、 TEXT 類型的值進行比較時,不用考慮任何末尾空格,LIKE 除外
3、不受 SQL mode 影響,也就是說不管是嚴格模式,還是非嚴格模式,都不影響 2 所說的規則
劃重點,記筆記:在 MySQL5.7 及以下( <=5.7 )版本中,排序規則都是 PAD SPACE ,末尾的空格會忽略不考慮
那如何讓末尾空格參與比較了,有三種處理方式
1、 BINARY ,類似 SELECT 'test' = BINARY 'test ';
2、 LIKE ,類似 SELECT 'test' LIKE 'test ';
3、 LENGTH 函數,類似
MySQL8 做了調整,The CHAR and VARCHAR Types 有如下說明
翻譯過來就是:
1、類型是 CHAR 、 VARCHAR 、 TEXT 列的值,會根據列的字符序來比較和排序
2、 MySQL 字符序的 pad 參數的可選值,除了 PAD SPACE ,還增加了 NO PAD
3、對于非二進制字符串( CHAR 、 VARCHAR 、 TEXT ),字符序 pad 參數決定如何去處理字符串末尾的空格
NO PAD 不會忽略末尾空格,會將其當做其他字符一樣對待
PAD SPACE 會忽略末尾空格, LIKE 除外
SQL mode 不參與字符串末尾空格的處理
MySQL8 server 維度的字符集是 utf8mb4 ,對應的默認字符序是: utf8mb4_0900_ai_ci
Pad_attribute 的值是 NO PAD ,也就是不會忽略字符串末尾的空格
所以在 MySQL8 中, SELECT 'test' = 'test '; 默認情況下得到的結果是 0
總結1、非二進制字符串( CHAR 、 VARCHAR 、 TEXT )比較時,末尾空格的處理跟列的字符序有直接關系
2、 MySQL5.7 及之前的版本,排序規則的類型都是 PAD SPACE ,會忽略字符串末尾的空格, LIKE 除外
3、 MySQL8 開始,字符序增加了一個參數 Pad_attribute ,該參數的值不同,對字符串末尾空格的處理方式不同
NO PAD :字符串末尾的空格會和其他字符一樣,不會被忽略
PAD SPACE :字符串末尾的空格會被忽略, LIKE 除外
4、如上針對的都是非二進制字符串的排序和比較,而不是儲存
參考The CHAR and VARCHAR Types
The CHAR and VARCHAR Types
再見亂碼:5分鐘讀懂MySQL字符集設置
到此這篇關于記一次mysql字符串末尾空白丟失的排查的文章就介紹到這了,更多相關mysql字符串末尾空白丟失的排查內容請搜索好吧啦網以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持好吧啦網!