文章詳情頁

MySQL Group by的優化詳解

瀏覽：19日期：2023-10-05 09:58:31

一個標準的 Group by 語句包含排序、分組、聚合函數，比如 select a,count(*) from t group by a ; 這個語句默認使用 a 進行排序。如果 a 列沒有索引，那么就會創建臨時表來統計 a和 count(*)，然后再通過 sort_buffer 按 a 進行排序。

標準的執行流程

結構：

create table t1(id int primary key, a int, b int, index(a));delimiter ;;create procedure idata()begin declare i int; set i=1; while(i<=1000)do insert into t1 values(i, i, i); set i=i+1; end while;end;;delimiter ;call idata();

函數就是向 t1 中插入1000條語句，從(1,1,1) 到(1000,1000,1000)。

執行 select id%10 as m, count(*) as c from t1 group by m;

解析：

MySQL Group by的優化詳解

Using index，表示這個語句使用了覆蓋索引，選擇了索引 a，不需要回表；Using temporary，表示使用了臨時表；Using filesort，表示需要排序。

過程：

1、創建內存臨時表，表里有兩個字段 m 和 c，主鍵是 m；2、掃描表 t1 的索引 a，依次取出葉子節點上的 id 值，計算 id%10 的結果，記為 x；1）如果臨時表中沒有主鍵為 x 的行，就插入一個記錄 (x,1);2）如果表中有主鍵為 x 的行，就將 x 這一行的 c 值加 1；

第2 步如果發現內存臨時表存儲的總字段長度到達參數 tmp_table_size 設置的大小，那么就會將內存臨時表升級為磁盤臨時表，然后重新開始遍歷計算。3、遍歷完成后，再根據字段 m 做排序，得到結果集返回給客戶端。

MySQL Group by的優化詳解

最后的排序就是下圖虛線框中的操作，如果 sort_buffer 設置的大小不夠大，那么就會使用臨時表來輔助排序。

MySQL Group by的優化詳解

優化

未優化（也就是分組列沒有索引）的 group by 的總過程可以概括為：因為數據是無序的，所以需要創建臨時表，然后一個一個判斷屬于哪個分組，最后再根據分組列進行排序。所以，優化可以有兩個思路：

去掉排序

在明確返回的數據不需要排序的情況下，可以禁止排序，也就是將上面的語句改成 select a,count(*) from t group by a order by null。

順序排列

如果記錄都按照排序字段排序，那么數據就變成了下面的結構：

MySQL Group by的優化詳解

這樣在實際獲取要返回的字段或計算聚合函數時，只需要按順序依次訪問，等到列值變成下一個就知道當前組訪問結束，將之前統計的數據直接返回。這樣就避免了創建臨時表，同時排序也不需要使用 sort_buffer 進行額外排序。這樣就極大地提高了執行的效率。

實現

1、如果分組字段適合創建索引就直接為分組字段創建索引。

MySQL 5.7 版本支持了 generated column 機制，用來實現列數據的關聯更新。你可以用下面的方法創建一個列 z，然后在 z 列上創建一個索引（如果是 MySQL 5.6 及之前的版本，你也可以創建普通列和索引，來解決這個問題）

alter table t1 add column z int generated always as(id % 100), add index(z);

然后解析：

MySQL Group by的優化詳解

這時沒有用到臨時表和額外排序，所以性能提升。

2、如果分組字段不適合（使用率很低），那么可以使用 SQL_BIG_RESULT 來嘗試優化。

在 group by 語句中加入 SQL_BIG_RESULT 這個提示（hint），就可以告訴優化器：這個語句涉及的數據量很大，請直接用磁盤臨時表。MySQL 的優化器一看，磁盤臨時表是 B+ 樹存儲，存儲效率不如數組來得高。所以，既然使用SQL_BIG_RESULT來說明數據量很大，那從磁盤空間考慮，還是直接用數組來存吧。所以在使用 SQL_BIG_RESULT 后優化器會使用數組結構的磁盤臨時表。

但是如果在未達到磁盤臨時表的使用條件是不會使用磁盤臨時表的，也就是在 sort_buffer 空間能夠存儲要返回和排序的總字段長度時，就使用數組結構的 sort_buffer ，如果總字段超過 sort_buffer 大小，那么就再加上數組結構的磁盤臨時表來幫助排序。

那么在 sort_buffer 空間足夠的情況下， sort_buffer 內部就會對數據進行排序，這樣也就起到了索引的作用，

還是以上面的例子來看，使用 SQL_BIG_RESULT

alter table t1 add column z int generated always as(id % 100), add index(z);

具體過程如下：

1、初始化 sort_buffer，確定放入一個整型字段，記為 m；2、掃描表 t1 的索引 a，依次取出里面的 id 值, 將 id%10 的值存入 sort_buffer 中；3、掃描完成后，對 sort_buffer 的字段 m 做排序（如果 sort_buffer 內存不夠用，就會利用磁盤臨時文件輔助排序）；4、排序完成后，就得到了一個有序數組。

MySQL Group by的優化詳解

解析：

MySQL Group by的優化詳解

可以看到此時就沒有使用臨時表了，而是直接使用 sort_buffer 進行排序，這樣就省去了使用臨時表帶來的性能消耗。

總結

1、如果對 group by 語句的結果沒有排序要求，要在語句后面加 order by null；那么一般情況就不需要使用臨時表了（上面兩個優化都是在要求排序的前提下提出的優化方式）2、盡量讓 group by 過程用上表的索引，確認方法是 explain 結果里沒有 Using temporary 和 Using filesort；3、如果 group by 需要統計的數據量不大，盡量只使用內存臨時表；也可以通過適當調大 tmp_table_size 參數，來避免用到磁盤臨時表；4、如果數據量實在太大，使用 SQL_BIG_RESULT 這個提示，來告訴優化器直接使用排序算法得到 group by 的結果。

以上就是詳解MySQL Group by 優化的詳細內容，更多關于MySQL Group by 優化的資料請關注好吧啦網其它相關文章！

上一條：Mysql 索引該如何設計與優化下一條：詳解MySQL kill 指令的執行原理

相關文章：

1. MySQL 字符串函數：字符串截取2. Microsoft Office Access修改代碼字體大小的方法3. Mysql 用戶權限管理實現4. MySQL中InnoDB和MyISAM類型的差別5. MySQL 8.0 之索引跳躍掃描(Index Skip Scan)6. 恢復從 Access 2000、 Access 2002 或 Access 2003 中數據庫刪除表的方法7. Mysql入門系列：安排預防性的維護MYSQL數據庫服務器8. mysql數據存放的位置在哪9. SQLServer的內存管理架構詳解10. 在SQL Server中用XQuery分解XML數據

排行榜

					
					MySQL 字符串函數：字符串截取
Mysql入門系列：安排預防性的維護MYSQL數據庫服務器
MySQL中InnoDB和MyISAM類型的差別
Mysql 用戶權限管理實現
mysql數據存放的位置在哪
Microsoft Office Access修改代碼字體大小的方法
恢復從 Access 2000、 Access 2002 或 Access 2003 中數據庫刪除表的方法
MySQL 8.0 之索引跳躍掃描(Index Skip Scan)
在SQL Server中用XQuery分解XML數據
MySQL存儲過程例子（包含事務、參數、嵌套調用、游標循環等）
Mysql入門系列：MYSQL客戶機程序2—增加錯誤檢查
				

熱門標簽

亚洲精品久久久中文字幕-亚洲精品久久片久久-亚洲精品久久青草-亚洲精品久久婷婷爱久久婷婷-亚洲精品久久午夜香蕉

MySQL Group by的優化詳解