經(jīng)驗(yàn)總結(jié):SQL Server數(shù)據(jù)庫(kù)對(duì)上億表的操作
對(duì)上億的表進(jìn)行排序或者上億的表之間進(jìn)行join,會(huì)導(dǎo)致系統(tǒng)失去響應(yīng)。
◆1.我確實(shí)做了一個(gè)很大的查詢,涉及的數(shù)據(jù)表有兩億條記錄,而且有一個(gè)group by操作,造成CPU、內(nèi)存和磁盤(pán)開(kāi)銷均很大。后來(lái)和微軟的人重新實(shí)驗(yàn)了一下,我的查詢確實(shí)會(huì)造成系統(tǒng)反應(yīng)變慢。后來(lái)我們也實(shí)驗(yàn)了一下,在這個(gè)2億的表上統(tǒng)計(jì)一下行數(shù),即select count(*) from table1,用了1分鐘,內(nèi)存漲了5G左右,磁盤(pán)子系統(tǒng)負(fù)荷很大,CPU也突然提高。這說(shuō)明這種上億的表的操作會(huì)非常嚴(yán)重的降低效率。
◆2.整個(gè)服務(wù)器的磁盤(pán)分配是這樣的,網(wǎng)站訪問(wèn)的數(shù)據(jù)庫(kù)庫(kù)位于磁盤(pán)陣列中,而我們的統(tǒng)計(jì)臨時(shí)庫(kù)位于D盤(pán)中,C和D好像是一個(gè)磁盤(pán)組,也就相當(dāng)于是在C盤(pán)。我們的數(shù)據(jù)庫(kù)的大量磁盤(pán)I/O會(huì)導(dǎo)致系統(tǒng)的反應(yīng)變慢。因此當(dāng)我的查詢很大的時(shí)候,就會(huì)使服務(wù)器整個(gè)系統(tǒng)變慢。
◆3.數(shù)據(jù)庫(kù)的數(shù)據(jù)文件的自增長(zhǎng)方式為每次1024k,數(shù)據(jù)文件的空間已經(jīng)接近用光,而要發(fā)生增長(zhǎng),而增長(zhǎng)空間要求應(yīng)該比較大,所以就會(huì)不停的申請(qǐng)?jiān)鲩L(zhǎng),造成磁盤(pán)開(kāi)銷較大。
◆4.操作中涉及到delete操作,會(huì)形成大量的日志,而上周擴(kuò)容后,發(fā)現(xiàn)日志文件比以前縮小了,估計(jì)是重建了,昨天的操作會(huì)導(dǎo)致日志文件也要不斷增長(zhǎng),也會(huì)造成磁盤(pán)的負(fù)荷加大。
解決辦法:
針對(duì)一:
避免大表操作,所有的操作均可以按省或者時(shí)間分開(kāi),這樣無(wú)論從時(shí)間或者地域維度,基本上可以將大表拆成30張以上的小表操作,甚至更多。然后再對(duì)結(jié)果進(jìn)行合并,應(yīng)該可以避免上述問(wèn)題。
針對(duì)二:
無(wú)解決方案,只是建議將我們的數(shù)據(jù)庫(kù)也單獨(dú)分到一組磁盤(pán)上去,不要跟系統(tǒng)競(jìng)爭(zhēng)。
針對(duì)三:
及時(shí)刪除無(wú)用的臨時(shí)數(shù)據(jù),保障數(shù)據(jù)庫(kù)空間,同時(shí)也可以做上空間監(jiān)控,一旦數(shù)據(jù)文件空間發(fā)生增長(zhǎng)時(shí),給DBA一個(gè)預(yù)警郵件,我們收到郵件后可以立即做相應(yīng)處理。
針對(duì)四:
日志文件目前已經(jīng)漲得較大,我們執(zhí)行一下截?cái)嗳罩镜膭?dòng)作,將日志文件的空間使用保持在一個(gè)較低水平。
