Windows 2000內(nèi)存篇 分頁機(jī)制介紹(一)
基本概念
Windows 2000 使用基于分頁機(jī)制的虛擬內(nèi)存。每個進(jìn)程有4GB的虛擬地址空間。基于分頁機(jī)制,這4GB地址空間的一些部分被映射了物理內(nèi)存,一些部分映射硬盤上的交換文件,一些部分什么也沒有映射。程序中使用的都是4GB地址空間中的虛擬地址。而訪問物理內(nèi)存,需要使用物理地址。
下面我們看看什么是物理地址,什么是虛擬地址。
物理地址 (physical address): 放在尋址總線上的地址。放在尋址總線上,如果是讀,電路根據(jù)這個地址每位的值就將相應(yīng)地址的物理內(nèi)存中的數(shù)據(jù)放到數(shù)據(jù)總線中傳輸。如果是寫,電路根據(jù)這個地址每位的值就將相應(yīng)地址的物理內(nèi)存中放入數(shù)據(jù)總線上的內(nèi)容。物理內(nèi)存是以字節(jié)(8位)為單位編址的。
虛擬地址 (virtual address): 4G虛擬地址空間中的地址,程序中使用的都是虛擬地址。
如果CPU寄存器中的分頁標(biāo)志位被設(shè)置,那么執(zhí)行內(nèi)存操作的機(jī)器指令時,CPU會自動根據(jù)頁目錄和頁表中的信息,把虛擬地址轉(zhuǎn)換成物理地址,完成該指令。比如 mov eax,004227b8h ,這是把地址004227b8h處的值賦給寄存器的匯編代碼,004227b8這個地址就是虛擬址。CPU在執(zhí)行這行代碼時,發(fā)現(xiàn)寄存器中的分頁標(biāo)志位已經(jīng)被設(shè)定,就自動完成虛擬地址到物理地址的轉(zhuǎn)換,使用物理地址取出值,完成指令。對于Intel CPU 來說,分頁標(biāo)志位是寄存器CR0的第31位,為1表示使用分頁,為0表示不使用分頁。對于初始化之后的 Win2k 我們觀察CR0 ,發(fā)現(xiàn)第31位為1。表明Win2k是使用分頁的。
使用了分頁機(jī)制之后,4G的地址空間被分成了固定大小的頁,每一頁或者被映射到物理內(nèi)存,或者被映射到硬盤上的交換文件中,或者沒有映射任何東西。對于一般程序來說,4G的地址空間,只有一小部分映射了物理內(nèi)存,大片大片的部分是沒有映射任何東西。物理內(nèi)存也被分頁,來映射地址空間。對于32bit的Win2k,頁的大小是4K字節(jié)。CPU用來把虛擬地址轉(zhuǎn)換成物理地址的信息存放在叫做頁目錄和頁表的結(jié)構(gòu)里。
物理內(nèi)存分頁,一個物理頁的大小為4K字節(jié),第0個物理頁從物理地址 0x00000000 處開始。由于頁的大小為4KB,就是0x1000字節(jié),所以第1頁從物理地址 0x00001000處開始。第2頁從物理地址0x00002000處開始。可以看到由于頁的大小是4KB,所以只需要32bit的地址中高20bit來尋址物理頁。
頁表,一個頁表的大小為4K字節(jié),放在一個物理頁中。由1024個4字節(jié)的頁表項(xiàng)組成。頁表項(xiàng)的大小為4個字節(jié)(32bit),所以一個頁表中有1024個頁表項(xiàng)。頁表中的每一項(xiàng)的內(nèi)容(每項(xiàng)4個字節(jié),32bit)高20bit用來放一個物理頁的物理地址,低12bit放著一些標(biāo)志。
頁目錄,一個頁目錄大小為4K字節(jié),放在一個物理頁中。由1024個4字節(jié)的頁目錄項(xiàng)組成。頁目錄項(xiàng)的大小為4個字節(jié)(32bit),所以一個頁目錄中有1024個頁目錄項(xiàng)。頁目錄中的每一項(xiàng)的內(nèi)容(每項(xiàng)4個字節(jié))高20bit用來放一個頁表(頁表放在一個物理頁中)的物理地址,低12bit放著一些標(biāo)志。
對于x86系統(tǒng),頁目錄的物理地址放在CPU的CR3寄存器中。
CPU把虛擬地址轉(zhuǎn)換成物理地址:
一個虛擬地址,大小4個字節(jié)(32bit),包含著找到物理地址的信息,分為3個部分:第22位到第31位這10位(最高10位)是頁目錄中的索引,第12位到第21位這10位是頁表中的索引,第0位到第11位這12位(低12位)是頁內(nèi)偏移。對于一個要轉(zhuǎn)換成物理地址的虛擬地址,CPU首先根據(jù)CR3中的值,找到頁目錄所在的物理頁。然后根據(jù)虛擬地址的第22位到第31位這10位(最高的10bit)的值作為索引,找到相應(yīng)的頁目錄項(xiàng)(PDE,page Directory entry),頁目錄項(xiàng)中有這個虛擬地址所對應(yīng)頁表的物理地址。有了頁表的物理地址,根據(jù)虛擬地址的第12位到第21位這10位的值作為索引,找到該頁表中相應(yīng)的頁表項(xiàng)(PTE,page table entry),頁表項(xiàng)中就有這個虛擬地址所對應(yīng)物理頁的物理地址。最后用虛擬地址的最低12位,也就是頁內(nèi)偏移,加上這個物理頁的物理地址,就得到了該虛擬地址所對應(yīng)的物理地址。
一個頁目錄有1024項(xiàng),虛擬地址最高的10bit剛好可以索引1024項(xiàng)(2的10次方等于1024)。一個頁表也有1024項(xiàng),虛擬地址中間部分的10bit,剛好索引1024項(xiàng)。虛擬地址最低的12bit(2的12次方等于4096),作為頁內(nèi)偏移,剛好可以索引4KB,也就是一個物理頁中的每個字節(jié)。
一個虛擬地址轉(zhuǎn)換成物理地址的計(jì)算過程就是,處理器通過CR3找到當(dāng)前頁目錄所在物理頁,取虛擬地址的高10bit,然后把這10bit右移2bit(因?yàn)槊總€頁目錄項(xiàng)4個字節(jié)長,右移2bit相當(dāng)于乘4)得到在該頁中的地址,取出該地址處PDE(4個字節(jié)),就找到了該虛擬地址對應(yīng)頁表所在物理頁,取虛擬地址第12位到第21位這10位,然后把這10bit右移2bit(因?yàn)槊總€頁表項(xiàng)4個字節(jié)長,右移2bit相當(dāng)于乘4)得到在該頁中的地址,取出該地址處的PTE(4個字節(jié)),就找到了該虛擬地址對應(yīng)物理頁的地址,最后加上12bit的頁內(nèi)偏移得到了物理地址。
32bit的一個指針,可以尋址范圍0x00000000-0xFFFFFFFF,4GB大小。也就是說一個32bit的指針可以尋址整個4GB地址空間的每一個字節(jié)。一個頁表項(xiàng)負(fù)責(zé)4K的地址空間和物理內(nèi)存的映射,一個頁表1024項(xiàng),也就是負(fù)責(zé)1024*4k=4M的地址空間的映射。一個頁目錄項(xiàng),對應(yīng)一個頁表。一個頁目錄有1024項(xiàng),也就對應(yīng)著1024個頁表,每個頁表負(fù)責(zé)4M地址空間的映射。1024個頁表負(fù)責(zé)1024*4M=4G的地址空間映射。一個進(jìn)程有一個頁目錄。所以以頁為單位,頁目錄和頁表可以保證4G的地址空間中的每頁和物理內(nèi)存的映射。
每個進(jìn)程都有自己的4G地址空間,從0x00000000-0xFFFFFFFF。通過每個進(jìn)程自己的一套頁目錄和頁表來實(shí)現(xiàn)。由于每個進(jìn)程有自己的頁目錄和頁表,所以每個進(jìn)程的地址空間映射的物理內(nèi)存是不一樣的。兩個進(jìn)程的同一個虛擬地址處(如果都有物理內(nèi)存映射)的值一般是不同的,因?yàn)樗麄兺鶎?yīng)不同的物理頁。
4G地址空間中低2G,0x00000000-0x7FFFFFFF是用戶地址空間,4G地址空間中高2G,0x80000000-0xFFFFFFFF 是系統(tǒng)地址空間。訪問系統(tǒng)地址空間需要程序有ring0的權(quán)限。
