python小白,問一個關于可變類型和不可變類型底層的問題
問題描述
第一段代碼:
a = 'hello' #定義一個字符串的變量print(id(a)) #第一次的地址print(a) #a = helloa = a.upper() # 單純的a.upper() 執行過后,無法存儲到a本身,必須得重新賦值給a 換句話說,a在被upper之后,重新指向了一個新的地址print(id(a)) #第二次的地址print(a)
第一段代碼執行結果:
第二段代碼:
b = [11,22,33,44,55] #定義一個列表的變量print(id(b)) #第一次的地址print(b) #b = [11,22,33,44,55]b.append(99) #單純的b.append()執行過后,不需要存儲到b,因為b已經被更改print(id(b)) #檢查第一次的地址print(b) #發現在第一次地址當中,b已經改變#b = b.append(99) #如果將修改b這個行為賦值到b#print(id(b)) #檢查地址,發現已經變更#print(b) #檢查b的值,發現已經變更。b的值為none 因為b.append(99)本身的返回值為none#[***列表為可修改變量,因此修改完之后,地址跟原來的一樣。反而是如果像修改字符串那樣重新賦值,變得不可行。原因在于append語句本身并不返回值。***]#字符串賦值之后放在內存一個地址,這個地址上面的字符串是無法更改的,只能重新做一個新的字符串,然后改變變量的指向位置。#而列表賦值之后存在一個內存的地址,這個列表里面的值是可以直接修改的。不需要重新做一個新的列表,然后改變變量的指向位置。
第二段代碼執行結果:
在學python的過程當中被告知,字符串是屬于不可變類型,列表屬于可變類型。也就是說,如果我要改字符串,我其實是重新做了一個新的字符串,放在內存的新的地址中,原來的地方那個字符串還是原來的老樣子。如第一段代碼所示。而列表不一樣,列表可以在原來的內存地址上直接修改。如第二段代碼所示。我的問題:可變類型和不可變類型的根本區別在哪里?為什么會出現這種區別?為什么第一段代碼里,a要想改變,必須改變地址,第二段代碼里b可以不變地址的情況下直接修改列表的值。這里面的底層邏輯是什么?我猜想,是不是意味著列表這個東西本身,也其實是某一個一堆值得集合體,它僅僅只是反映了一個集合體本身,把一堆值指向了這一個地方而已,所以才是可以修改的?不知道我表達有沒有清楚。我只是對這個東西很好奇,也就是說,追根究底列表到底是個什么東西,為什么他是可以直接改的?而字符串沒法改。往再底層深入之后,他們倆到底是啥?
問題解答
回答1:其實對象可變不可變, 對py, 都是內部實現的問題, 如果我修改相應的方法, 將其寫回到本身, 這樣也能模仿出可變的現象, 就小小類似tuple和list的關系,既然想了解底層, 那就直接看源碼吧:這是字符串的upper()
static PyObject *string_upper(PyStringObject *self){ char *s; Py_ssize_t i, n = PyString_GET_SIZE(self); # 取出字符串對象中字符串的長度 PyObject *newobj; newobj = PyString_FromStringAndSize(NULL, n); # 可以理解成申請內存空間 if (!newobj)return NULL; s = PyString_AS_STRING(newobj); # 從newobj對象取出具體字符串指針 Py_MEMCPY(s, PyString_AS_STRING(self), n); # 拷貝舊的字符串 for (i = 0; i < n; i++) {int c = Py_CHARMASK(s[i]);if (islower(c)) s[i] = _toupper(c); # 修改對應指針位置上的內容 } return newobj; # 返回新字符串對象 (區分字符串對象和里面字符串的指針)}
這是列表的append
intPyList_Append(PyObject *op, PyObject *newitem){ if (PyList_Check(op) && (newitem != NULL))return app1((PyListObject *)op, newitem); PyErr_BadInternalCall(); return -1;}static intapp1(PyListObject *self, PyObject *v){ Py_ssize_t n = PyList_GET_SIZE(self); assert (v != NULL); if (n == PY_SSIZE_T_MAX) {PyErr_SetString(PyExc_OverflowError, 'cannot add more objects to list');return -1; } if (list_resize(self, n+1) == -1)return -1; Py_INCREF(v); PyList_SET_ITEM(self, n, v); # 因為列表是頭和和成員分開的, 所以直接將新成員追加在原來的成員數組后面, 長度變化通過resize實現 return 0;}回答2:
python字符串有cache的,如果兩個相同的字符串在不同的變量a,b,他們的id(a), id(b)是一樣的.但如果當a, b的引用為0是,就會自動銷毀對象.
樓主的例子:
a = a.upper()
a的變量內容已經變化,不一樣了,舊的內容沒有了引用,垃圾回收銷毀對象.b是列表,是可變的,可以再申請內存.同時,b有內容引用,不會被銷毀.
回答3:往再底層深入,就去看python的C源碼唄~
可不可變,是python語言規定的。
不可變類型 沒有提供修改對象自身的方法,而 可變類型 提供了這些方法。就這些差別,沒啥神秘的。
回答4:從硬件角度說,提供給用戶的接口是按照規定設定好的,操作內存就是固定的方式,不存在可變和不可變。往上,就是操作系統層,對硬件api進行了大量的封裝,使用戶操作變得豐富,對于python解釋器是使用c語言編寫的,使用python時只是使用了python的語用,編寫代碼,然后交給解釋器去執行.在上面的前提下,來解釋當前問題,python的可變和不可變是python創建者規定的,實現這些規定的方式可能就是調用了不同的底層api,或者是不同底層api相互組合來實現的。將這些規定以python語用的形式提供給用戶使用,最后還是編譯成0,1去讓計算機執行。對于用戶來說,可變和不可變對象是語言提供的一個特性,可以完成一些功能,但是對于計算機其實是沒區別的。
相關文章:
