C語言字符串轉換為Python字符串的方法
問題
怎樣將C中的字符串轉換為Python字節或一個字符串對象?
解決方案
C字符串使用一對 char * 和 int 來表示, 你需要決定字符串到底是用一個原始字節字符串還是一個Unicode字符串來表示。 字節對象可以像下面這樣使用 Py_BuildValue() 來構建:
char *s; /* Pointer to C string data */int len; /* Length of data *//* Make a bytes object */PyObject *obj = Py_BuildValue('y#', s, len);
如果你要創建一個Unicode字符串,并且你知道 s 指向了UTF-8編碼的數據,可以使用下面的方式:
PyObject *obj = Py_BuildValue('s#', s, len);
如果 s 使用其他編碼方式,那么可以像下面使用 PyUnicode_Decode() 來構建一個字符串:
PyObject *obj = PyUnicode_Decode(s, len, 'encoding', 'errors');/* Examples /*obj = PyUnicode_Decode(s, len, 'latin-1', 'strict');obj = PyUnicode_Decode(s, len, 'ascii', 'ignore');
如果你恰好有一個用 wchar_t *, len 對表示的寬字符串, 有幾種選擇性。首先你可以使用 Py_BuildValue() :
wchar_t *w; /* Wide character string */int len; /* Length */PyObject *obj = Py_BuildValue('u#', w, len);
另外,你還可以使用 PyUnicode_FromWideChar() :
PyObject *obj = PyUnicode_FromWideChar(w, len);
對于寬字符串,并沒有對字符數據進行解析——它被假定是原始Unicode編碼指針,可以被直接轉換成Python。
討論
將C中的字符串轉換為Python字符串遵循和I/O同樣的原則。 也就是說,來自C中的數據必須根據一些解碼器被顯式的解碼為一個字符串。 通常編碼格式包括ASCII、Latin-1和UTF-8. 如果你并不確定編碼方式或者數據是二進制的,你最好將字符串編碼成字節。 當構造一個對象的時候,Python通常會復制你提供的字符串數據。 如果有必要的話,你需要在后面去釋放C字符串。 同時,為了讓程序更加健壯,你應該同時使用一個指針和一個大小值, 而不是依賴NULL結尾數據來創建字符串。
以上就是C語言字符串轉換為Python字符串的方法的詳細內容,更多關于C語言字符串轉換為Python字符串的資料請關注好吧啦網其它相關文章!
相關文章:
