python源文件的字符編碼知識點詳解
默認情況下,Python 源碼文件以 UTF-8 編碼方式處理。在這種編碼方式中,世界上大多數語言的字符都可以同時用于字符串字面值、變量或函數名稱以及注釋中——盡管標準庫中只用常規的 ASCII 字符作為變量或函數名,而且任何可移植的代碼都應該遵守此約定。要正確顯示這些字符,你的編輯器必須能識別 UTF-8 編碼,而且必須使用能支持打開的文件中所有字符的字體。
1、如果不使用默認編碼,要聲明文件所使用的編碼,文件的第一行要寫成特殊的注釋。
語法如下所示:
# -*- coding: encoding -*-
其中 encoding 可以是 Python 支持的任意一種 codecs。
比如,要聲明使用 utf-8 編碼,你的源碼文件要寫成:
# -*- coding: utf-8 -*-
2、關于第一行規則的一種例外情況是,源碼以 UNIX 'shebang' 行開頭。這種情況下,編碼聲明就要寫在文件的第二行。
例如:
#!/usr/bin/env python3# -*- coding: utf-8 -*-
知識點擴展:
編碼的定義
我們從“SOS“(國際通用求助信號)開始,它的摩斯密碼的編碼是:
“…---…”,想一下為什么選用S、O、S來作為求救信號?因為它簡單,容易辨別且不容易發錯呀!那么,字符編碼就是:
´給定一系列字符,對每個字符賦予一個數值,用數值來代表對應的字符,這一數值就是字符的編碼。例如,我們給字符’A’賦予數值0x41,則0x41就是字符’A’的編碼。字符編碼是字符的表現、儲存方式。
字符編碼需要處理兩件事
(1)規定一個字符集中的字符由多少個字節表示;
(2)制定該字符集的字符編碼表,即該字符集中每個字符對應的(二進制)值。
到此這篇關于python源文件的字符編碼知識點詳解的文章就介紹到這了,更多相關python源文件的字符編碼內容請搜索好吧啦網以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持好吧啦網!
相關文章: